なぜ包括的な画像セットが私たちにより良い製品作りを助けるのか
包括的な画像セットの助け
私たちは、さまざまな方法で製品をより包括的にすることに取り組んでいます。その中でも最も大きな課題の一つは、代表的なデータを見つけて使用することです。私たちは、Google製品を利用するすべての人々の経験とニーズ、特に歴史的に排除されてきた背景を持つ人々を反映したいと考えています。
多様で代表的なデータを使用しない製品は、誰にとっても役立たなくなる可能性があります。そのため、私たちはより包括的なデータセットを使用して、いくつかの初期の機械学習モデルを再トレーニングしています。これらのデータセットは、私たちのハードウェアとソフトウェア製品を構築するために使用するデータのセットです。
特に、写真を撮影したり、電話で顔認証を使用したりするようなカメラに依存する製品にとって、これは特に重要です。私たちは、より包括的なデータセットを使用して、Google PixelのReal Toneを作成しました。これにより、全てのユーザーにとって肌の色を忠実かつ美しく表現することができます。
過去2年間、私たちのチームは、責任あるイノベーションチームの同僚と協力して、肌の色を正確かつ美しく捉えることの重要性を示すために、写真素材会社TONLと協力しました。彼らは、歴史的に排除されてきた背景を持つ人々の数千枚の画像を提供するために私たちと協力しました。私たちは、ジェンダースペクトラムを横断したモデルの写真、より濃い肌のトーンを持つモデルの写真、そして障害を持つモデルの写真(およびこれらのアイデンティティの交差点を表す人々)を含めることを目指しました。このプロジェクトは、現在、慢性的な状態や障害を持つ個人を特集し、中心に据えたカスタム画像を提供するためにChroniconとRAMPDとの協力を含めて展開されています。
Googleは、これらの画像データセットを使用して、製品チームが開発している機械学習モデルにおける公平性の課題を特定するのに役立てています。私たちは、すべてのユーザーに対して最も包括的で公正なテクノロジーを構築するために、データセットの表現をさらに向上させることを心待ちにしています。
Googleの責任あるAIチームであるGoogle Skin Tone Teamは、TONLと協力してMonk Skin Tone Examples(MST-E)データセットをキュレーションしました。このデータセットには、10段階のMonk Skin Tone(MST)スケールにまたがる19人の例示が含まれています。このデータセットには、さまざまなポーズや照明条件で撮影された人々の画像や、マスクや眼鏡などのアクセサリーを身に着けている場合といない場合の画像、さらにはビデオが含まれています。人々が肌の色を分類する方法は主観的であるため、Dr. Monkはデータセットに登場する人々の画像に自ら注釈を付けました。このデータセットが、実践者がさまざまな条件(明るい照明と暗い照明など)で一貫した肌のトーンの注釈をテストする方法を人間の注釈者に教えるのに役立つことを願っています。結果として、AIによる製品がすべての肌の色の人々にとってより良い動作をするのに役立ちます。
これらのプロジェクトを通じて、私たちは機械学習モデル全体で肌の色の評価を改善するという目標に向けて取り組んでいます。詳細については、skintone.googleをご覧ください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles