なぜ包括的な画像セットが私たちにより良い製品作りを助けるのか

包括的な画像セットの助け

私たちは、さまざまな方法で製品をより包括的にすることに取り組んでいます。その中でも最も大きな課題の一つは、代表的なデータを見つけて使用することです。私たちは、Google製品を利用するすべての人々の経験とニーズ、特に歴史的に排除されてきた背景を持つ人々を反映したいと考えています。

多様で代表的なデータを使用しない製品は、誰にとっても役立たなくなる可能性があります。そのため、私たちはより包括的なデータセットを使用して、いくつかの初期の機械学習モデルを再トレーニングしています。これらのデータセットは、私たちのハードウェアとソフトウェア製品を構築するために使用するデータのセットです。

特に、写真を撮影したり、電話で顔認証を使用したりするようなカメラに依存する製品にとって、これは特に重要です。私たちは、より包括的なデータセットを使用して、Google PixelのReal Toneを作成しました。これにより、全てのユーザーにとって肌の色を忠実かつ美しく表現することができます。

過去2年間、私たちのチームは、責任あるイノベーションチームの同僚と協力して、肌の色を正確かつ美しく捉えることの重要性を示すために、写真素材会社TONLと協力しました。彼らは、歴史的に排除されてきた背景を持つ人々の数千枚の画像を提供するために私たちと協力しました。私たちは、ジェンダースペクトラムを横断したモデルの写真、より濃い肌のトーンを持つモデルの写真、そして障害を持つモデルの写真(およびこれらのアイデンティティの交差点を表す人々)を含めることを目指しました。このプロジェクトは、現在、慢性的な状態や障害を持つ個人を特集し、中心に据えたカスタム画像を提供するためにChroniconとRAMPDとの協力を含めて展開されています。

Googleは、これらの画像データセットを使用して、製品チームが開発している機械学習モデルにおける公平性の課題を特定するのに役立てています。私たちは、すべてのユーザーに対して最も包括的で公正なテクノロジーを構築するために、データセットの表現をさらに向上させることを心待ちにしています。

Googleの責任あるAIチームであるGoogle Skin Tone Teamは、TONLと協力してMonk Skin Tone Examples(MST-E)データセットをキュレーションしました。このデータセットには、10段階のMonk Skin Tone(MST)スケールにまたがる19人の例示が含まれています。このデータセットには、さまざまなポーズや照明条件で撮影された人々の画像や、マスクや眼鏡などのアクセサリーを身に着けている場合といない場合の画像、さらにはビデオが含まれています。人々が肌の色を分類する方法は主観的であるため、Dr. Monkはデータセットに登場する人々の画像に自ら注釈を付けました。このデータセットが、実践者がさまざまな条件(明るい照明と暗い照明など)で一貫した肌のトーンの注釈をテストする方法を人間の注釈者に教えるのに役立つことを願っています。結果として、AIによる製品がすべての肌の色の人々にとってより良い動作をするのに役立ちます。

これらのプロジェクトを通じて、私たちは機械学習モデル全体で肌の色の評価を改善するという目標に向けて取り組んでいます。詳細については、skintone.googleをご覧ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「15Rockの共同創業者兼CEO、ガウタム・バクシ氏によるインタビューシリーズ」

「ガウタム・バクシは、気候リスク管理とアドバイザリーサービスのグローバルリーダーである15Rockの共同創設者兼CEOですガウ...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

人工知能

アーティスの創設者兼CEO、ウィリアム・ウーによるインタビューシリーズ

ウィリアム・ウーは、Artisseの創設者兼CEOであり、ユーザーの好みに基づいて写真を精密に変更する技術を提供していますそれ...

データサイエンス

「Adam Ross Nelsonによる自信のあるデータサイエンスについて」

データサイエンスの中で新たな分野が現れ、研究内容が理解しにくい場合は、専門家や先駆者と話すのが最善です最近、私たちは...

人工知能

『DeepHowのCEO兼共同創業者、サム・ジェン氏によるインタビューシリーズ』

ディープハウのCEO兼共同創設者であるサム・ジェンは、著名な投資家から支持される急速に進化するスタートアップを率いていま...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...