「AmazonショッピングがAmazon Rekognitionコンテンツモデレーションを使用して商品レビューの有害な画像を確認する方法」

AmazonショッピングはAmazon Rekognitionコンテンツモデレーションを使用して有害な画像を確認する方法

お客様は、キッチンタオルのような日常品から車の購入などの重要な購入において、情報を得るために商品レビューにますます頼っています。これらのレビューは、他のお客様の意見や経験にアクセスすることができる貴重な情報源に変わりました。その結果、商品レビューは店舗の重要な要素となり、購入の判断に役立つ貴重なフィードバックや洞察を提供しています。

Amazonは、数億点の商品が揃う最大のストアの一つです。2022年には、1億2,500万人の顧客がAmazonのストアに約15億件のレビューや評価を投稿し、オンラインレビューは顧客にとって信頼できるフィードバックのソースとなっています。毎月投稿される商品レビューの規模では、これらのレビューがAmazonのコミュニティガイドラインに準拠していることを確認することが重要です。これは、商品に関する正確な情報を顧客に提供し、不適切な言葉、攻撃的なイメージ、または個人やコミュニティに対するヘイトスピーチなどを含まないようにするために行われています。これらのガイドラインを遵守することで、Amazonは安全で包括的な環境をすべての顧客に提供することができます。

コンテンツのモデレーション自動化により、Amazonはプロセスを拡大しながら高い精度を維持することができます。テキスト、画像、ビデオに対して異なるテクニックが必要な複雑な問題領域です。画像は商品レビューの重要な要素であり、テキストよりも顧客により即効性のある影響を与えることが多いです。Amazon Rekognitionコンテンツモデレーションを使用することで、Amazonはより高い精度で商品レビューの中の有害な画像を自動的に検出し、人間のレビューアによるモデレーションへの依存を減らすことができます。Rekognitionコンテンツモデレーションは、人間のモデレーターの福祉を向上させ、著しいコスト削減を実現しました。

自己ホストの機械学習モデルを使用したモデレーション

Amazonのショッピングチームは、機械学習(ML)をヒューマンインザループ(HITL)レビューと組み合わせて、商品レビューが顧客の製品の体験に関するものであり、不適切なまたは有害なコンテンツを含まないように、コミュニティガイドラインに従っているかを確認するモデレーションシステムを設計・実装しました。以下の図に示すように、画像モデレーションのサブシステムでは、複数の自己ホストおよび自己トレーニングされたコンピュータビジョンモデルを使用して、Amazonのガイドラインに違反する画像を検出しています。決定ハンドラは、MLモデルの出力に基づいてモデレーションアクションを決定し、その決定の理由を提供し、画像が人間のモデレーターによるさらなるレビューを必要とするか、自動的に承認または拒否されるかを決定します。

これらの自己ホストのMLモデルを使用することで、チームはレビューの一部として受け取った画像の40%の決定を自動化し、年々ソリューションを改善するために取り組んできましたが、いくつかの課題に直面しています:

  • 自動化率の向上のための継続的な取り組み – チームはMLアルゴリズムの精度を向上させ、自動化率を高めることを望んでいます。これには、データラベリング、データサイエンス、モデルのトレーニングと展開のためのMLOpsへの継続的な投資が必要です。
  • システムの複雑さ – アーキテクチャの複雑さには、MLOpsへの投資が必要です。これにより、MLの推論プロセスが効率的にスケーリングされ、成長するコンテンツの提出トラフィックに対応できます。

RekognitionコンテンツモデレーションAPIで自己ホストのMLモデルを置換する

Amazon Rekognitionは、画像およびビデオのモデレーションのためのAPIインターフェースを通じて、事前トレーニングされたモデルを提供するマネージドAIサービスです。これは、ECサイト、ソーシャルメディア、ゲーム、オンラインデートアプリなどのさまざまな業界で、ユーザーが生成したコンテンツ(UGC)のモデレーションに広く採用されています。これには、商品レビューやユーザープロファイル、ソーシャルメディア投稿など、さまざまなコンテンツタイプが含まれます。

Rekognitionコンテンツモデレーションは、MLの経験を必要とせずに画像とビデオのモデレーションワークフローを自動化し、効率的に不適切なコンテンツや望ましくないコンテンツを検出することができます。Amazon Rekognitionの顧客は、完全管理されたAPIとカスタマイズ可能なモデレーションルールを使用して、数百万の画像とビデオを処理し、ユーザーの安全性とビジネスのコンプライアンスを確保することができます。

チームは、ヌードや仕事に適さない(NSFW)コンテンツの検出のための自己管理型MLモデルの一部をAmazon Rekognition Detect Moderation APIに移行し、高精度で包括的な事前トレーニング済みのモデレーションモデルを活用しました。Amazon Rekognitionの高い精度により、チームはより多くの決定を自動化し、コストを節約し、システムアーキテクチャを簡素化することができました。

高い精度と拡張されたモデレーションカテゴリ

Amazon Rekognition画像モデレーションAPIの実装により、不適切なコンテンツの検出精度が向上しました。これにより、年間約100万枚の画像が追加で自動的にモデレートされ、人間のレビューは不要です。

運用の優れた効率

Amazonショッピングチームは、システムアーキテクチャをシンプル化することで、システムの管理と保守に必要な運用作業を削減することができました。このアプローチにより、1年間のDevOps作業を数ヶ月間節約することができ、革新的な機能の開発に時間を割くことができるようになりました。

コスト削減

Rekognitionコンテンツモデレーションの高い精度により、チームは人間のレビューに送る画像の数を減らすことができました。これには、不適切なコンテンツも含まれます。これにより、人間によるモデレーションに関連するコストが削減され、モデレーターは高付加価値のビジネスタスクに集中することができるようになりました。DevOpsの効率向上と組み合わせることで、Amazonショッピングチームは大幅なコスト削減を実現しました。

結論

製品レビューモデレーションのための自己ホスト型MLモデルからAmazon RekognitionモデレーションAPIへの移行は、多くの利点をもたらします。コンテンツのモデレーションプロセスを自動化することで、オンラインストアは大量の製品レビューを迅速かつ正確にモデレートすることができ、不適切なコンテンツやスパムコンテンツを迅速に削除することで顧客体験を向上させることができます。さらに、Amazon RekognitionモデレーションAPIのようなマネージドサービスを使用することで、企業は独自のモデルを開発・維持するために必要な時間とリソースを削減することができます。これは特に技術的なリソースに限りがある企業にとって有用です。APIの柔軟性により、オンラインストアは独自のモデレーションルールと閾値をカスタマイズして、特定のニーズに合わせることも可能です。

AWS上でのコンテンツモデレーションやコンテンツモデレーションMLのユースケースについて詳しくは、ご覧ください。AWSを使用してコンテンツモデレーションの運用を効率化するための第一歩を踏み出しましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

このAI論文は、それぞれの手のモデルに基づいてアバター間で手のモーションの意味を転送することを目指しています

さまざまな仮想アバターの文脈において、共同話話や手話合成を含む様々なバーチャルアバターのコンテキストで、現実的な手の...

AIニュース

「マイクロソフト、『極めて無責任』なセキュリティ対策で厳しい批判を受ける」

エクスプロイトと脆弱性の重みに押し潰されるカードのように、Azureは崩壊しているように見えます

AI研究

「CMUの研究者たちは、シンプルで効果的な攻撃手法を提案しましたこれにより、言語モデルが高い成功率で問題のある行動を生成することが可能となります」

大規模言語モデル(LLM)は、人間の言語で作業するための深層学習モデルの最近の進歩です。これらの深層学習トレーニングモデ...

機械学習

Google AIは、アクティブノイズキャンセリング(ANC)ヘッドフォンのための人工知能搭載の革新的な心臓モニタリングモダリティである音響脈波計(APG)を導入します

コンシューマーエレクトロニクスと健康技術の分野において、活発なノイズキャンセリング(ANC)ウェアラブルに健康モニタリン...

人工知能

クロードAIに無料でアクセスする3つの方法

定期購読料なしで、主要な対話型AIモデルの1つを体験してください

データサイエンス

GoogleのAI研究者がMADLAD-400を紹介:419の言語をカバーする2.8TトークンWebドメインデータセット

自然言語処理(NLP)の常に進化する分野では、機械翻訳や言語モデルの開発は主に英語などの豊富なトレーニングデータセットの...