リコグニションカスタムモデレーションの発表:データを使用して事前訓練されたリコグニションモデレーションモデルの精度を向上させます

「リコグニションカスタムモデレーションの発表:データを利用した事前訓練モデルの精度向上」

企業は、顧客が製品の画像を共有することを促すために、ユーザー生成の画像やビデオにますます頼っています。ソーシャルメディア企業がユーザー生成のビデオや画像を促進する一方で、ユーザーコンテンツをエンゲージメントに活用することは、強力な戦略です。ただし、このユーザー生成のコンテンツが自社のポリシーと一致し、ユーザーにとって安全なオンラインコミュニティを育むことは難しい場合があります。

多くの企業は現在、不適切なユーザー生成コンテンツを管理するために人間のモデレーターに頼るか、ユーザーの苦情に対応する形で対応しています。これらのアプローチは、品質やスピードの点で数百万枚の画像やビデオを効果的にモデレートすることができず、ユーザーエクスペリエンスの低下、スケールを実現するための高コスト、さらにはブランドの評判への潜在的な損害につながることがあります。

この記事では、Amazon Rekognition のカスタムモデレーション機能を使用して、事前トレーニングされたコンテンツモデレーションAPIの精度を向上させる方法について説明します。

Amazon Rekognitionにおけるコンテンツモデレーション

Amazon Rekognitionは、画像やビデオから情報や洞察を抽出するための事前トレーニングおよびカスタマイズ可能なコンピュータビジョン機能を提供するマネージド人工知能(AI)サービスです。その中でも、Amazon Rekognitionのコンテンツモデレーションは、画像やビデオの不適切なコンテンツを検出します。Amazon Rekognitionは、ヒエラルキカルなタクソノミーを使用して、違法または望ましくないコンテンツに10の上位モデレーションカテゴリ(暴力、露骨、アルコール、薬物など)と35の下位カテゴリのラベルを付けます。これにより、ECサイト、ソーシャルメディア、ゲームなど、さまざまな業界の顧客は、Amazon Rekognitionのコンテンツモデレーションを使用して、ブランドの評判を守り、安全なユーザーコミュニティを育成することができます。

Amazon Rekognitionを使用して画像とビデオのモデレーションを行うことで、ヒューマンモデレーターは通常、コンテンツモデレーションモデルにすでにフラグが付いた全体の数の1〜5%というずっと少ないセットのコンテンツをレビューする必要があります。これにより、企業はより価値のある活動に集中することができ、既存のコストの一部で包括的なモデレーションカバレッジを実現することができます。

Amazon Rekognitionカスタムモデレーションの紹介

カスタムモデレーション機能を使用して、Rekognitionモデレーションモデルの精度をビジネス固有のデータに対して向上させることができます。アノテーションされた画像を20枚以上使用して、カスタムアダプターを約1時間でトレーニングできます。これらのアダプターは、高い精度でトレーニングに使用される画像を検出するため、モデレーションモデルの機能を拡張します。この記事では、アルコールのモデレーションラベルの精度を向上させるために、安全な画像とアルコール飲料を含む画像のサンプルデータセットを使用します。

トレーニングされたアダプターの固有のIDは、既存のDetectModerationLabels API操作に提供され、このアダプターを使用して画像を処理することができます。各アダプターは、トレーニングに使用されたAWSアカウントのみが使用できるようになっており、トレーニングに使用されたデータがそのAWSアカウントで安全かつ安全に保たれます。カスタムモデレーション機能により、機械学習(ML)の専門知識は必要とせず、特定のモデレーションユースケースのパフォーマンスを向上させるためにRekognitionの事前トレーニングモデレーションをカスタマイズすることができます。カスタムモデレーションでは、従量課金モデルで完全に管理されたモデレーションサービスの利点を引き続き享受することができます。

ソリューションの概要

カスタムモデレーションアダプターのトレーニングには、次の5つのステップが必要です。これらのステップをAWS管理コンソールまたはAPIインターフェースを使用して完了することができます:

  1. プロジェクトの作成
  2. トレーニングデータのアップロード
  3. 画像に正解ラベルを割り当てる
  4. アダプターのトレーニング
  5. アダプターの使用

ワークフロー図

コンソールを使用してこれらのステップを詳しく見ていきましょう。

プロジェクトの作成

プロジェクトは、アダプターを格納するためのコンテナです。プロジェクト内で複数のトレーニングデータセットを使用して複数のアダプターをトレーニングし、特定のユースケースで最も優れたパフォーマンスを発揮するアダプターを評価することができます。プロジェクトを作成するには、次の手順を実行してください:

  1. Amazon Rekognitionコンソールで、ナビゲーションペインでカスタムモデレーションを選択します。
  2. プロジェクトの作成を選択します。

タスクのリストのスクリーンショット

  1. プロジェクト名にプロジェクト名を入力します。
  2. アダプタ名にアダプタの名前を入力します。
  3. オプションでアダプタの説明を入力します。

タスクの作成のスクリーンショット

トレーニングデータのアップロード

ビジネスに適切ながらモデレーションラベルでフラグが立てられることがない誤検知(誤ってフラグが立てられる画像)を減らすために、20枚のサンプル画像から始めることができます。ビジネスに不適切ながらモデレーションラベルでフラグが立てられない誤検出(不適切な画像)を減らすためには、50枚のサンプル画像から始める必要があります。

アダプタのトレーニングのためのイメージデータセットを提供するために、以下のオプションから選択できます:

以下の手順を完了します:

  1. この投稿では、S3バケットから画像をインポートを選択し、S3 URIを入力します。

データセットの提供のスクリーンショット

Amazon Rekognitionでカスタムモデレーションアダプタをトレーニングする場合、トレーニングデータセットとアダプタの評価のための別のデータセットの2つが必要です。別のテストデータセットをアップロードするか、トレーニングデータセットを自動的に分割してトレーニングとテストに使用することができます。

  1. この投稿では、自動分割を選択します。
  2. システムが新しいバージョンのコンテンツモデレーションモデルがローンチされたときに、アダプタを自動的に再トレーニングするように自動更新を有効にするを選択します。
  3. プロジェクトの作成を選択します。

プロジェクトの作成のスクリーンショット

画像に正解ラベルを割り当てる

注釈がついていない画像をアップロードした場合、Amazon Rekognitionコンソールを使用してモデレーションタクソノミーに従って画像ラベルを提供することができます。以下の例では、非表示のアルコールを高い精度で検出するアダプタをトレーニングし、そのような画像をすべてアルコールのラベルでラベル付けします。不適切ではない画像はSafeとしてラベル付けします。

画像のラベル付けのスクリーンショット

アダプターのトレーニング

すべての画像にラベルを付けた後、トレーニングを開始を選択してトレーニングプロセスを開始します。Amazon Rekognitionは、アップロードされた画像データセットを使用して、特定のタイプの画像に対して高い精度で動作するアダプターモデルをトレーニングします。

カスタムモデレーションアダプターがトレーニングされると、アダプターパフォーマンスセクションですべてのアダプターの詳細(adapterIDtestおよびtrainingマニフェストファイル)を表示することができます。

アダプターパフォーマンスセクションは、事前トレーニング済みのモデレーションモデルと比較して偽陽性および偽陰性の改善を表示します。アルコールラベルの検出を向上させるためにトレーニングしたアダプターは、テスト画像での偽陰性率を73%減らします。つまり、事前トレーニング済みのモデレーションモデルと比較して、アダプターは正確にアルコールモデレーションラベルを予測できる画像が73%増えました。ただし、偽陽性には改善が見られないため、トレーニングには偽陽性のサンプルは使用されませんでした。

スクリーンショット - 精度

アダプターの利用

新しくトレーニングされたアダプターを使用して、高い精度を実現したインファレンスを行うことができます。これを行うには、Amazon RekognitionのDetectModerationLabel APIを呼び出し、ProjectVersionという追加のパラメーター(アダプターの一意のAdapterID)を指定します。以下は、AWS Command Line Interface(AWS CLI)を使用したサンプルコマンドです:

aws rekognition detect-moderation-labels \--image 'S3Object={Bucket="<bucket>", Name="<key>"}' \--project-version <ARN of the Adapter> \--region us-east-1

以下は、Python Boto3ライブラリを使用したサンプルコードスニペットです:

import boto3client = boto3.client('rekognition')response = client.detect_moderation_labels(    Image={        "S3Object":{            "Bucket":"<bucket>",            "Name":"<key>"        }    },     ProjectVersion="<ARN of the Adapter>")

トレーニングのベストプラクティス

アダプターのパフォーマンスを最大限に引き出すためには、次のベストプラクティスをトレーニングに推奨します:

  • サンプル画像データは、モデレーションモデルの精度を向上させたい代表的なエラーを捉える必要があります
  • 偽陽性と偽陰性のエラー画像だけでなく、改善されたパフォーマンスのために真陽性と真陰性も提供できます
  • トレーニング用にできるだけ多くの注釈付き画像を提供してください

結論

この投稿では、新しいAmazon Rekognitionカスタムモデレーション機能の詳細な概要を説明しました。さらに、コンソールを使用したトレーニングの手順と最適な結果のためのベストプラクティスについても詳しく説明しました。追加情報については、Amazon Rekognitionコンソールを訪問し、カスタムモデレーション機能を探索してください。

Amazon Rekognitionカスタムモデレーションは、Amazon Rekognitionが利用可能なすべてのAWSリージョンで一般に利用可能です。

AWSでのコンテンツモデレーションに関する詳細はこちらをご覧ください。AWSを使用してコンテンツモデレーションのオペレーションを効率化するための最初のステップに進んでください

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more