この機械学習の研究では、データセット内のバイアスを効果的に取り除くためのAIモデルを開発しています

バイアスのないデータセットを作成するために、機械学習研究におけるAIモデルの開発とその効果について

データ収集は、テクスチャバイアスが意図せず導入される可能性のある主要な機会となるかもしれません。モデルがバイアスのあるデータでトレーニングされ、それから異なる分布のデータに適用されると、バイアスの源と性質を明確にする必要があるため、性能はしばしば劇的に低下します。文献には、偏見を減らすか排除するための研究が豊富にあります。以前の研究では、敵対的学習を通じてバイアスに独立した特徴を抽出し、バイアスのあるデータに頼らずに意図した分類タスクを解決するモデルを作成することが提案されました。しかし、敵対的学習によってバイアスの特徴を完全に分離することは難しいため、トレーニング後にはテクスチャベースの表現が一般的に保持されます。

大邱広域市科学技術院(DGIST)のチームは、データバイアスを著しく軽減させる可能性のある新しい画像変換モデルを作成しました。複数のソースからの写真のコレクションからAIモデルをゼロから構築する際、ユーザーが最善の努力をしてもデータバイアスが存在する場合があります。この解決策は、自律車両、コンテンツ作成、ヘルスケアの進歩に大いに貢献するでしょう。

ディープラーニングモデルはしばしばバイアスのあるデータセットでトレーニングされます。例えば、風邪の肺炎を新型コロナウイルス感染症(COVID-19)から特定するデータセットを開発する際、COVID-19感染の可能性があるため、画像収集の状況は異なるかもしれません。その結果、これらの変動により画像には小さな差異が生じ、既存のディープラーニングモデルは、実用的な疾患識別のための主要な特徴ではなく、画像処理の違いによる属性に基づいて疾患を診断することになります。

空間自己相関損失、テクスチャ共起、GAN損失を使用することで、一貫したコンテンツと類似したローカルおよびグローバルなテクスチャなど、望ましい特性を持つ高品質の画像を生成することができます。トレーニングデータの支援を受けて画像が生成された後、バイアスのない分類器や変更されたセグメンテーションモデルを学習することができます。最も重要な貢献は以下のとおりです。

代わりとして、チームはテクスチャ共起と空間自己相関の損失を使用して画像を変換することを提案しています。画像変換タスクは、これらの損失が他の要素と分離して研究されたことがないものです。彼らは、これらの損失の両方を最適化することで、バイアスを軽減し、ドメイン適応に適した最適な画像を生成できることを示しています。

チームは、トレーニング中に予期せぬバイアスを効果的に軽減するための下流タスクの学習戦略を提案しています。これにより、バイアスラベルを使用せずにトレーニングデータセットを明示的に充実させることが可能となります。また、セグメンテーションモジュールに依存しないアプローチであるため、最先端のセグメンテーションツールとも連携することができます。このアプローチにより、これらのモデルに効率的に適応し、トレーニングデータセットを充実させることでパフォーマンスを向上させることができます。

チームは、バイアスのあるデータセット5つとドメイン適応データセット2つと比較し、以前の画像変換モデルと比較して高品質な画像を生成することにより、当チームのアプローチが最先端のバイアス軽減およびドメイン適応手法よりも優れていることを実証しました。

作成されたディープラーニングモデルは、テクスチャのバイアス軽減を適用してデータセットを作成し、そのデータセットでトレーニングするため、既存のアルゴリズムよりも優れた性能を発揮します。

テクスチャのバイアスが存在するデータセット(例:数字を区別する分類データセット、異なる毛色の犬と猫を判別する分類データセット、COVID-19と細菌性肺炎を区別するための他の画像プロトコルを適用する分類データセット)に対してテストされた際、既存のバイアス軽減および画像変換手法よりも優れたパフォーマンスを発揮しました。また、多ラベル整数を区別する分類データセットや、静止写真、GIF、アニメーションGIFを区別するために設計された分類データセットなどのバイアスを含むデータセットでも、従来の方法よりも優れた結果を示しました。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more