このAIツールは、AIが画像を「見る」方法と、なぜアストロノートをシャベルと間違える可能性があるのかを説明します

このAIツールは、AIが画像を「見る」方法と、アストロノートをシャベルと間違える理由を説明します

人工知能(AI)が近年大きな進歩を遂げ、驚異的な成果と突破的な成果をもたらしていることは広く認識されています。ただし、AIはすべてのタスクで同様に印象的な結果を達成できるわけではありません。例えば、AIは顔認識などの一部の視覚的なタスクで人間のパフォーマンスを上回ることができる一方で、画像処理や分類においても困惑するようなエラーを示すことがあり、それによって取り組んでいる課題の難しさが浮き彫りにされます。その結果、関連するタスクの内部の仕組みや特定の決定に至るまでのAIシステムの理解は、研究者や開発者の間で大きな関心と調査の対象となっています。人間の脳と同様に、AIシステムも画像の分析と分類のための戦略を使用していることが知られています。しかし、これらのプロセスの正確なメカニズムは依然として不明であり、ブラックボックスモデルを生み出しています。

そのため、特にニューラルネットワークを含む現代の機械学習モデルが行った決定を解釈するための説明可能性の手法への需要が高まっています。この文脈では、モデルの決定に影響を与える個々のピクセルの重要性を示すヒートマップを生成する属性付け手法が人気を集めています。しかし、最近の研究は、これらの手法の制限を明らかにし、モデルがどの領域を見つめているかを明らかにすることなく、画像の中でモデルが何を感知しているかを明らかにしない傾向があることを示しています。そのため、深層ニューラルネットワークを解明し、AIシステムが画像を処理するために使用する戦略を明らかにするために、ブラウン大学のカーニー脳科学研究所の研究者とフランスの人工知能研究所のコンピュータサイエンティストが協力して、CRAFT(Concept Recursive Activation FacTorization for Explainability)を開発しました。この革新的なツールは、AIモデルが意思決定プロセス中に焦点を当てる「何」と「どこ」を明確にすることを目指しており、人間の脳とコンピュータビジョンシステムが視覚情報を理解する方法の違いを強調しています。この研究は、カナダで開催された名門のコンピュータビジョンとパターン認識会議2023でも発表されました。

先に述べたように、属性付け手法を使用して特定の領域を使用してAIシステムがどのように決定を行うかを理解することは困難でした。ただし、重要な領域を特定するだけでなく、なぜそれらの領域が重要なのかを明確にすることは、人間にとって包括的な説明を提供するには不十分です。CRAFTは、ニューラルネットワークが学習した複雑で多次元の視覚表現を解明するために、現代の機械学習技術を活用してこの制約に対処しています。理解を深めるために、研究者らはユーザーフレンドリーなウェブサイトを開発し、個々の概念を視覚化することで、ニューラルネットワークがオブジェクトを分類するために使用する基本的な概念を簡単に探索できるようにしています。さらに、研究者らは、CRAFTの導入により、ユーザーがAIシステムが画像を構築し、特定の領域内でモデルが何を感知しているかを理解するだけでなく、これらの概念の階層的なランキングも理解できると強調しています。この画期的な進歩は、AIシステムの意思決定プロセスを解明し、分類結果の透明性を高めるための貴重なリソースを提供します。

要するに、研究者による研究の主な貢献は、3つの主要なポイントにまとめることができます。まず、チームは複数のレイヤーにわたって概念を効果的に特定し、分解するための再帰的なアプローチを考案しました。この革新的な戦略により、ニューラルネットワーク内の基本的なコンポーネントを包括的に理解することが可能になります。次に、Sobol指数を利用して概念の重要性を正確に推定する画期的な方法が導入されました。最後に、暗黙の微分を実装することにより、コンセプト属性マップの作成が革新的に変革され、概念とピクセルレベルの特徴の関連性を可視化し理解するための強力なツールが開放されました。さらに、チームはアプローチの効率と重要性を裏付ける一連の実験的評価を実施しました。その結果、CRAFTは他のすべての属性付け手法を上回ることが明らかになり、概念に基づく説明可能性手法の研究への更なる発展への礎となる優れたユーティリティを確立しました。

研究者らはまた、コンピュータが画像をどのように感知するかを理解することの重要性を強調しました。AIシステムが使用する視覚戦略に深い洞察を得ることで、研究者は視覚ベースのツールの精度とパフォーマンスを向上させる競争力を得ることができます。さらに、この理解は、攻撃者が人間にはほとんど感知できない微細なピクセルの強度を微妙に変更することでAIシステムを欺くことができる方法に対抗するために、敵対的でサイバー攻撃に対しても有益です。将来の課題に関しては、研究者はコンピュータビジョンシステムが人間の能力を超える日を楽しみにしています。癌の診断、化石の認識などの未解決の課題に取り組む可能性を持ち、これらのシステムが多くの分野を変革する約束を持っていると強く信じています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

CMUとプリンストンの研究者がマンバを発表:多様なモードのディープラーニングアプリケーションにおいてトランスフォーマーの効率を超えるSSMアーキテクチャの画期的な進展

現代の機械学習において、ファウンデーションモデルは、大量のデータで事前に学習され、その後に下流のタスクに対して改変さ...

機械学習

「Azure Lightweight Generative AI Landing Zone」

「Azure AI サービスに基づくランディングゾーンの構築に関する完全ガイドでは、AI プロダクトを紹介し、AI の活用により利益...

人工知能

「生成AIの時代における品質保証の再考」

「GenAI が生成したコードに追いつくために、テストエンジニアはGenAIツールを活用し、QA計画の基礎を形成する必要があります」

機械学習

Google DeepMind(グーグルディープマインド)が「GNoME(グノーム)」を発表:新素材の安定性を予測し、探索の速度と効率を劇的に向上させる新しいディープラーニングツール

無機結晶は、コンピュータチップ、バッテリー、太陽電池など、現代の多くの技術にとって不可欠です。安定した結晶は、細心の...

機械学習

MITの新しいAI研究は、深層ニューラルネットワークが私たちとは異なる方法で世界を見ていることを示しています

人間の感覚システムの複雑な機能を模倣することを目指して、神経科学と人工知能の研究者は、計算モデルと人間の知覚の間の不...

AI研究

「人間の活動認識におけるディープラーニング:このAI研究は、Raspberry PiとLSTMを使用した適応的なアプローチを導入し、位置に依存しない正確性を高めます」

ヒューマンアクティビティ認識(HAR)は、さまざまなセンサから収集したデータに基づいて、自動的に人間の活動を識別および分...