このAIツールは、AIが画像を「見る」方法と、なぜアストロノートをシャベルと間違える可能性があるのかを説明します

このAIツールは、AIが画像を「見る」方法と、アストロノートをシャベルと間違える理由を説明します

人工知能(AI)が近年大きな進歩を遂げ、驚異的な成果と突破的な成果をもたらしていることは広く認識されています。ただし、AIはすべてのタスクで同様に印象的な結果を達成できるわけではありません。例えば、AIは顔認識などの一部の視覚的なタスクで人間のパフォーマンスを上回ることができる一方で、画像処理や分類においても困惑するようなエラーを示すことがあり、それによって取り組んでいる課題の難しさが浮き彫りにされます。その結果、関連するタスクの内部の仕組みや特定の決定に至るまでのAIシステムの理解は、研究者や開発者の間で大きな関心と調査の対象となっています。人間の脳と同様に、AIシステムも画像の分析と分類のための戦略を使用していることが知られています。しかし、これらのプロセスの正確なメカニズムは依然として不明であり、ブラックボックスモデルを生み出しています。

そのため、特にニューラルネットワークを含む現代の機械学習モデルが行った決定を解釈するための説明可能性の手法への需要が高まっています。この文脈では、モデルの決定に影響を与える個々のピクセルの重要性を示すヒートマップを生成する属性付け手法が人気を集めています。しかし、最近の研究は、これらの手法の制限を明らかにし、モデルがどの領域を見つめているかを明らかにすることなく、画像の中でモデルが何を感知しているかを明らかにしない傾向があることを示しています。そのため、深層ニューラルネットワークを解明し、AIシステムが画像を処理するために使用する戦略を明らかにするために、ブラウン大学のカーニー脳科学研究所の研究者とフランスの人工知能研究所のコンピュータサイエンティストが協力して、CRAFT(Concept Recursive Activation FacTorization for Explainability)を開発しました。この革新的なツールは、AIモデルが意思決定プロセス中に焦点を当てる「何」と「どこ」を明確にすることを目指しており、人間の脳とコンピュータビジョンシステムが視覚情報を理解する方法の違いを強調しています。この研究は、カナダで開催された名門のコンピュータビジョンとパターン認識会議2023でも発表されました。

先に述べたように、属性付け手法を使用して特定の領域を使用してAIシステムがどのように決定を行うかを理解することは困難でした。ただし、重要な領域を特定するだけでなく、なぜそれらの領域が重要なのかを明確にすることは、人間にとって包括的な説明を提供するには不十分です。CRAFTは、ニューラルネットワークが学習した複雑で多次元の視覚表現を解明するために、現代の機械学習技術を活用してこの制約に対処しています。理解を深めるために、研究者らはユーザーフレンドリーなウェブサイトを開発し、個々の概念を視覚化することで、ニューラルネットワークがオブジェクトを分類するために使用する基本的な概念を簡単に探索できるようにしています。さらに、研究者らは、CRAFTの導入により、ユーザーがAIシステムが画像を構築し、特定の領域内でモデルが何を感知しているかを理解するだけでなく、これらの概念の階層的なランキングも理解できると強調しています。この画期的な進歩は、AIシステムの意思決定プロセスを解明し、分類結果の透明性を高めるための貴重なリソースを提供します。

要するに、研究者による研究の主な貢献は、3つの主要なポイントにまとめることができます。まず、チームは複数のレイヤーにわたって概念を効果的に特定し、分解するための再帰的なアプローチを考案しました。この革新的な戦略により、ニューラルネットワーク内の基本的なコンポーネントを包括的に理解することが可能になります。次に、Sobol指数を利用して概念の重要性を正確に推定する画期的な方法が導入されました。最後に、暗黙の微分を実装することにより、コンセプト属性マップの作成が革新的に変革され、概念とピクセルレベルの特徴の関連性を可視化し理解するための強力なツールが開放されました。さらに、チームはアプローチの効率と重要性を裏付ける一連の実験的評価を実施しました。その結果、CRAFTは他のすべての属性付け手法を上回ることが明らかになり、概念に基づく説明可能性手法の研究への更なる発展への礎となる優れたユーティリティを確立しました。

研究者らはまた、コンピュータが画像をどのように感知するかを理解することの重要性を強調しました。AIシステムが使用する視覚戦略に深い洞察を得ることで、研究者は視覚ベースのツールの精度とパフォーマンスを向上させる競争力を得ることができます。さらに、この理解は、攻撃者が人間にはほとんど感知できない微細なピクセルの強度を微妙に変更することでAIシステムを欺くことができる方法に対抗するために、敵対的でサイバー攻撃に対しても有益です。将来の課題に関しては、研究者はコンピュータビジョンシステムが人間の能力を超える日を楽しみにしています。癌の診断、化石の認識などの未解決の課題に取り組む可能性を持ち、これらのシステムが多くの分野を変革する約束を持っていると強く信じています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

『自分のデータでChatGPTを訓練する方法:ソフトウェア開発者向けガイド』

「MEMWALKERとの対話型リーディングにより、AIモデルの強化が行われ、より豊かで文脈を理解した対話が可能となり、現代のAIの...

AIニュース

「ジェミニに会おう:チャットGPTに対するGoogleの答え」

人工知能の進化する世界において、Googleは最新作のGemini AIにより画期的な飛躍を遂げました。Googleによると、異なるサイズ...

データサイエンス

「機械学習入門:その多様な形式を探索する」

最近、機械学習はどこにでもありますねもしもあなたがここにいるなら、機械学習が一体何なのかに興味を持ったのかもしれませ...

機械学習

「生成AIの10年からの教訓」

「生成AIの未来を理解するためには、それがどこから来たのか、そして技術とともに進化する課題と機会を見ることが役立ちます」

AIニュース

「ChatGPTは人間の創造性テストでトップ1%のスコアを獲得」

人工知能(AI)は、モンタナ大学とそのパートナーによる研究によれば、新たな高みに達しました。この研究では、チャットGPTが...

データサイエンス

AdaTape 適応計算とダイナミックな読み書きを持つ基礎モデル

Googleの研究インターンであるFuzhao Xueと研究科学者であるMostafa Dehghaniによって投稿されました。 適応的計算とは、機械...