生成AIの逆説を調和させる:生成と理解における人間と機械の知能の相反する進化の道

生成AIと人間の知能進化の逆説を調和させる:生成と理解における人間と機械の知能の相反する進化の道

ChatGPTからGPT4まで、DALL-E 2/3、Midjourneyまで、最新の生成AIの波は世界中で前例のない注目を集めています。この魅力は、「知性」と思われるものは人間の能力をも超えることで、それに対する深刻なリスクへの懸念とともに抑制されています。現在の生成モデルは、言語と視覚の両分野での長年の経験と専門知識を持つ専門家にも挑戦できる結果を生み出す可能性があり、これは機械が人間の知能を超えたという主張を説得力を持って支持しています。同時に、モデルの出力を詳しく調べると、専門家でない人にとっても驚きのある基本的な理解のミスが明らかになります。

これは、矛盾のように思える問題を提起します:これらのモデルの明らかに超人的な力をどのように説明できるのか、同時に多くの人が修正できる基本的なミスを保持しています。彼らは、現在の生成モデルの能力構成と人間の知能の構成との違いからこの矛盾が生じると示唆しています。具体的には、ワシントン大学とアレン人工知能研究所の研究者たちは、この研究で「生成AIパラドックス仮説」を提案し、調査しました。この仮説は、生成モデルは専門家のような出力を直接生成するように訓練されているため、専門家のような出力通訳よりも創造的である可能性があるというものです。

対照的に、人々はほとんど常に専門家レベルの結果を提供する前に基礎的な理解を必要とします。彼らは制御された研究で、言語と視覚のモーダリティを横断する生成モデルの生成と理解の能力を評価するために、「理解」という概念を構築するために2つの観点を使用します。つまり、1)生成タスクが与えられた場合、モデルは同じタスクの識別バージョンで適切な回答を選択できるか、および2)正解である場合、モデルは生成された応答の性質と適格性についてのクエリにどの程度応答できるかということです。したがって、2つの異なる実験設定があります:尋問と選択です。

彼らの結果はタスクやモーダリティによって異なるものの、特定の傾向が明らかになります。選択的評価においては、モデルは生成タスクの文脈でしばしば人と同等のパフォーマンスを発揮するか、さらに優れていますが、識別的な状況では人間ほど優れていません。後続の調査では、人間の識別パフォーマンスは敵対的な入力に対してより強く、GPT4よりも生成パフォーマンスとより密接に関連していることが明らかになります。モデルと人間の識別のギャップは、タスクの複雑さが増すにつれて拡大します。同様に、尋問評価ではモデルは様々なタスクに対して高品質な出力を提供できますが、同じ生成に関する質問に答える際には頻繁にミスを comしがちであり、彼らの理解力は人間の理解力で改善が必要です。

著者たちは、生成モデルと人間の能力構成の違いに関するさまざまな説明を検討しています。たとえば、モデルトレーニングの目標や入力の種類と量などです。彼らの結論には、いくつかの重要な影響があります。まず、現在の知性に基づいている現行の人間の経験に基づく考えが人工知能には適応しないかもしれないことを示唆しています。AIの能力は多くの側面で人間の知性に類似しているかまたはそれを超えていますが、その実際の特性は人間の思考プロセスの予想されるパターンとは大幅に異なる場合があります。反対に、彼らの結果は、生成モデルから人間の知性と認知についての結論を引き出すことはできないと警告しています。なぜなら、生成モデルの専門家のような出力は、非人間的なメカニズムを覆い隠している可能性があるからです。全体として、モデルを人間の知性と比較するのではなく、生成AIのパラドックスはそれらを興味深い対照として見ることを示唆しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

チャットGPTプラグインとの安全なインタラクションの変換ガイド

イントロダクション かつては静的なコンテンツの領域であったChatGPTは、ChatGPTプラグインの注入によって革命的な変革を遂げ...

機械学習

「ゲームを一段と盛り上げる:スタートアップのスポーツビジョンAIが世界中にアスレチックを放送」

Pixellotは、ビジョンAIによって得点を稼いでおり、各国の視聴者にリアルタイムのスポーツ放送と分析を提供する組織にとって...

人工知能

「両方の世界のベスト:人間の開発者とAIの協力者」

「これは、開発者を対象とした生成型AI生産性ツール(例:Github Copilot、ChatGPT、Amazon CodeWhisperer)が構造にどのよう...

AIニュース

「セグミンドの生成AIによるエンパワーリングなロゴデザイン」

イントロダクション ブランドの世界では、ロゴがブランドの本質を象徴しています。従来、ロゴの作成にはデザイナーの才能と修...

機械学習

GLIP オブジェクト検出への言語-画像事前学習の導入

今日は、言語-画像の事前学習であるCLIPの素晴らしい成功を基に、物体検出のタスクに拡張した論文であるGLIPについて掘り下げ...