生成AIの逆説を調和させる:生成と理解における人間と機械の知能の相反する進化の道

生成AIと人間の知能進化の逆説を調和させる:生成と理解における人間と機械の知能の相反する進化の道

ChatGPTからGPT4まで、DALL-E 2/3、Midjourneyまで、最新の生成AIの波は世界中で前例のない注目を集めています。この魅力は、「知性」と思われるものは人間の能力をも超えることで、それに対する深刻なリスクへの懸念とともに抑制されています。現在の生成モデルは、言語と視覚の両分野での長年の経験と専門知識を持つ専門家にも挑戦できる結果を生み出す可能性があり、これは機械が人間の知能を超えたという主張を説得力を持って支持しています。同時に、モデルの出力を詳しく調べると、専門家でない人にとっても驚きのある基本的な理解のミスが明らかになります。

これは、矛盾のように思える問題を提起します:これらのモデルの明らかに超人的な力をどのように説明できるのか、同時に多くの人が修正できる基本的なミスを保持しています。彼らは、現在の生成モデルの能力構成と人間の知能の構成との違いからこの矛盾が生じると示唆しています。具体的には、ワシントン大学とアレン人工知能研究所の研究者たちは、この研究で「生成AIパラドックス仮説」を提案し、調査しました。この仮説は、生成モデルは専門家のような出力を直接生成するように訓練されているため、専門家のような出力通訳よりも創造的である可能性があるというものです。

対照的に、人々はほとんど常に専門家レベルの結果を提供する前に基礎的な理解を必要とします。彼らは制御された研究で、言語と視覚のモーダリティを横断する生成モデルの生成と理解の能力を評価するために、「理解」という概念を構築するために2つの観点を使用します。つまり、1)生成タスクが与えられた場合、モデルは同じタスクの識別バージョンで適切な回答を選択できるか、および2)正解である場合、モデルは生成された応答の性質と適格性についてのクエリにどの程度応答できるかということです。したがって、2つの異なる実験設定があります:尋問と選択です。

彼らの結果はタスクやモーダリティによって異なるものの、特定の傾向が明らかになります。選択的評価においては、モデルは生成タスクの文脈でしばしば人と同等のパフォーマンスを発揮するか、さらに優れていますが、識別的な状況では人間ほど優れていません。後続の調査では、人間の識別パフォーマンスは敵対的な入力に対してより強く、GPT4よりも生成パフォーマンスとより密接に関連していることが明らかになります。モデルと人間の識別のギャップは、タスクの複雑さが増すにつれて拡大します。同様に、尋問評価ではモデルは様々なタスクに対して高品質な出力を提供できますが、同じ生成に関する質問に答える際には頻繁にミスを comしがちであり、彼らの理解力は人間の理解力で改善が必要です。

著者たちは、生成モデルと人間の能力構成の違いに関するさまざまな説明を検討しています。たとえば、モデルトレーニングの目標や入力の種類と量などです。彼らの結論には、いくつかの重要な影響があります。まず、現在の知性に基づいている現行の人間の経験に基づく考えが人工知能には適応しないかもしれないことを示唆しています。AIの能力は多くの側面で人間の知性に類似しているかまたはそれを超えていますが、その実際の特性は人間の思考プロセスの予想されるパターンとは大幅に異なる場合があります。反対に、彼らの結果は、生成モデルから人間の知性と認知についての結論を引き出すことはできないと警告しています。なぜなら、生成モデルの専門家のような出力は、非人間的なメカニズムを覆い隠している可能性があるからです。全体として、モデルを人間の知性と比較するのではなく、生成AIのパラドックスはそれらを興味深い対照として見ることを示唆しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

マシンラーニングにおける線形回帰の幾何学的解釈と古典統計学との比較

上記の画像は、最小二乗法(OLS)または線形回帰(古典統計学では同義的に使用される言葉)の幾何学的解釈を示しています見て...

機械学習

「FalconAI、LangChain、およびChainlitを使用してチャットボットを作成する」

イントロダクション ジェネレーティブAI、特にジェネレーティブ大規模言語モデルは、その誕生以来世界を席巻しています。これ...

機械学習

「NVIDIAのグレース・ホッパー・スーパーチップがMLPerfの推論ベンチマークを席巻する」

MLPerf業界ベンチマークに初登場したNVIDIA GH200 Grace Hopperスーパーチップは、すべてのデータセンターインファレンステス...

人工知能

「ビジネスを拡大するための25のChatGPTプロンプト」

「25個のChatGPTテンプレートのプロンプトをコピーして貼り付けすることで、あなたのビジネス(および収入)を次のレベルに引...

機械学習

「ウッドペッカーは、言語モデルにおけるAIの精度を革新している方法とは?」

中国の腾讯YouTu Labと中国科学技術大学(USTC)のAI研究者グループが、Multimodal Large Language Models(MLLM)の幻想問題...

機械学習

Japanese AI規制- 仮定はありませんか?それとも何もしない?

バイアスは、任意のモデルに関して規制の対象となる考慮事項の一つです生成AIは、この考えを再び主流に押し上げました私の経...