イネイテンスとは何か？人工知能にとって重要なのか？（パート2）

出典: ウィキメディア・コモンズ、クリエイティブ・コモンズ・ライセンスの下でライセンスされています

生物学と人工知能における先天性の問題は、人間のようなAIの将来にとって重要です。このコンセプトとその応用についてのこの2部構成の詳細な解説は、状況を明確にするのに役立つかもしれません。

著者：Vincent J. Carchidi

（これは生物学と人工知能における先天性に関する2部構成の記事の続きです。最初の部分はこちらで読むことができます。）

人工知能における先天性

深層学習の革命は、AIと人間の心の研究の関係の変化とともに行われてきました。人工ニューラルネットワーク（ANN）は元々、哺乳類の脳内の大量のニューロンの相互接続に大まかに触発されていました。一般的な広い観衆向けのANNの典型的な例は、入力層、中間の隠れ層、そして情報が一方向にのみ流れる出力層から成る単純なフィードフォワードネットワークですが、数百もの隠れ層を持つ深層ニューラルネットワーク（DNN）は、浅い前任者よりも「内部的に異質な」ものになっています（以下の画像参照）。

出典: ウィキメディア・コモンズ、クリエイティブ・コモンズ・ライセンスの下でライセンスされています。

しかし、時間とともに、人間の脳が実際にDNNと同じレベルであるという考えが人気のあるAIの議論で広まりました。生物学的なインスピレーションからANNへの転換は、単なる言語的な奇行ではありません。それは、人間の心の先天性についての洗練された理解と、AIの研究における適切な学際性を示しています。その功績にもかかわらず、深層学習の革命は、知能の唯一の例である生物の知能の理解に必要な厳密さの基準を下げる傾向をもたらしました（これはPeter Vossが最近の著作で指摘した認知フレームの欠如に対する障害です）。

そのため、ゲイリー・マーカスのような人物が、高度に構造化されたシステムを構築するアイデアに抵抗する機械学習の研究者に対して繰り返し不満を表明しているのは驚くことではありません。マーカスは、本業が認知心理学者であるからです。また、2017年のゲイリー・マーカスとヤン・ルカンの公開討論が「AIはより多くの先天的な機構を必要とするか？」という問いを中心に行われたのも驚くことではありません。

しかし、これは大規模言語モデル（LLM）の時代以前の話です。最近では、2022年6月にヤン・ルカンとジェイコブ・ブラウニングが、AIを通じて人間の知能について新しいことを学ぶことができるかもしれないと主張し、LLMが記号を操作することを学んだと主張しました。彼らは、「一般的な常識の推論、組成性、多言語能力、論理的および数学的な能力、そして死者を模倣する不気味な能力をいくらか示しているが、それを確実に行うわけではない」と述べています。ルカンはその後、LLMに対する悲観的な見方を表明しましたが、深層学習自体については、明らかに少なくともそれを結びつけていません（ルカンの立場については混乱があるかもしれませんが、マーカスと対照的に、ルカンは経験主義者であり続けています）。

しかし、信頼性は他の人々にとって障害ではありません。彼らはLLMが人間の先天性についての議論に貢献できるという考えに重点を置いています。言語学者のスティーブン・ピアンタドージは、LLMの成功が「生成言語学によって提案された言語の先天性のほぼすべての強力な主張を揺るがす」と主張する高度に普及した記事を書きました。彼はLLMを「自動化された科学者または自動化された言語学者」として位置付け、比較的制約のない空間で作業し、観測されたデータを最も簡潔に予測する理論を見つけるために検索すると述べています。

もしピアンタドージの主張が少なくとも一部正しいとすれば、そしてLLMがどのようにして人間が自然言語を習得するかをある程度説明するのであれば、それは生物と人工知能における先天性の必要性（または不必要性）に直接関係してきます。確かに、他の人々はこの主張に疑問を投げかけています。言語学者のロニ・カツィールは、自らGPT-4をテストした結果、システムが人間の言語使用の確立された制約に「適切にバイアスをかける」ことを証明できないと結論づけ、彼らが人間の言語認知をモデル化しているのではなく、言語テキストをモデル化していると主張しています。彼は、異なるデザインの目的があるため、LLMがどうして人間の言語習得を説明することを期待するのかは奇妙だと主張しています。研究者のジョン・ローウスキとリュシー・ボーモンは、ピアンタドージの主張が誤謬であり、説明力よりも予測力を優先していると断言しています。

ゲームプレイAIを通じた人工汎用知能の窓口

AIにおける先天性と人間との対比については、多くの点で奇妙な議論です。機械学習では、システムが成功するために必要な先天的な要素の数を最小限に抑える努力がしばしば見られますが、この議論では、深層学習時代の成功が経験主義の一種の連続であるかのように前提されています。先天性はAGIの追求に関連する分野で重要な要素ですが、成功したシステムにおいてはしばしば軽視されたり無視されたりし、それを推進する人々ですらその概念的な重要性が見落とされてしまいます。

このことが最も明白に示されているのは、ゲームプレイAIにおいてです。AlphaGo Zeroの関連研究論文において最も驚くべきことの一つは、システムが囲碁のプレイ方法を「タブラ・ラーサ」の状態から学習し始めるという著者の主張でした。もちろん、AlphaGo Zeroは自己対戦強化学習によって囲碁で超人的なパフォーマンスを実現したことが注目されますが、ゲーリー・マーカスが詳しく説明したように、AlphaGo Zeroが囲碁に関して何も学習する前の「固有なもの」をいかに持っていたかは、さらに注目されるべきです。

実際、AlphaGo Zeroが使用したドメイン知識は、2017年の研究論文（p. 360）から直接引用した以下の通りです：

（1）モンテカルロ木探索（MCTS）中に使用されるゲームルールの完全な知識。

（2）MCTSシミュレーションと自己対戦トレーニングにおけるトロンプ・テイラーの採点の使用 – これは、19×19のグリッド、黒と白の石、色の「クリアリング」としてカウントされるものなど、いくつかのゲームの特徴を指定する10の論理ルールのリストです。

（3）位置を記述する入力特徴は19×19の画像として構造化されています。「つまり、ニューラルネットワークのアーキテクチャはボードのグリッド構造に合わせられています」。

（4）「囲碁のルールは回転および反射に対して不変」 – この奇妙な表現は二つのことを意味します。一つは、データセットがトレーニング中に「各位置の回転と反射を含めるように拡張された」ことを意味し、もう一つは、「MCTS中に位置のランダムな回転または反射」が特定のアルゴリズムを用いてサンプリングされたことを意味します。

人間の個人が最初から備えている特有の道徳的能力なしに世界を道徳的な観点で枠にはめることはできませんが、AlphaGo Zeroも囲碁盤、石、盤面や石の動き、ゲームのルールをこの固有の資質なしに認識することはできませんでした。さらに、マーカス氏が指摘するように、MCTS装置はデータから学習されたものではなく、むしろ最初からプログラムされたものであり、どの拡張機能を含めるかは「学習ではなく人間の知識に基づいて選ばれた」（p. 8）。

自己対戦強化学習によってトレーニングされるためAlphaGo Zeroを「白紙の状態」と表現することは非常に誤解を招くものであり、経験主義の勝利ではありませんでした。むしろ、マーカス氏が正しく説明するように、それは「最初から適切なものを組み込む力の実証…畳み込みが深層学習の分野を機能させた前提条件であり、木探索がゲームプレイに不可欠でした。AlphaZeroはこれら二つを組み合わせました」（p. 8-9）。実際、人間の道徳的判断が、他のシステムとの接触を通じて主に道徳的直感に専念することから生じるように、AlphaGo Zeroもその固有の要素の一つを単純に削除することで囲碁の複雑さに対処することはできません。そして、アルトゥール・ダヴィラ・ガルセスとルイス・C・ランブが指摘するように、MCTSは象徴的な問題解決者であり、AlphaGo Zeroのニューラルネットワークとの結びつきは神経記号論的AIの要素です。

AlphaGo Zeroの固有の資質のこの組み合わせの側面こそが、それを非常に印象的なものにし、トレーニング自体の驚異と同様に、トレーニング前の組み込まれた知識を評価すべきです。

特定の問題にシステムを豊かに構造化するユニークな組み合わせ設計の選択肢は、多くのゲームプレイAIの最大の成功に責任がありますが、強化学習や自己対戦などの技術はこれらの選択肢の犠牲になる形で論評されています。これはMetaの「Cicero」にも顕著に現れており、CiceroはChatGPTよりも8日前にリリースされたことでその存在感を奪われてしまいました。

ディプロマシーで人間レベル（超人レベルではない）のパフォーマンスに到達した最初のエージェントであるCiceroは、ゲームプレイ中に戦略的な推論と自然言語コミュニケーションを組み合わせたシステムであることを示しています。さらに、システムのアーキテクチャは、戦略的な推論、自然言語処理、ゲーム理論などの分野から得られた研究や技術の組み合わせに依存しています。その結果、ゲーリー・マーカスとアーネスト・デイビスが説明するように、「高度に複雑で相互作用するアルゴリズムの集合」が生まれます。

外交に成功するために、プレーヤーはマップ上の供給センターの過半数を獲得するために戦略的な思考を行わなければなりません。このゲームの要素は、AIによってある程度は既に習得されているチェス、囲碁、ポーカーなどの他のゲームに似ています。しかし、外交との違いは、プレーヤーがテキストベースまたは口頭で開放的な対話を行うために相互に交渉することに多くの時間を費やすことです。

簡単そうですね。プレーヤーは互いと交渉して有利な結果を確保するために交渉します。しかし、それは全く簡単なことではありません。私たちの道徳的な判断が対応する状況の複雑さや判断自体の複雑さを十分に評価しない傾向があることを忘れないでください。外交は、遠くから見ないと騙される可能性があります。エージェントの戦略的な思考能力を自然言語コミュニケーションに合わせることは非常に複雑です。

シセロのアーキテクチャは、計画エンジンと対話エージェントに分割することができます。計画エンジンは戦略的な思考を担当し、対話エージェントは自然言語コミュニケーションを処理します。重要なのは、これらの2つの分割が非常に具体的なメカニズム（「対話条件付け行動モデル」）によって調整され、対話エージェントが計画エンジンによって制御されることです。このハイレベルの構造により、計画エンジンは意図を生成し、それを使用してエージェントの目標を構築することができます。この情報は、対話エージェントに供給され、シセロと他のプレーヤーとのメッセージ生成がエージェントの戦略目標と一致するように保たれます。シセロは時に自己矛盾してしまいますが、その設計者たちは、匿名のマルチレベルトーナメントのプレイ中に人間がエージェントをAIとして特定しなかったと報告しており、システムの人間らしい成功を強調しています。

より低レベルの構造には独自の特徴があります。AlphaGo Zeroの成功を考えると、外交エージェントも自己対戦を通じてトレーニングすべきだと思われるかもしれません。しかし、シセロ以前の研究では、人間のデータなしで外交エージェントをトレーニングすると、人間に対して比較的弱いプレイが行われることがわかりました。

また、モンテカルロ木探索アルゴリズムも特に有用ではありません。シセロ以前に外交でMCTSがテストされたことはありましたが（私の知る限りでは、主にゲームの戦略的な側面ではなく、交渉の側面で）、囲碁と外交の間の違いにより、効果が薄くなります。囲碁は非同期のゲームであり、プレーヤーは順番に手番を行い、次のプレーヤーが動く時までにボード上のすべての関連情報が伝達されます。一方、外交は同時進行です。プレーヤーは交渉を行い、その後、行動を個別に入力し、それがすべての人に同時に公開されます。MCTSはこの構造にはうまく対応できません。

ここで、Meta AIのチームが行ったことをご紹介します。外交プレイAIの先行研究を基に、彼らは「piKL」というアルゴリズムを構築しました。piKLは、新しい戦略を探索することと人間を模倣することの双方の需要の間を「補間」するように設計されています。このアルゴリズムは計画エンジンの基盤です。ポーカープレイエージェントLibratusのために行われた研究と同様に、Meta AIは「piKLは外交の各ターンを独自のサブゲームとして扱います…」と報告しています。

さらに、対話エージェントの基盤となるのは生成的な大規模言語モデルです。この言語モデルは既存のゲームの対話を基に微調整されました。しかし、言語モデルは外交の文脈から切り離されており、エージェントの戦略目標と一致しない出力を生成します（さらに、人間によって簡単に操作可能です）。これを回避するために、トレーニングされた人間のメッセージのうち、提案されたアクションがラベル付けされました。言語モデルはこれらの意図に基づいて調整されました。

これらがどのように組み合わさるかを見ることができます。プレイ中、計画エンジンは言語モデルを制御するために関連する意図を選択します。この制御は、システムのための真実のアクションと、コミュニケーションの受信者（システムはすべてのプレーヤーのアクションをモデル化します）にとって相互に有益なアクションに基づいています。

影響

シセロはエンジニアリングの傑作です。また、AIシステムが豊かで高度に構造化された資源に埋め込まれた、独自の人間的な偉業を達成する最も顕著な例の一つでもあります。これらの内部コンポーネントは、戦略的な思考と自然言語コミュニケーションの一致において比較的生産的にインターフェースします。マーカスとデイビスは、シセロが外交ゲームを超えた重要性をすぐに認識したわずかな人々の一人でした。「もしシセロが何かの目印であるなら、機械学習は、公平な量の内在的な、時には神経象徴的な機構が組み込まれた高度に構造化されたシステムに埋め込まれている場合、さらに価値があることが最終的に証明されるかもしれません」と彼らは述べています。

しかし、AIの多くの人々は、これは本質を見落としていると考えています。はい、生物学的な知能にはさまざまな内在的な特徴があるかもしれませんが、人工知能システムはそれらを必要としないかもしれません。人間が行う方法以外にも、知的な行動を実行するための方法は他にもあるという考えがあります。AlphaGo Zeroを見ればわかります。このシステムは、その内部コンポーネントが人間の脳よりも比較的単純であるにもかかわらず、世界中のどの人間よりも優れた囲碁をプレイします。既に非常にうまく機能しているシステムに、なぜより多くの内在的な要素を組み込むことに重点を置くのでしょうか？また、シセロで動作する動作部品の数を最小限にする試みはしないのでしょうか？

この架空の対話者は小事にこだわりすぎて全体を見失っています。マーカスは2018年の論文で以下のように説明しています。「人間は特定のゲームに特定の先天的な表現的特徴を持たずに多くのゲームを学ぶことができますが、[AlphaGo Zero]の各実装は特定のゲームの特定の実現に固有の特徴を持っており、特定の問題に焦点を当ててシステムをロックします。人間は問題にアプローチする方法においては非常に柔軟です」（p. 9）。

「狭い」AIから「一般的」AIへの飛躍は、先天性の問題と直接関連しています。そして、生物学的知能はその理由を示しています：AlphaGo Zeroのレベルで囲碁をプレイすることができる個々の人間は存在しないというのは事実ですが（AlphaGo ZeroによるKataGo vs. Kellin Pelrineのようなものが再現されないと仮定して）、このシステムは高度に特定の先天的な構造なしではこの地点に到達できません。まさに人間の道徳的判断も、私たちの先天的な構造によって非常に具体的な特性を持つようになります。

生物学からAIへの洞察はこれ以上広がっています。ゲームプレイAIは、勝利の明確な条件（つまり、勝利のための明確な条件）と安定した制約（ゲームのルール、プレイされるボード、プレイヤーの数など）が存在する環境で、研究者が技術をテストすることができることがしばしば注目されています。これらのゲームは、戦術的な熟練度、戦略的な推論、自然言語コミュニケーション、欺瞞、協力と連携、正直と不正直など、人間の認知能力の孤立した活用です。

問題は、AlphaGo ZeroやCiceroなどのゲームプレイAIが、私たちが囲碁や外交などの戦略ゲームをプレイするときに行っていることとは異なる方法で成功するところにあります。対話者が指摘するように、彼らは異なる成功方法を見つけています：AlphaGo Zeroは、Goに特化して設計された検索アルゴリズムを使用して何百万回も自己対局を行うことができます。Ciceroは、大きな「メタゲーム」の知識に誤解されることなく交渉することができます。しかし、AlphaGo ZeroはGoの外で戦略を立てることができませんし、自分が先天的に認識することにプログラムされた正確な寸法を持たない囲碁盤を認識することもできません。Ciceroは外交の外で交渉することができません。なぜなら、それは合意を最適化するだけで意図を読む方法を知らないからです。

そして、ここに問題があります：人間が囲碁で戦略を立てると、その能力を他のゲームや文脈でも活用することができます。人間が外交で意図を読むと、ゲームの外でも同じ認知能力を柔軟かつ堅牢に活用することができます。

核心は次のようなものです：

AIが人間よりも優れた方法でゲームで成功するために使用する「異なる」方法は、その先天的な構造の力によるものです。狭いAIから一般的なAIへの飛躍には、ディープラーニングの成功要素と組み合わさった新しい種類の先天的な構造が必要です。

結論

私の経験では、先天性の概念は人々を悩ませるものです。しかし、興味深いのは、人々が人間の腕や足、循環系、脊髄が先天的であるという考えに悩まされることではないことです。むしろ、人々は道徳的な価値観や言語、音楽の感覚など、心の高次の能力が先天的であるという考えに悩まされる傾向があります。

この二重基準は、認知科学や神経科学における潜在的な障害として特定されており、AIにおいても先天性への抵抗の一因となっていると主張しています。Rodney Brooksがツイートした「エンド・トゥ・エンドの学習」への偏執は、単にこの奇妙な二重基準がAIに取り込まれた結果である可能性があり、この分野に特有のものではないかもしれません。

しかし、単に特定するだけでは、人間のようなAIやAGIを構築するための工学と科学の明確な分離は、今後の展望には十分ではありません。すべてがうまくいくかどうかを見極めるという考え方には非常に創造的な利点がありますが、人間のようなAIを実現するにはそれだけでは十分ではありません。人間の生物学や認知に関する暗黙の前提を当然のこととして考えることはできない、よく構造化された研究問題の連続でなければならないでしょう。

参考文献：

[1] B. Alloui-Cros、「両方のペンと剣を征服する？Cicero in the Game of Diplomacy」（2023年）、Substack

[2] A. Bakhtin他、「No-Press Diplomacy from Scratch」（2021年）、ArXiv

[3] N. ブラウンとT. サンドホルム、スーパーヒューマンAIによるヘッズアップノーリミットポーカー（2017）、サイエンス

[4] V.J. カルキディ、潜水艦は泳ぐのか？（2022）、AI＆amp; ソサエティ

[5] N. チョムスキー、言語と心の研究におけるナチュラリズムと二重論（1994）、国際哲学研究誌

[6] D. シルバー他、人間の知識なしで囲碁を制する（2017）、ネイチャー

[7] G. デュプレ、（何）ディープラーニングは理論的言語学に貢献できるのか？（2021）、マインズアンドマシンズ

[8] A. ガーセスとL. ラム、神経記号AI：第3の波（2023）、人工知能レビュー

[9] M. ホームズ、対面外交（2018）、ケンブリッジ大学出版局

[10] A.P. ジェイコブ他、KL正則化された探索による強力で人間らしいゲームプレイのモデリング（2021）、ArXiv

[11] R. カッツィア、大規模言語モデルは人間の言語認知の貧弱な理論である。ピアンタドージへの回答（2023）、LingBuzz

[12] G. マーカスとE. デイビス、Meta AIのディプロマシー勝利のシセロが人工知能にとって何を意味するか（2022）、ACM通信

[13] G. マーカス、生まれつき、AlphaZero、人工知能、ArXiv

[14] Meta Fundamental AI Research Diplomacy Team (FAIR)他、言語モデルと戦略的推論を組み合わせたディプロマシーのゲームでの人間レベルのプレイ（2022）、サイエンス

[15] S. ピアンタドージ、現代の言語モデルはチョムスキーの言語アプローチを反証する（2023）、LingBuzz

[16] J. ラウスキとL. ボーモント、現代の言語モデルは何も反証しない（2023）、LingBuzz

[17] A. テオドリディスとG. カルキアダキス、ディプロマシーのゲームに対するモンテカルロ木探索（2020）、第11回ギリシャ人工知能会議

[18] S. ウルマン、神経科学を用いた人工知能の開発（2019）、サイエンス

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Artificial IntelligenceCognitive ScienceGameplaying AisHuman Like AiInnateness

Was this article helpful?

93 out of 132 found this helpful

イネイテンスとは何か？人工知能にとって重要なのか？（パート2）

人工知能における先天性

Was this article helpful?

「犬レベルのAIから神レベルのAIへ向かって」

「私はChatGPTのコードインタプリタに乱雑なデータセットと望ましいクリーンなバージョンを示しました」

AIテクノロジー

「プリントオンデマンドのドロップシッピング：芸術への情熱を収益化する」

最適なデータ統合アプローチを選ぶためのガイド' (Saiteki na dēta tōgō apurōchi wo erabu tame no gaido)

適切なウェブサイト最適化でコンピューターサイエンスプログラムのランキングを付ける方法

AIを活用したエネルギー効率：今日の電気技師をどのようにスキルアップするのか？

公的機関によるAI調達のための標準契約条項の提案

「今日のビジネスの風景におけるプロフェッショナルな提案の力」