認知的な燃焼を引き起こす:認知アーキテクチャとLLMの融合による次世代コンピュータの構築

Building Next-Generation Computers through the Fusion of Cognitive Architecture and LLM to induce Cognitive Combustion

「システムは部品の合計ではなく、それらの相互作用の産物である」ラッセル・アッコフ。

私たちは最新のガジェットやアルゴリズムに目を奪われがちですが、単独の技術だけでは現実世界の変化をもたらすことはできません。真の進歩は、技術を解決策に統合するシステムに依存しています。個々のツールは手段であり、システム自体が目的です。

この例を考えてみましょう。私たちは何世紀にもわたって燃焼の力を利用してきましたが、その可能性を引き出すには複雑なダンスをデザインする必要がありました。内燃機関は、クランクを回転させ、ピストンを駆動させる爆発を生成するためのものです。エンジンの部品は大幅に進化しましたが、概念的なデザインはそのままです。なぜなら、部品だけでは達成できない結果を生み出すからです。

同様に、コンピューティングにおいても、進歩はシステム思考に多くを負っています。1945年、数学者のジョン・フォン・ノイマンは、メモリ、入力、出力、制御、および処理を統合したアーキテクチャを構築し、計算問題を解決するためのものとしました。このシステムこそが、現代のコンピューティングの基礎となりました。78年後、技術は大きく異なっていますが、フォン・ノイマンの原則はほぼそのままです。現在のはるかに強力なコンピュータは、1940年代の祖先と構造的に似ているのです。なぜなら、部品だけではなく、アーキテクチャが現実世界の問題を解決する方法を形作るからです。

The von Neumann architecture (source Wikipedia)

私たちは言語モデルの台頭により、再考の時期に差し掛かっています。しかし、それに入る前に、私たちが取り組んでいるものを見てみましょう。

シンボリックとサブシンボリック

私たちの多くにとって、技術はコード、数字、言語などのシンボルに基づく論理的で説明可能なシステムを意味します。私たちはコンピュータに明示的なシンボルの指示を与え、それらは私たちのレシピに従って結果を決定論的に生み出します。これらのルールベースのシステムは、混沌で構造化されていないサブシンボリックなシステムの陰と対をなしています。

ニューラルネットワークなどのサブシンボリックなシステムは、生物学的な神経細胞の分散的で並列な性質を模倣しています。個々のノードの協調しない活動から答えが出現し、蟻が単純なパターンに従って群れを形成するのと同様です。シンボリックなシステムが人間の論理によって作り出されるのに対し、サブシンボリックなシステムは自らパターンを識別し、ぼんやりとした関連付けを行います。その結果は、シンボリックで透明性のあるプロセスと比べて、魔法のように見えますが、不透明です。

それでも、私たちの心はこれらの二重のモードを結びつけます。シンボリックな能力によって、私たちはルールを作り、それに従い、論理的な議論を構築し、言語を通じて明確にコミュニケーションを行うことができます。サブシンボリックな能力によって、私たちは顔を認識し、感情を感じ取り、混沌とした物理的な世界をスムーズに移動することができます。

四角い穴。丸い穴。

私たちの規則に縛られた世界は、乱暴な異邦人と出会いました – 大規模言語モデル(LLM)。私たちは技術が論理的に振る舞い、一貫した結果を生み出すことを求めますが、LLMは確率的に考え、私たちが行き詰まりとみなす場所で可能性を見つけます。私たちは彼らの創造性を幻覚だとして退け、シンボリック思考の四角いレンズを通して判断します。しかし、未来は、シンボリックとサブシンボリックの両方を点火できるエンジンを求めており、そのエネルギーを利用して新たな計算の高みに駆り立てる必要があります。

幸いなことに、科学者たちは長い間これに取り組んできました。誰もが機械を人間のように行動させる方法の謎を解きたいと思うでしょう。

認知アーキテクチャ

1950年代以来、研究者たちは「認知アーキテクチャ」を追求してきました – 幅広く推論し、洞察を得て、変化に適応し、自分自身の思考についても反省することができるシステムです。

数十年にわたる研究の結果、認知アーキテクチャは300以上の提案に広がりました。KosterubaとTsotsosのレビューでは、84のアーキテクチャを分析し、タクソノミーに分類しました。それらのアーキテクチャは、生物学に触発されたニューラルネットワークから剛直なシンボルルールシステムまで、多くのハイブリッドなものが含まれていました。

Taxonomy of Cognitive Architectures: Source Kosteruba & Tsotsos

認知の共通モデル

幸いにも、これらのすべてのモデルを解析する必要はありません。2017年、ジョン・レアードと同僚は、「心の標準モデル」という共通の枠組みを提案し、これらのアーキテクチャについて議論するための基盤を提供しました。彼らのモデルは、以下の3つの先駆的なアーキテクチャからの重要な概念を統合しています:

  • 1976年以来、ジョン・アンダーソンによって開発されたACT-Rは、手続き的および宣言的なメモリを通じて認知をモデル化しています。手続き的メモリはスキルやルーチンをエンコードし、宣言的メモリは事実を格納します。ACT-Rは、「それを知っている」と「それをどうするかを知っている」という相互作用によって知的な行動が可能になることを示しています。
  • 1980年代にジョン・レアードによって作成されたSoarは、知覚、学習、計画、問題解決、意思決定をカバーする統一されたルールベースのシステムを提供します。「プロダクション」は、作業メモリ上で動作する条件-アクションルールとして知識を表します。Soarは、プロダクションを動的に追跡することにより、柔軟で目標指向の能力をシミュレートします。
  • 1988年にポークとニューエルによって考案されたSigmaは、心を非同期な振る舞いの社会と見なしています。精神モジュールはメッセージを送り合い、他の振る舞いをトリガーし、欲求が満たされるか放棄されるまで続きます。この「振る舞いの生成と管理」のループによって、複雑で適応的な行動が生まれます。

心の標準モデルは、3つの相互作用するメモリシステムで構成されています:

宣言的メモリは、私たちの知識ベースであり、意識的に宣言できる事実や概念を格納します。お気に入りの色や歴史的な出来事、交通標識、語彙などの情報を保持します。宣言的メモリは思考の原材料を提供し、他のシステムがそれに依存します。

手続き的メモリは、行動を可能にする「どのようにすればいいか」の知識、つまりスキルやルーチンをエンコードします。自転車に乗る、靴を結ぶ、楽器を演奏するなどが可能になります。手続き的メモリは知識を行動に翻訳します。

作業メモリは、一時的に情報を保持し操作する私たちのメンタルな作業スペースです。計画、問題解決、意思決定を可能にします。数学の問題を解く場合、作業メモリは数字、演算、中間ステップを保持し、解が出るまで統合します。宣言的メモリと手続き的メモリからの知識のアクセスと適用を統合します。

このモデルでは、コントローラーは存在せず、代わりに「認知サイクル」によって駆動されます。コンピュータのクロックサイクルのように、この「認知サイクル」はゴールを達成するための手続きを実行することでシステムの動作を駆動します。

たとえば、車を運転するには:

  • 交通標識、操作、経路の宣言的知識
  • 運転のための手続き的スキル
  • 瞬時に状況を監視し反応するための作業メモリ

言語モデルを心の標準モデルに統合する

現在の言語モデルのブーム以前に、標準モデルは主要な機能を明確にしました。まだ初期段階ですが、現在のエージェントフレームワーク(AutoGPT、BabyAGIなど)は、これらの機能のいくつかを実現しています。

これらのフレームワークでは、独立したメモリモジュールではなく、ベクトル検索を介して外部の知識源にアクセスします。知覚および運動モジュールはAPI呼び出しやプラグインとして実装されます。言語モデルのコンテキストウィンドウは一時的な作業メモリとなります。

まだ課題となっているのは、堅牢な学習です。現在のシステムには、経験から持続的に知識とスキルを蓄積するメカニズムが欠けています。代わりに、プロンプトとモデルの調整に頼っています。次のブレークスルーは、相互作用からの持続的な学習を可能にするメカニズムを統合することであり、知識とスキルを飛び跳ねながら蓄積する人間の心のようになるでしょう!

進歩のための新しいレシピ? 認知アーキテクチャの創造

今日、私たちは言語モデル、ベクトル検索、APIなどの新しい要素と、認知アーキテクチャからの知性の古いレシピを手に入れています。これらを混ぜ合わせて、単一の部分を超える能力を持つ新しいシステムにすることができるかどうかはまだ明確ではありません。フォン・ノイマンのコンピューティングフレームワークや内燃機関のように、歴史は耐久性のあるレシピの例を提供しています。しかし、ビジョナリーなレシピには、多くの失敗作が存在しました。

一つは明確です。この新しい「認知エンジン」を見つけ出せば、これまでのどの技術よりも進歩を大いに推進するでしょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

黄さんの法則に留意する:エンジニアたちがどのように速度向上を進めているかを示すビデオ

話の中で、NVIDIAのチーフサイエンティストであるビル・ダリー氏が、モーアの法則時代後のコンピュータパフォーマンスの提供...