このAI論文は、自律言語エージェントのためのオープンソースのPythonフレームワークである「Agents」を紹介しています

This AI paper introduces Agents, an open-source Python framework for autonomous language agents.

カスタマーサービス、コンサルティング、プログラミング、執筆、教育などのタスクでは、言語エージェントは人間の労力を削減することができ、人工一般知能(AGI)に向けた潜在的な第一歩となります。AutoGPTやBabyAGIなどの言語エージェントの潜在能力を示す最近のデモンストレーションは、研究者、開発者、一般の観客から多くの注目を浴びています。

経験豊かな開発者や研究者でも、これらのデモやリポジトリのほとんどは、エージェントをカスタマイズ、設定、展開するのに適していません。これは、これらのデモンストレーションが、言語エージェントの潜在能力を強調する概念実証の一環であり、徐々に開発およびカスタマイズ可能なフレームワークではないためです。

さらに、研究によると、これらのオープンソースソースの大多数は、ジョブの分解、長期記憶、ウェブナビゲーション、ツールの使用、複数エージェントの通信など、基本的な言語エージェントの機能のほんの一部しかカバーしていないことがわかっています。また、現在使用されている言語エージェントフレームワークのほとんど(もしくはすべて)は、短いタスクの説明とLLMの計画と行動能力に完全に依存しています。異なる実行間での高いランダム性と一貫性のため、言語エージェントは修正や微調整が困難であり、ユーザーエクスペリエンスが低いです。

AIWaves Inc.、浙江大学、ETH Zürichの研究者は、LLMを活用した言語エージェントをサポートするオープンソースの言語エージェントライブラリおよびフレームワークであるAGENTSを提案しています。AGENTSの目標は、言語エージェントのカスタマイズ、調整、展開を可能な限り簡単にすることです。非専門家でも利用できるようにする一方で、プログラマーや研究者にとっても拡張性のあるプラットフォームであることも重要です。ライブラリは以下のコア機能も提供しており、これらを組み合わせることで柔軟な言語エージェントのプラットフォームとなっています。

長短期記憶:AGENTSはメモリコンポーネントを組み込み、言語エージェントがスクラッチパッドを使用して短期作業メモリを定期的に更新し、VectorDBと意味検索を使用して長期記憶を保存および取得することができます。ユーザーは設定ファイルのフィールドに値を入力するだけで、エージェントに長期記憶、短期記憶、または両方を与えるかどうかを決定できます。

ウェブナビゲーションとツールの使用:外部ツールの使用とインターネットの閲覧能力は、自律エージェントのもう一つの重要な特性です。AGENTSはいくつかの一般的に使用される外部APIをサポートし、他のツールを簡単に組み込むための抽象クラスを提供しています。ウェブ検索とナビゲーションを特殊なAPIとして分類することにより、エージェントがインターネットを閲覧し情報を収集することも可能にしています。

複数エージェントの相互作用:AGENTSはカスタマイズ可能なマルチエージェントシステムとシングルエージェントの機能を許可しており、ゲーム、社会実験、ソフトウェア開発など、特定のアプリケーションに有用です。AGENTSの「動的スケジューリング」機能は、マルチエージェント間の通信において新しい機能です。動的スケジューリングにより、コントローラーエージェントが「モデレーター」として機能し、役割と最近の履歴に基づいて次のアクションを実行するエージェントを選択することができます。動的スケジューリングを使用すると、複数のエージェント間でより柔軟かつ自然なコミュニケーションが可能です。開発者は設定ファイルでコントローラーのルールを定義することで、コントローラーの動作を簡単に変更できます。

人間とエージェントの相互作用:AGENTSは単一エージェントおよびマルチエージェントのシナリオで、1人以上の人間と言語エージェントの相互作用とコミュニケーションを可能にします。

制御性:AGENTSは、標準的な作業手順(SOP)として知られる象徴的な計画を使用して、制御可能なエージェントの開発に革新的なパラダイムを提供します。SOPは、エージェントがタスクを実行する際に直面するさまざまな状況と、状態間の遷移ルールを記述したグラフです。AGENTSのSOPは、特定の活動や手順を実行する方法を詳細に指定した、手作業で記録された詳細な指示の集合です。これは現実の世界のSOPに似ています。LLMは、ユーザーが個別に変更および微調整しながらSOPを生成することができます。展開後、エージェントは各状態に対して設定された指示と基準に従って動作し、外部の世界、人々、他のエージェントとの相互作用に応じて現在の状態を動的に変更します。象徴的な計画の登場により、エージェントの振る舞いに対して細かい制御を提供し、安定性と予測性を向上させ、調整とエージェントの最適化を容易にします。

チームは、AGENTSが言語エージェントの研究者にとって研究をより容易にし、言語エージェントを活用したアプリケーションを作成する開発者にとっても便利になり、非技術的なユーザーでも独自の言語エージェントを作成および変更できるようになることを望んでいます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

デューク大学の研究者たちは、ポリシーステッチングを提案していますこれは、ロボットとタスクの新しい組み合わせにおけるロボットの転送学習を容易にする、画期的なAIフレームワークです

ロボット工学では、環境の変化やロボット構造の変更に敏感なスキルをロボットに教えるために、強化学習(RL)を使用する際に...

人工知能

「Bard」を活用するための10の役立つ方法

「アイデアのブレストから旅行のスケジュール作成まで、Bardがあなたの仕事を手助けする10の方法をチェックしてみてください」

機械学習

「NVIDIAのグレース・ホッパー・スーパーチップがMLPerfの推論ベンチマークを席巻する」

MLPerf業界ベンチマークに初登場したNVIDIA GH200 Grace Hopperスーパーチップは、すべてのデータセンターインファレンステス...

データサイエンス

機械学習を直感的に理解する

確かに、ChatGPTのようなモデルの実際の理論は認めるには非常に難しいですが、機械学習(ML)の根底にある直感は、まあ、直感...

機械学習

MITの新しいAI研究は、深層ニューラルネットワークが私たちとは異なる方法で世界を見ていることを示しています

人間の感覚システムの複雑な機能を模倣することを目指して、神経科学と人工知能の研究者は、計算モデルと人間の知覚の間の不...

人工知能

「生成型AIのGPT-3.5からGPT-4への移行の道程」

導入 生成型人工知能(AI)領域におけるGPT-3.5からGPT-4への移行は、言語生成と理解の分野での飛躍的な進化を示しています。...