「MetaGPTと出会ってください:GPTをエンジニア、建築家、マネージャに変えるオープンソースAIフレームワーク」

MetaGPT An Open-Source AI Framework that Transforms GPT into Engineers, Architects, and Managers

大規模言語モデル(LLM)ベースのマルチエージェントシステムは、人間の操作を模倣し、改善するための非常に優れた機会を持っています。しかし、最近の研究によって示されるように、現行のシステムは現実世界の応用に存在する複雑さにおいてより正確である必要がある場合があります。これらのシステムは、口頭やツールベースのやり取りを通じて建設的な協力を促進するための支援が主に必要であり、これにより、連続した非生産的なフィードバックループを減らし、実りのある協力的な相互作用を促進することが困難になります。多様なプロセスが効果的になるためには、よく構造化された標準化された作業手順(SOP)が必要です。実世界の実践に対する徹底的な認識と統合が重要です。

これらの一般的な制約を解決し、これらの知見を取り入れることで、LLMベースのマルチエージェントシステムの設計と構造を改善し、その効果と応用を向上させることが重要です。また、広範な共同プラクティスを通じて、人々はさまざまな分野で一般的に認識されているSOPを作成してきました。これらのSOPは、効果的な作業の分解と調整を容易にするために不可欠です。たとえば、ソフトウェアエンジニアリングにおけるウォーターフォールプロセスは、要件分析、システム設計、コーディング、テスト、成果物のための論理的なステップを確立します。

この合意形成ワークフローの助けを借りて、いくつかのエンジニアが生産的に協力することができます。また、人間の仕事には、それぞれの職務に適した専門的な知識があります。ソフトウェアエンジニアはプログラミングスキルを使ってコードを作成し、プロダクトマネージャーは市場調査を行って顧客の要求を特定します。協力は通常の出力から逸脱し、組織化されなくなります。たとえば、プロダクトマネージャーは、ユーザーの要望、市場のトレンド、競合する製品に関する徹底的な競争調査を実施し、開発を推進するために製品要件文書(PRD)を作成する必要があります。これらの分析には、明確で標準化された形式と優先順位付けられた目標が必要です。

これらの規範的なアーティファクトは、異なる役割からの関連する貢献を要する複雑な多様なプロジェクトの進展には欠かせません。これらは共同理解を具体化します。したがって、関連する役割に基づいた行動の仕様を使用してSOPをコーディングします。第三に、情報の交換を容易にするために、エージェントは標準化されたアクションの出力を作成します。MetaGPTは、人間の専門家が交換するアーティファクトを形式化することで、相互依存するジョブ間の調整を合理化します。エージェントは、活動とツールやリソースの共有に対する洞察を提供する共有環境によって接続されます。エージェント間のすべての通信は、この環境に含まれています。また、すべての協力記録が保存されるグローバルメモリプールも提供され、エージェントは必要なデータに対して購読または検索することができます。エージェントは、このメモリプールから以前のメッセージを取得してより多くの文脈を把握することができます。

対話を通じて情報を受動的に吸収するのではなく、このアーキテクチャはエージェントが積極的に関連する情報を観察し、引き出すことができるようにします。この設定は、チームワークを奨励する実際の職場に見られるシステムを模倣しています。彼らは、小規模なゲームの制作からより複雑な大規模なシステムまでを包括する、共同ソフトウェア開発のワークフローや関連するコード実装実験を表示して、そのアーキテクチャの効果を示しています。MetaGPTは、GPT-3.5やAutoGPT、AgentVerseなどのオープンソースフレームワークよりもはるかに多くのソフトウェアの複雑さを管理します。

さらに、MetaGPTは、自動的なエンドツーエンドのプロセス全体で要件書類、設計アーティファクト、フローチャート、およびインターフェース仕様を生成します。これらの中間の標準化された出力は、最終的なコードの実行の成功率を大幅に向上させます。自動生成されたドキュメンテーションのおかげで、人間の開発者は迅速に学習し、自分の専門知識を向上させて要件、設計、およびコードをさらに改善することができます。また、より洗練された人間-AIの相互作用が可能になります。結論として、彼らはさまざまなソフトウェアプロジェクトについての包括的な研究によってMetaGPTの妥当性を検証しています。

MetaGPTの役割ベースの専門家エージェント協働パラダイムによって可能になる可能性は、量的なコード生成のベンチマークとプロセス全体の出力の質的評価を通じて示されています。要するに、彼らは主に以下のような貢献をしました:

• 役割定義、タスクの分解、プロセスの標準化などを含む、新しいメタプログラミングメカニズムを設計しました。

• 彼らは、人間のSOPをLLMエージェントにエンコードし、複雑な問題解決の能力を根本的に拡張するためのLLMベースのマルチエージェント協調フレームワークであるMetaGPTを提案しています。

• AutoGPT、AgentVerse、LangChain、およびMetaGPTを使用して、CRUD2コード、基本的なデータ分析ジョブ、およびPythonゲームの開発について広範なテストを行っています。

このようにして、MetaGPTはSOPを利用して複雑なソフトウェアを作成することができます。全体の結果は、MetaGPTがコードの品質と予測されるプロセスとの適合性の点で、競合他社を大幅に上回っていることを示しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

データ・コモンズは、AIを使用して世界の公共データをよりアクセスしやすく、役に立つものにしています

「データコモンズ」についての説明これは、Googleが公に利用可能なデータを社会的な課題の解決に取り組む人々により有益にす...

機械学習

「仕事は続けられますが、同じ仕事ではありません」

「AIが私たちのコーディングスキルに迫っている一方で、人間の言語を完全に習得したわけではありませんそれが私たちの競争上...

データサイエンス

『自分のデータでChatGPTを訓練する方法:ソフトウェア開発者向けガイド』

「MEMWALKERとの対話型リーディングにより、AIモデルの強化が行われ、より豊かで文脈を理解した対話が可能となり、現代のAIの...

データサイエンス

「テーマパークのシミュレーション:Rを使って待ち時間を理解する」

長い列はいつも嫌なものです、特に宇宙を舞い上がるか、グレート・バリア・リーフを航行するために待っている時には夏休みが...

機械学習

インフレクション-2はGoogleのPaLM-2を超える:AI言語モデルのブレークスルー

In a groundbreaking announcement, Inflection AI, the creators of the popular PI AI Personal Assistant, unveiled their...

機械学習

「人物再識別入門」

「人物再識別」は、異なる非重複カメラビューに現れる個人を識別するプロセスですこのプロセスは、顔認識に頼らずに、服装を...