ツールフォーマー:AIモデルに外部ツールの使用方法をガイドする

ツールフォーマー:AIモデルによる外部ツールの使い方をガイドする

メタのLLMは外部APIを呼び出す方法を自己学習する

Image created by author using Midjourney

今やダストが落ち着いたため、LLMの弱点はわかっています。

パワフルなGPT-4ですら、数学の計算に苦労します。

また、トレーニングの終了時間はすべてのLLMの固有の弱点です。新しいことに関するクエリに対して回答するのに苦労します。

緩い修正策としては、外部プラグイン(例:ChatGPTのプラグイン)を使用することです。しかし、ユーザーは一部のアクションを手動で指定する必要があり、これらのプラグインは時々信頼性に欠けることがあります。

もし、モデルが自身の弱点を認識し、不確実な場合に最適な外部ツールを「ネイティブ」に呼び出すように訓練されたモデルが存在したらどうでしょう?

それがメタが行ったことです。メタはToolFormer[1]を作成することでこれを実現しました。この記事では、以下の内容を説明します:

  • ToolFormerとは何か、なぜこれが画期的なのか
  • モデルの動作原理
  • ToolFormerの方法論がどのLLMにも適用可能な理由
  • AI研究がToolFormerのビジョンに進んでいる理由

それでは、探求していきましょう。

大規模言語モデルの弱点

ToolFormerの説明を始める前に、現代のLLMが直面する問題について考察しましょう:

  • 時間の進行:すべてのLLMにはトレーニングの終了日があります。したがって、最新情報や最近のイベントにアクセスすることができません。
  • 間違った事実:LLMは、事実、場所、イベント、製品、さらには研究論文までもでっち上げることで悪名高いです。
  • 算術演算:LLMは数学的な計算に苦労します。
  • 希少な言語:LLMは訓練データの不足により、低リソースの言語を扱うことができません。

明らかに、これらの問題は言語メカニクスとは関係ありません。理想的な解決策は、テキスト生成を外部ツールと組み合わせることです。

それがToolFormerの役割です。

ToolFormerとは何か

ToolFormerは、呼び出すべきAPI、呼び出すタイミング、および呼び出す際に渡す引数を決定するように訓練されたLLMです。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more