「LLM-AUGMENTERに会いましょう:Microsoft Researchのアーキテクチャーによる、LLMをメモリ、知識、外部のフィードバックで拡張する手法」

Introducing LLM-AUGMENTER Microsoft Research's method of expanding LLM with memory, knowledge, and external feedback.

新しいフレームワークは、本番向けのLLMソリューションの参考として利用できます。

Midjourneyを使用して作成

最近、AIに特化した教育ニュースレターを開始しました。すでに16万人以上の購読者がいます。TheSequenceは、5分で読み終わるML志向のニュースレターで、ハイプやニュースなどは一切ありません。機械学習プロジェクト、研究論文、概念の最新情報を提供することを目指しています。ぜひ以下のリンクを購読して試してみてください。

TheSequence | Jesus Rodriguez | Substack

機械学習、人工知能、データの最新動向を把握するのに最適な情報源

thesequence.substack.com

ChatGPTなどのLarge Language Models(LLM)の印象的な能力は広く認識されています。これらのモデルは、流暢で一貫性があり、情報量の多い自然言語テキストを生成することに優れています。その優れたパフォーマンスは、エンコードされた世界の知識の豊富さと、それからの一般化能力によるものです。しかし、LLMの知識エンコーディングは損失しやすく、一般化の過程で「メモリのゆがみ」が生じる可能性があります。その結果、これらのモデルはしばしば幻覚を起こし、重要なタスクに展開された場合に問題が生じることがあります。さらに、モデルのサイズの指数関数的な成長にもかかわらず、LLMは多くのアプリケーションで必要なすべての情報をエンコードする能力を持っていません。例えば、現実世界の状況の動的性は、ニュースの質問応答のような時間的に敏感なタスクでは、LLMがすぐに時代遅れになる原因となります。また、多くの専有データセットはプライバシーの問題からLLMのトレーニングにはアクセスできません。最近、マイクロソフトリサーチは、外部の知識と自動フィードバックでLLMを強化するためのフレームワークであるLLM-AUGMENTERを紹介する論文を発表しました。

機能的には、LLM-AUGMENTERは知識の拡張とメモリを組み合わせた一貫したアーキテクチャです。次の図は、サッカーシナリオの文脈でLLM-AUGMENTERを示しています。ユーザーのクエリ(例:2013年のロサンゼルスギャラクシーに関する選手移籍についての質問)が提示されると、LLM-AUGMENTERは証拠を取得します…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

「マイクロソフトの研究者がSpeechXを紹介:ゼロショットのTTSと様々な音声変換タスクに対応する多目的音声生成モデル」

テキスト、ビジョン、音声など、複数の機械学習アプリケーションは、生成モデルの技術において急速かつ重要な進展を遂げてき...

データサイエンス

「枝は何も必要ありません:私たちの主観的なMLバージョニングフレームワーク」

「Gitブランチを使用したMLプロジェクトのバージョニングを簡素化し、ワークフローをシンプルにし、データとモデルを整理し、...

機械学習

ChatGPT APIへの適切な方法での通話の作り方

「LLMsは今や至る所に存在していますが、特にChatGPTはその中でも非常に多くのアプリケーションが構築されていますもしまだ試...

データサイエンス

合成データのフィールドガイド

データを扱いたい場合、どのような選択肢がありますか?できるだけざっくりした回答をお伝えします実際のデータを入手するか...

コンピュータサイエンス

「生成AI」の「スーパーユーザー」に出会ってください:Gen Zの70%がGenAIを使用しています

Salesforceの調査によると、年齢と雇用状況はAIの導入における主要な要素です

AI研究

「トランスフォーマーは長い入力をどのように扱うのか?CMUとGoogleの研究者が新しいアプローチを発表(FIRE):相対位置エンコーディングのための機能的補間」

Transformerベースの言語モデルは、近年、自然言語処理(NLP)の領域を引き上げてきました。人間らしいテキストを理解し生成...