スタンフォードの研究者たちは、DSPyを紹介します:言語モデル(LM)と検索モデル(RM)を用いた高度なタスクの解決のための人工知能(AI)フレームワーク
Stanford researchers introduce DSPy an AI framework for solving advanced tasks using Language Model (LM) and Retrieval Model (RM).
言語モデルと検索モデルを使用することで、さまざまな複雑なタスクを簡単に解決することができます。言語モデル(GPT-3など)は、受け取った入力に基づいて人間らしいテキストを生成するために設計されています。一方、検索モデルは、データベースやドキュメントのコレクションから関連する情報を取得するために使用されます。解決したいタスクを明確に定義することで、新しいテキストを生成するか、既存の情報源からデータを取得するかが決まります。
GPT-3や同様のモデルを使用する場合、タスクを説明するプロンプトを提供し、モデルに基づいてテキストを生成させる必要があります。望ましい出力を得るために、プロンプトの文言や構造を試行錯誤する必要があります。これには、言語モデルから生成されたテキストとデータベースから取得した情報を組み合わせることが含まれる場合があります。これには、取得した情報に基づいて要約や洞察を生成することも含まれます。
スタンフォード大学の研究者たちは、言語モデル(LM)と検索モデル(RM)を使用して高度なタスクを解決するためのフレームワークを構築しました。それをDSPyと呼んでいます。 DSPyには、LMをプロンプトし、微調整し、推論と検索の拡張を改善するためのさまざまな技術が含まれています。 DSPyは、Pythonicな構文を基にしており、LMへの指示のための組み立て可能で宣言的なモジュールを提供しています。
- 「ATLAS研究者は、教師なし機械学習を通じて異常検出を行い、新しい現象を探求しています」
- 「大規模な言語モデルは、多肢選択問題の選択の順序に敏感なのか」という新しいAI研究に答える
- CMU(カーネギーメロン大学)と清華大学の研究者が提案した「Prompt2Model:自然言語の指示から展開可能なAIモデルを生成する汎用メソッド」
DSPyには、プログラムの宣言的なステップを実行するためにLMをトレーニングする自動コンパイラもあります。このコンパイラは、手動で中間段階のラベルを必要とせずに、最小限のデータから微調整を行うことができます。これにより、文字列操作の代わりにモジュールとトレーニング可能なパーツの体系的な空間を使用します。
DSPyでは、書いたプログラムをコンパイルするための2つのシンプルな概念、「シグネチャ」と「テレプロンター」を使用します。シグネチャは、DSPyモジュールの入出力の動作の宣言的な仕様です。一方、テレプロンターは、任意のプログラムのモジュールに対して効果的なプロンプトを学習してブートストラップし、選択することができる強力な最適化ツール(DSPyに含まれています)です。
シグネチャは、サブタスクの最小限の説明と、LMに対して尋ねられる1つ以上の入力質問から構成されます。また、LMから期待される質問の回答も説明します。テレプロンターは、自動的な遠隔プロンプトです。他のものと比較して、DSPyは非常に少ないラベリングが必要とされると言います。ユーザーのパイプラインをサポートするために必要な中間ラベルをブートストラップします。
DSPyフレームワークは他のライブラリと大きく異なるため、使用ケースに基づいて使用するタイミングを容易に正当化できます。研究者によると、この統一されたフレームワークは、NLP/AIの研究者や新しいパイプラインや新しいタスクを探索して高度で複雑な問題を解決しようとする人にとって役立つものだと言います。使いやすくするために、インストールユーザーマニュアルが公開されています。さらに、将来的には様々な入門チュートリアルやリファレンス資料を公開する予定です。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- ETHチューリッヒの研究者が、大規模な言語モデル(LLM)のプロンプティング能力を向上させるマシンラーニングフレームワークであるGoT(Graph of Thoughts)を紹介しました
- UCSFとUC Berkeleyの研究者たちは、脳幹の脳卒中による重度の麻痺を持つ女性がデジタルアバターを通じて話すことができるようにする脳-コンピューターインタフェース(BCI)を開発しました
- DeepMindの研究者が、成長するバッチ強化学習(RL)に触発されて、人間の好みに合わせたLLMを整列させるためのシンプルなアルゴリズムであるReinforced Self-Training(ReST)を提案しました
- 「研究によると、YouTube広告が子どもたちのオンライン追跡を引き起こした可能性がある」と言われています
- 「MITの研究者たちは、人工知能(AI)の技術を開発しましたこの技術により、ロボットは手全体を使ってオブジェクトを操作するための複雑な計画を立てることが可能になります」
- 「MITのこのAI研究は、光を基にした機械学習システムがより強力で効率的な大規模言語モデルを生み出す方法を示しています」
- テンセントAIラボの研究者たちは、テキスト対応の画像プロンプトアダプタ「IP-Adapter」を開発しました:テキストから画像への拡散モデルのためのアダプタです