取りましょう NVIDIA NeMo SteerLMは、推論中にモデルの応答をカスタマイズすることができるようにします

NVIDIA NeMo SteerLMでモデルの応答を推論中にカスタマイズしましょう

開発者は、強力な大規模な言語モデル(LLMs)を自分たちの目的地に到達する際に、AIパワードステアリングホイールを利用して道路にしっかりと踏み入れることができます。

NVIDIA NeMo SteerLMは、会社がモデルの応答をプロダクション中にダイアルインするためにノブを定義することができるようにし、それを推論と呼ばれるプロセスとして実行できるようにします。LLMをカスタマイズするための現在の手法とは異なり、単一のトレーニングランは、何十も、または何百ものユースケースに対応できるモデルを作成し、時間とお金を節約することができます。

NVIDIAの研究者は、SteerLMを作成し、AIモデルにユーザーが関心を持つ内容、たとえば特定のユースケースや市場での従うべき道路標識やユーザー定義の属性を教えるために使用しました。これらの属性はほぼ何でも評価できます-例えば、モデルの応答の有用さやユーモアの程度などです。

1つのモデル、多岐にわたる用途

その結果、新たな柔軟性が生まれました。

SteerLMを使用すると、ユーザーは望む属性をすべて定義し、それらを1つのモデルに組み込むことができます。そして、モデルが実行されている間に、特定のユースケースに必要な組み合わせを選択することができます。

例えば、特定の会計、販売、またはエンジニアリング部門、または特定の市場の固有のニーズに合わせてカスタムモデルを調整することができます。

この方法は、継続的な改善サイクルも可能にします。カスタムモデルの応答は、将来のトレーニングランのデータとして使用でき、モデルをより有用なレベルに調整する際に役立ちます。

時間とお金の節約

これまで、特定のアプリケーションのニーズに合わせた生成型AIモデルの適合は、エンジンのトランスミッションを再構築するのと同等でした。開発者は、データセットに労力をかけてラベルを付け、たくさんの新しいコードを書き、ニューラルネットワークのパラメータを調整し、モデルを何度も再トレーニングする必要がありました。

SteerLMは、このような複雑で時間のかかるプロセスを次の3つの簡単なステップに置き換えます:

  • 基本的なプロンプト、応答、および目的の属性を使用して、これらの属性のパフォーマンスを予測するAIモデルをカスタマイズする。
  • このモデルを使用してデータセットを自動生成する。
  • 標準の監督付き微調整技術を使用してデータセットでモデルをトレーニングする。

多岐にわたる企業のユースケース

開発者は、SteerLMをテキスト生成を必要とするほとんどの企業のユースケースに適応させることができます。

SteerLMを使用することで、会社はリアルタイムに顧客の態度、人口統計情報、または状況に合わせて調整できる単一のチャットボットを作成することができます。さまざまな市場や地域で提供される顧客に合わせた独自の新しい体験を提供するためのツールとして、SteerLMはすぐれています。

SteerLMはまた、1つのLLMが企業全体の柔軟な執筆補助として機能することも可能にします。

例えば、法律関係者は、法的なコミュニケーションに対して公式なスタイルを採用するために、推論の間にモデルを変更することができます。また、マーケティングスタッフは、対象とする観客に対してより会話的なスタイルを選択することができます。

SteerLMでゲームをエンジョイ

SteerLMの潜在能力を示すために、NVIDIAはそのクラシックアプリケーションの1つ、ゲームにおいてデモンストレーションを行いました(下記の映像をご覧ください)。

現在、いくつかのゲームには、プレーヤーが制御できないキャラクター、つまりユーザーや状況に関係なく機械的に事前録音されたテキストを繰り返す非プレイアブルキャラクターが数多く存在します。

SteerLMを使用することで、これらのキャラクターはより個性的で感情的にプレーヤーのプロンプトに応えるようになります。これは、ゲーム開発者がすべてのプレーヤーに対してユニークな新しい体験を提供するために使用できるツールです。

SteerLMの誕生

新しい手法の概念は予想外にやってきました。

“ある朝早くにこのアイデアが浮かび、飛び起きてそれをメモに書きました”、NVIDIAの応用研究科学者であるYi DongはSteerLMの開発を開始したことを思い出します。

プロトタイプを作成している間に、彼は人気のあるモデル調整の手法がメソッドの一部になることに気づきました。すべての要素が一緒になり、彼の実験が成功した後、チームはこの手法を4つの簡単なステップで説明するのに役立ちました。

これは、AI研究の中でも注目されているモデルのカスタマイズの最新の進化です。

「これは挑戦のある分野であり、人間の視点により近いAIを実現するための一種の聖杯です-そして、新しい挑戦が大好きです」と、この研究者は語りました。彼はジョンズ・ホプキンズ大学で計算神経科学の博士号を取得し、金融機関で機械学習アルゴリズムに取り組んだ後、NVIDIAに参加しました。

ハンズ・オン・ザ・ホイールを手に入れましょう

SteerLMは、開発者が今日試すことができるオープンソースのソフトウェアとして利用可能です。彼らはまた、SteerLMの方法を使用してカスタマイズされたLlama-2-13bモデルでの実験の詳細 details を得ることもできます。

フルのエンタープライズセキュリティとサポートを望むユーザー向けに、SteerLMは NVIDIA NeMo に統合されます。NVIDIA NeMoは、大規模な生成AIモデルを構築、カスタマイズ、展開するための豊富なフレームワークです。

SteerLMメソッドは、Llama-2やBLOOMなど、NeMoでサポートされているすべてのモデルに対応しています。

SteerLMについて詳しく知るためには、技術ブログをお読みください。

ソフトウェア製品情報に関する notice をご覧ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

人工知能を使用した3Dモデルのカスタマイズを革新する:MITの研究者が、機能性に影響を与えずに美的な調整を行うためのユーザーフレンドリーなインターフェースを開発しました

3Dプリントとデザインにおいて、オープンソースのオンラインリポジトリから入手した3Dデザインをカスタマイズする能力は、持...

人工知能

「生成AIの規制」

生成型の人工知能(AI)が注目を集める中、この技術を規制する必要性が高まっていますなぜなら、この技術は大規模な人口に対...

機械学習

「GBMとXGBoostの違いって何だ?」

有名なアルゴリズム間の実質的な違いをご覧ください (Yūmei na arugorizumu-kan no jitsubutsuteki na chigai o goran kudasai.)

AIニュース

ケシャヴ・ピンガリ氏がACM-IEEE CSケン・ケネディ賞で表彰されました

「Pingaliさんに賞が正式に贈られるのは、11月に高性能コンピューティング、ネットワーキング、ストレージ、アナリティクスの...

機械学習

「ラマ-2、GPT-4、またはクロード-2;どの人工知能言語モデルが最も優れているのか?」

大規模言語モデル(LLMs)は、自然言語処理と自然言語理解の分野で世界的な評価を受け、非常に人気があります。これにより、...

AIテクノロジー

「AIサービスへの大胆な進出:億万長者ビンニー・バンサールの大局変革」

テクノロジーと電子商取引の世界では、Binny Bansalの名前はよく知られています。オンライン小売り大手Flipkartの共同創設者...