「ChatGPT 3.5 Turboの微調整方法」

「美容とファッションのエキスパートによる、「ChatGPT 3.5 Turbo」の微調整法」

 

もしまだ聞いていなかったら、OpenAIは最近、GPT-3.5 Turboの微調整が可能になったと発表しました。さらに、GPT-4.0の微調整も今秋後半にリリースされる予定です。特に開発者にとって、これは非常に歓迎すべきニュースとなっています。

しかし、なぜこの発表が重要だったのでしょうか?簡単に言えば、GPT-3.5 Turboモデルの微調整にはいくつかの重要な利点があります。この記事の後半でこれらの利点について探っていきますが、要するに、微調整によって開発者はモデル自体に指示を埋め込むことで、プロジェクトをより効果的に管理し、プロンプトを短縮することができます(最大90%まで)。

GPT-3.5 Turboの微調整版では、特定のタスクにおいてベースのChat GPT-3.5の機能を超えることが可能です。さらに詳しくGPT-3.5 Turboモデルを微調整する方法を見ていきましょう。

 

微調整のためのデータの準備

 

GPT-3.5 Turboのデータを微調整するための最初のステップは、JSONL形式に正しい構造で整形することです。JSONLファイルの各行には、メッセージキーとして3種類の異なるメッセージがあります:

  • 入力メッセージ(ユーザーメッセージとも呼ばれます)
  • メッセージの文脈(システムメッセージとも呼ばれます)
  • モデルの応答(アシスタントメッセージとも呼ばれます)

以下に、これらの3種類のメッセージがすべて含まれる例を示します:

{  "messages": [    { "role": "system", "content": "あなたは経験豊富なJavaScript開発者で、ミスを修正するのに長けています" },    { "role": "user", "content": "次のコードの問題を見つけてください。" },    { "role": "assistant", "content": "提供されたコードには改善できる点がいくつかあります。" }  ]}

 

データの準備が完了したら、JSONオブジェクトファイルを保存する必要があります。

 

微調整のためのファイルのアップロード

 

上記のようにデータセットを作成し保存したら、ファイルをアップロードして微調整を行う準備が整いました。

以下は、OpenAIが提供するPythonスクリプトを使用してこれを行う例です:

curl https://api.openai.com/v1/files \  -H "Authorization: Bearer $OPENAI_API_KEY" \  -F "purpose=fine-tune" \  -F "file=@path_to_your_file" 

 

微調整のジョブの作成

 

さて、ついに微調整を実行する時が来ました。再度、OpenAIがこれを行う方法の例を提供しています:

curl https://api.openai.com/v1/fine_tuning/jobs \-H "Content-Type: application/json" \-H "Authorization: Bearer $OPENAI_API_KEY" \-d '{  "training_file": "TRAINING_FILE_ID",  "model": "gpt-3.5-turbo-0613"}'

 

上記の例のように、ファイルをアップロードするためにリクエストを送信するには、「openai.file.create」を使用する必要があります。ファイルIDを保存して、将来のステップで使用することを忘れないでください。

 

微調整モデルの利用

 

ついに、微調整モデルを展開して対話する時が来ました。これはOpenAIプレイグラウンド内で行うことができます。

以下はOpenAIの例です:

<pre><code>curl https://api.openai.com/v1/chat/completions \-H "Content-Type: application/json" \-H "Authorization: Bearer $OPENAI_API_KEY" \-d '{  "model": "ft:gpt-3.5-turbo:org_id",  "messages": [    {      "role": "system",      "content": "You are an experienced JavaScript developer adept at correcting mistakes"    },    {      "role": "user",      "content": "Hello! Can you review this code I wrote?"    }  ]}'</code></pre><p> </p><p>これは新しいファインチューニングモデルと元のGPT-3.5 Turboモデルを比較する良い機会です。 </p><p> </p><h1 id="advantages-of-fine-tuning">ファインチューニングの利点</h1><p> </p><p>GPT-3.5 Turboのプロンプトをファインチューニングすることにより、モデルの品質とパフォーマンスを向上させるための3つの主な利点があります<a href="https://www.voagi.com/recomp-introduces-compression-and-selective-augmentation-to-boost-language-model-performance.html">。 モデルの品質を向上させるためのcompressLanguage>/a>とパフォーマンス。 </p><p> </p><h2 id="improved-steerability">よりステアリング性能が向上</h2><p> </p><p>これはファインチューニングが開発者に独自のモデルが特定の指示に従うようにすることを可能にするという別の方法です。例えば、モデルを<a href="https://www.voagi.com/ai-for-language-revitalization.html">異なる言語</a>(イタリア語やスペイン語など)で完成させたい場合、モデルをファインチューニングすることでそれが可能になります。出力についても同じです...</p><p> </p><h2 id="more-reliable-output-formatting">より信頼性の高い出力フォーマット</h2><p> </p><p>ファインチューニングにより、モデルは応答を一貫した方法でフォーマットする能力を向上させることができます。これは、コーディングなど、特定の形式が必要なアプリケーションにとって非常に重要です。具体的には、開発者はユーザープロンプトを<a href="https://www.voagi.com/5-essential-skills-for-swift-entry-into-industrial-engineering.html">JSONスニペットに変換される>/a>ようにモデルをファインチューニングすることができ、後でより大きなデータモジュールに組み込むことができます。 </p><p> </p><h2 id="customized-tone">カスタマイズされたトーン</h2><p> </p><p>AIモデルによって生成された出力が特定のトーンで完成することを企業が保証する必要がある場合、ファインチューニングは最も効率的な方法です。多くの企業は、コンテンツやマーケティング資料を自社のブランド声と一致させるか、顧客とより良いつながりを持つ手段として特定のトーンを持っていることを確認する必要があります。 

****[ナーラ・デイビス](http://nahlawrites.com/)****はソフトウェア開発者兼テックライターです。テクニカルライティングを専門とする前は、サムスン、タイム・ワーナー、ネットフリックス、ソニーなどのクライアントを持つInc. 5,000の体験ブランディング組織でリードプログラマーを務めた経験もあります。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

GLIP オブジェクト検出への言語-画像事前学習の導入

今日は、言語-画像の事前学習であるCLIPの素晴らしい成功を基に、物体検出のタスクに拡張した論文であるGLIPについて掘り下げ...

機械学習

「コルーチンの実行のマスタリング:UnityにおけるYield、Flow、そして実用例」となります

この包括的なガイドを通じて、Unityでの高度なコルーチンの使用方法を探求しましょうyieldingのテクニック、ゲームループの統...

データサイエンス

AIがリードジェネレーションにどのように役立つのか?

あなたのサービスや製品が優れていてもユニークであったとしても、効果的にマーケティングできなければ重要ではありません。...

データサイエンス

AIがセキュリティを向上させる方法

AIはマルウェアの検出、サイバー脅威の特定と対応、機密データの保護、そして重要なインフラストラクチャのセキュリティ向上...

データサイエンス

自律AIエージェント:データサイエンスと技術の未来を切り拓く先駆者

イントロダクション テクノロジーのダイナミックな風景において、自律型AIエージェントは変革的な存在として登場し、データと...

機械学習

「LoRAアダプターにダイブ」

「大規模言語モデル(LLM)は世界中で大流行しています過去の1年間では、彼らができることにおいて莫大な進歩を目撃してきま...