GPU を最大限に活用せずに LLM を微調整する

GPUを活用しないでLLMを微調整する

限られたハードウェアと予算でLLMを微調整する方法

Image by Author: Generated with Midjourney

ユーザー定義のLLMの需要

ChatGPTの成功により、ユーザー定義の大規模言語モデルの需要が急増しています。

ただし、これらのモデルは非常に大きいため、予算が限られたビジネスや研究者、または趣味のある人々が自分のデータセットにカスタマイズすることは困難でした。

しかし、パラメータ効率の良い微調整(PEFT)手法の革新により、比較的低コストで大規模言語モデルを微調整することが完全に可能になりました。この記事では、Google Colabでこれを実現する方法を示します。

この記事は、実践者、趣味のある人、学習者、さらにはハンズオンのスタートアップ創業者にとっても有益な情報となることを予想しています。

ですので、安価なプロトタイプを作成したり、アイデアをテストしたり、他の人と差別化されたクールなデータサイエンスプロジェクトを作成したい場合は、読み続けてください。

なぜ微調整を行うのか

企業はしばしばプライベートなデータセットを使用してプロセスを推進しています。

例を挙げると、私は銀行で働いていましたが、お客様の苦情をExcelスプレッドシートに記録していました。アナリストはこれらの苦情を報告目的で分類するために責任を持っていましたが、手作業での作業であり、時間がかかり、ヒューマンエラーのリスクがありました。

もしリソースがあれば、大規模言語モデルを微調整してこの分類作業を自動化し、不正確な分類の割合を減らすことができたでしょう。

この例に触発され、この記事の残りの部分では、金融製品およびサービスに関する消費者の苦情を分類するためのLLMを微調整する方法を示します。

データセット

このデータセットには、金融サービスおよび製品に関する実際の消費者の苦情データが含まれています。これは、Consumer Financial Protection Bureauによって公開されたオープンな公開データです。

約12万件の匿名化された苦情があり、約214の「サブイシュー」に分類されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「15Rockの共同創業者兼CEO、ガウタム・バクシ氏によるインタビューシリーズ」

「ガウタム・バクシは、気候リスク管理とアドバイザリーサービスのグローバルリーダーである15Rockの共同創設者兼CEOですガウ...

機械学習

「Prolificの機械学習エンジニア兼AIコンサルタント、ノラ・ペトロヴァ – インタビューシリーズ」

『Nora Petrovaは、Prolificの機械学習エンジニア兼AIコンサルタントですProlificは2014年に設立され、既にGoogle、スタンフ...

AIテクノロジー

「LXTのテクノロジーバイスプレジデント、アムル・ヌール・エルディン - インタビューシリーズ」

アムル・ヌール・エルディンは、LXTのテクノロジー担当副社長ですアムルは、自動音声認識(ASR)の文脈での音声/音響処理と機...

人工知能

「トリントの創設者兼CEO、ジェフ・コフマンへのインタビューシリーズ」

ジェフ・コーフマンは、ABC、CBS、CBCニュースで30年のキャリアを持った後、Trintの創設者兼CEOとなりましたジェフは手作業の...

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...

人工知能

「サティスファイラボのCEO兼共同創設者、ドニー・ホワイト- インタビューシリーズ」

2016年に設立されたSatisfi Labsは、会話型AI企業のリーディングカンパニーです早期の成功は、ニューヨーク・メッツ、メイシ...