GPU を最大限に活用せずに LLM を微調整する

GPUを活用しないでLLMを微調整する

限られたハードウェアと予算でLLMを微調整する方法

Image by Author: Generated with Midjourney

ユーザー定義のLLMの需要

ChatGPTの成功により、ユーザー定義の大規模言語モデルの需要が急増しています。

ただし、これらのモデルは非常に大きいため、予算が限られたビジネスや研究者、または趣味のある人々が自分のデータセットにカスタマイズすることは困難でした。

しかし、パラメータ効率の良い微調整(PEFT)手法の革新により、比較的低コストで大規模言語モデルを微調整することが完全に可能になりました。この記事では、Google Colabでこれを実現する方法を示します。

この記事は、実践者、趣味のある人、学習者、さらにはハンズオンのスタートアップ創業者にとっても有益な情報となることを予想しています。

ですので、安価なプロトタイプを作成したり、アイデアをテストしたり、他の人と差別化されたクールなデータサイエンスプロジェクトを作成したい場合は、読み続けてください。

なぜ微調整を行うのか

企業はしばしばプライベートなデータセットを使用してプロセスを推進しています。

例を挙げると、私は銀行で働いていましたが、お客様の苦情をExcelスプレッドシートに記録していました。アナリストはこれらの苦情を報告目的で分類するために責任を持っていましたが、手作業での作業であり、時間がかかり、ヒューマンエラーのリスクがありました。

もしリソースがあれば、大規模言語モデルを微調整してこの分類作業を自動化し、不正確な分類の割合を減らすことができたでしょう。

この例に触発され、この記事の残りの部分では、金融製品およびサービスに関する消費者の苦情を分類するためのLLMを微調整する方法を示します。

データセット

このデータセットには、金融サービスおよび製品に関する実際の消費者の苦情データが含まれています。これは、Consumer Financial Protection Bureauによって公開されたオープンな公開データです。

約12万件の匿名化された苦情があり、約214の「サブイシュー」に分類されています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

AIニュース

OpenAIのCEOであるSam Altman氏:AIの力が証明されるにつれて、仕事に関するリスクが生じる

OpenAIのCEOであるSam Altmanは、特に彼の作品であるChatGPTに関するAIの潜在的な危険性について公言してきました。最近のイ...

人工知能

「リオール・ハキム、Hour Oneの共同創設者兼CTO - インタビューシリーズ」

「Hour Oneの共同創設者兼最高技術責任者であるリオール・ハキムは、専門的なビデオコミュニケーションのためのバーチャルヒ...

人工知能

ディープAIの共同創業者兼CEO、ケビン・バラゴナ氏- インタビューシリーズ

ディープAIの創設者であるケビン・バラゴナは、10年以上の経験を持つプロのソフトウェアエンジニア兼製品開発者です彼の目標...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...