Gradient Checkpointing、LoRA、およびQuantizationを使用して、単一のGPUにLLMをフィットさせてください

Gradient Checkpointing、LoRA、Quantizationを使って、単一のGPUにLLMをフィットさせてください

大規模な言語モデルの微調整を試みたことがある人は、GPUメモリを扱うのがいかに困難かを知っています。

「ランタイムエラー:CUDAエラー:メモリ不足」

このエラーメッセージは私の夜を悩ませています。

3B、7B、または13Bのパラメータモデルは大きく、微調整は時間がかかります。トレーニング中にメモリが不足すると、イライラする上にコストがかかることもあります。

しかし、心配しないでください、私が手助けします!

この記事では、次の3つのテクニックを使って、知っておく必要があるか、既に使っているかもしれない方法について説明します:Gradient Checkpointing、Low-Rank Adapters、およびQuantization

これらは、トレーニング中にメモリが不足するのを防ぎ、多くの時間を節約するのに役立ちます。

もしLLMの微調整に慣れていない場合は、私がBloom-3Bを「指輪物語」の本に対して微調整する過程を解説した記事があります。

個人データでLLMを微調整:「指輪物語」のストーリーテラーを作ろう

個人データでLLMを微調整できるようになりました。個人情報を管理しながらコントロールを維持できます…

VoAGI.com

さあ、始めましょう!

Amritanshu Sikdar氏の写真(Unsplash)

Gradient Checkpointing

Gradient Checkpointingは、ニューラルネットワークのトレーニング中に、最小限の層のみを保持するために動的計算を使用する技術です。

このプロセスを理解するためには、逆伝播がどのように行われ、プロセス全体でレイヤーがGPUメモリに保存されるかを理解する必要があります。

フォワードとバックワード伝播の基礎

フォワード伝播とバックワード伝播は、ディープニューラルネットワークのトレーニングの2つのフェーズです。

3Blue1Brown Youtubeチャンネルより

フォワードパスでは、入力がベクトル化され(画像をピクセルに変換し、テキストを埋め込みに変換する)、各要素は線形積和と活性化の連続を通じてニューラルネットワーク全体で処理されます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...

人工知能

『ジュリエット・パウエル&アート・クライナー、The AI Dilemma – インタビューシリーズの著者』

『AIのジレンマ』は、ジュリエット・パウエルとアート・クライナーによって書かれましたジュリエット・パウエルは、著者であ...

人工知能

「Ami Hever、UVeyeの共同創設者兼CEO - インタビューシリーズ」

עמיר חבר הוא המנכל והמייסד של UVeye, סטארט-אפ ראיה ממוחשבת בלמידה עמוקה, המציבה את התקן הגלובלי לבדיקת רכבים עם זיהוי...

機械学習

もし芸術が私たちの人間性を表現する方法であるなら、人工知能はどこに適合するのでしょうか?

MITのポストドクターであるジヴ・エプスタイン氏(SM '19、PhD '23)は、芸術やその他のメディアを作成するために生成的AIを...

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...

人工知能

スコット・スティーブンソン、スペルブックの共同創設者兼CEO- インタビューシリーズ

スコット・スティーブンソンは、Spellbookの共同創設者兼CEOであり、OpenAIのGPT-4および他の大規模な言語モデル(LLM)に基...