Eleuther AI Research Groupが、Classifier-free Guidance(CFG)がLLMsとどのように組み合わされるかを実証しました

Eleuther AI Research Groupが、Classifier-free Guidance(CFG)がLLMsと組み合わせる方法を実証しました

最近、巨大な言語モデルは印象的な生成能力を示し、様々な問題に対応することができるようになりました。通常、タスクの指示や文脈、または少数のサンプルを使用して、生成を条件付けるために「プロンプティング」が使用されます。しかし、小さなモデルでは特に、幻覚、劣化、迷走などの問題が言語生成において観察されています。この問題に対処するために、指示の微調整や強化学習などのいくつかの解決策が提案されています。しかし、高いコンピューティングとデータの要件のため、これらの方法を利用できるのはすべてのユーザーではありません。

EleutherAIの研究グループは、プロンプトの形でユーザーの宣言された意図により大きな重みを置く推論アプローチを提案しています。彼らの最近の研究では、推論時にプロンプトにより重みを加えることで、生成の一貫性を改善することを提案しています。

テキストから画像への生成でも同じ問題が存在することが示されています。通常の推論手法では、珍しいまたは特殊な刺激に対して重要な詳細を見落とす場合があります。出力画像に所望の特性を促すために別個の分類器を使用することが提案され、拡散モデルの生成品質が向上するとされています。後に、分類器を完全に廃止し、代わりに生成モデルを暗黙の分類器として使用するClassifier-Free Guidance (CFG) が開発されました。

テキストから画像生成の成功から着想を得て、研究者たちはCFGを単一モーダルのテキスト生成に使用するために改変し、モデルの入力に適合させることを示しています。研究では、テキスト生成ではCFGをそのまま使用できる一方、テキストから画像を生成するモデル(主に拡散モデルを使用する)はCFGを活用するために条件付きドロップアウトをトレーニングする必要があることを示しています。この研究は、シンプルな一回のプロンプトから複雑なチャットボットスタイルのプロンプトまで、さまざまなプロンプティング手法におけるアライメントの向上にCFGを使用する方法を示しています。

研究者たちはCFGを言語モデリングに適用する方法論を開発し、業界標準のベンチマークで大幅な改善を実証しています。基本的なプロンプト、チェーンプロンプティング、長文プロンプティング、チャットボットスタイルのプロンプティングは、これらのベンチマークによって捉えられます。具体的には、LLaMA-7BはPaLM-540Bを上回り、LAMBADAでSOTAとなる方法を可能にします。

LMのロジット分布を変更しようとする推論手法のコレクションが増えていますが、この研究はそれらにうまく適合しています。結果は、CFGの倍増した推論FLOPが、モデルの性能をおおよそ2倍にすることを示しています。これにより、より複雑で実行コストの低いモデルを、よりパワフルではないハードウェア上で実行するための道が開かれます。

ネガティブなプロンプトを使用することで、CFGのどの特徴を強調するかをより細かく制御することができます。結果は、75%の人がGPTを標準のサンプル方法よりも好むことを示しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

XGen-Image-1の内部:Salesforce Researchが巨大なテキストから画像へのモデルを構築、トレーニング、評価する方法

Salesforceは、新しい基盤モデルの最も活発な研究所の一つです最近、Salesforce Researchは、異なるドメインにわたるさまざま...

AI研究

AIを利用して、科学者たちは、抗薬剤耐性感染症に対抗できる薬剤を発見しました

機械学習アルゴリズムは、多くの病院の環境に潜むAcinetobacter baumannii菌を殺す化合物を特定しました

人工知能

Orca LLM:ChatGPTの推論プロセスをシミュレートする

オルカは、LFMの推論過程を模倣するために学習する13BパラメータモデルですOrcaは、GPT-4からの豊富な信号を活用し、能力を向...

AIニュース

世界初のAI搭載アーム:知っておくべきすべて

人工知能がバイオニックアームを制御する世界を想像したことがありますか? スーパーヒーローの映画から出てきたコンセプトの...

データサイエンス

Novo Nordiskは、AIとライフサイエンスの交差点で働くMITのポストドクトラルフェローを支援する予定です

MIT-ノボ・ノルディスク人工知能ポスドクフェローシッププログラムは、5年間で年間最大10名のポスドクをサポートします

AI研究

「NYUとGoogle AIの研究者が、機械学習の先進的な演繹的推論のフロンティアを探る」

多くの割引ルールの使用とサブプルーフの構築により、証明の複雑さは医療診断や定理の証明などの多くの論理推論の課題におい...