Eleuther AI Research Groupが、Classifier-free Guidance(CFG)がLLMsとどのように組み合わされるかを実証しました

Eleuther AI Research Groupが、Classifier-free Guidance(CFG)がLLMsと組み合わせる方法を実証しました

最近、巨大な言語モデルは印象的な生成能力を示し、様々な問題に対応することができるようになりました。通常、タスクの指示や文脈、または少数のサンプルを使用して、生成を条件付けるために「プロンプティング」が使用されます。しかし、小さなモデルでは特に、幻覚、劣化、迷走などの問題が言語生成において観察されています。この問題に対処するために、指示の微調整や強化学習などのいくつかの解決策が提案されています。しかし、高いコンピューティングとデータの要件のため、これらの方法を利用できるのはすべてのユーザーではありません。

EleutherAIの研究グループは、プロンプトの形でユーザーの宣言された意図により大きな重みを置く推論アプローチを提案しています。彼らの最近の研究では、推論時にプロンプトにより重みを加えることで、生成の一貫性を改善することを提案しています。

テキストから画像への生成でも同じ問題が存在することが示されています。通常の推論手法では、珍しいまたは特殊な刺激に対して重要な詳細を見落とす場合があります。出力画像に所望の特性を促すために別個の分類器を使用することが提案され、拡散モデルの生成品質が向上するとされています。後に、分類器を完全に廃止し、代わりに生成モデルを暗黙の分類器として使用するClassifier-Free Guidance (CFG) が開発されました。

テキストから画像生成の成功から着想を得て、研究者たちはCFGを単一モーダルのテキスト生成に使用するために改変し、モデルの入力に適合させることを示しています。研究では、テキスト生成ではCFGをそのまま使用できる一方、テキストから画像を生成するモデル(主に拡散モデルを使用する)はCFGを活用するために条件付きドロップアウトをトレーニングする必要があることを示しています。この研究は、シンプルな一回のプロンプトから複雑なチャットボットスタイルのプロンプトまで、さまざまなプロンプティング手法におけるアライメントの向上にCFGを使用する方法を示しています。

研究者たちはCFGを言語モデリングに適用する方法論を開発し、業界標準のベンチマークで大幅な改善を実証しています。基本的なプロンプト、チェーンプロンプティング、長文プロンプティング、チャットボットスタイルのプロンプティングは、これらのベンチマークによって捉えられます。具体的には、LLaMA-7BはPaLM-540Bを上回り、LAMBADAでSOTAとなる方法を可能にします。

LMのロジット分布を変更しようとする推論手法のコレクションが増えていますが、この研究はそれらにうまく適合しています。結果は、CFGの倍増した推論FLOPが、モデルの性能をおおよそ2倍にすることを示しています。これにより、より複雑で実行コストの低いモデルを、よりパワフルではないハードウェア上で実行するための道が開かれます。

ネガティブなプロンプトを使用することで、CFGのどの特徴を強調するかをより細かく制御することができます。結果は、75%の人がGPTを標準のサンプル方法よりも好むことを示しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

マシンラーニングにとっての「最悪のシナリオを防ぐ競争」

A.I.企業は、児童性的虐待物資の作成や流通を阻止する面で優位に立っています彼らは、ソーシャルメディア企業が失敗したこと...

データサイエンス

「ChatGPTにおける適切なプロンプト設計の必須ガイド」

「Prompt Engineering」に没頭して、急速に成長しているChatGPTユーザーベースに与える影響に焦点を当てた詳細なガイドで、プ...

AI研究

中国の研究者たちは、RetriKTと呼ばれる新しい圧縮パラダイムを導入しました:大規模な事前学習済み言語モデルの実世界アプリケーションへの展開を革命化するものです

自然言語処理(NLP)のアプリケーションでは、事前学習済み言語モデル(PLMs)であるBERT/RoBERTaを含む、卓越したパフォーマ...

人工知能

2023年のトップビジネスインテリジェンスツール

トップのビジネスインテリジェンスソリューションは、データの洞察を見つけ、ステークホルダーに効果的に伝えることを容易に...

コンピュータサイエンス

「欧州宇宙機関は、AIが衛星ナビゲーション能力を向上させると述べています」

「欧州宇宙機関は、AIおよび機械学習がNAVISPプログラムの衛星航法性能を向上させるために導入されていると述べています」

機械学習

あなたのポケットにアーティストの相棒:SnapFusionは、拡散モデルのパワーをモバイルデバイスにもたらすAIアプローチです

拡散モデル。AI領域の進歩に注目している場合、この用語については多く聞いたことがあるでしょう。それらは生成型AI手法の革...