Google AIは、LLMsへの負担を軽減する新しい手法「ペアワイズランキングプロンプティング」を提案しています

Google AIは新しい手法「ペアワイズランキングプロンプティング」を提案しています

Google AIの研究者たちは、新しいアプローチであるPairwise Ranking Prompting(PRP)を提案する新しい論文を公開しました。この目標は、大規模な言語モデルがテキストのランキング問題を解決する際に直面する課題を軽減することです。GPT-3やPaLMなどのLLMは、自然言語タスクで顕著なパフォーマンスを示しており、ゼロショットの環境でも優れた結果を出しています。

しかし、テキストのランキングに関しては、既存の手法は、GPT-4などのブラックボックスシステムを除いて、訓練済みのベースラインランカーと比較して結果が出ない傾向があります。この論文では、チームはブラックボックスシステムの価値を認めつつ、コストやアクセスの制約など、学術研究者が直面する制約を強調しています。

そのため、彼らの研究では、現在のポイントワイズとリストワイズのアプローチを使用したLLMがランキング問題に苦しむ理由について探求しています。チームによると、LLMにとって、ポイントワイズの技術に対して適切な予測確率を生成することは非常に困難であるということがわかりました。

一方、リストワイズの技術は一貫性のないまたは関連性のない出力をもたらし、現在のLLMの事前学習と微調整の技術におけるランキングの認識の欠如を示しています。そのため、この制約を補うために、研究者たちはPRPパラダイムを提案しました。

この方法は、ランキングタスクのためのクエリと一対のドキュメントをプロンプトとして使用するシンプルなアーキテクチャを利用します。既存の手法とは異なり、PRPはデフォルトで生成とスコアリングのLLM APIの両方を提供し、キャリブレーションの問題に対処します。効率と効果を確保するために、いくつかのPRPのバリエーションが議論されています。

彼らは、従来のベンチマークデータセット上で、中程度のサイズのオープンソースLLMを使用してPRPを評価しました。その結果、大規模なモデルサイズを持つ商用GPT-4に基づいた以前の手法を大幅に上回る成果を収めました。

その一例がTREC-DL2020データセットです。20BパラメータのFLAN-UL2モデルに基づいたPRPは、NDCG@1において先行の最良手法と比較して5%以上の改善を達成しました。TREC-DL2019では、PRPはInstructGPTなどの既存のソリューションを上回り、ランキングの多くの尺度において10%以上の性能向上を示し、NDCG@5とNDCG@10のメトリックではGPT-4と比較してわずかな性能低下がありました。

全体的に、PRPはLLM APIのスコアリングと生成のサポート、および入力順序に対する感度の低さなど、いくつかの利点を持っています。この研究は3つの主要な貢献を示しています。まず第一に、中程度のサイズのオープンソースLLMを使用した効果的なゼロショットランキングの実証。次に、簡単なプロンプティングとスコアリングメカニズムによる最先端のランキングパフォーマンスの達成。

そして最後に、良好な経験的なパフォーマンスを維持しながら効率の向上を探求します。

編集者注:ジェネラティブAIの最新情報を学びたいですか?1日限りのジェネラティブAIサミットに参加しましょう。ハイプを超えて、この最先端技術の詳細について深く掘り下げます。無料で今すぐ登録して、ジェネラティブAIの力を解き放ちましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

コンピュータサイエンス

サイバーエキスパートたちは、2024年の米国選挙を保護するために動き出しました

「アメリカを拠点とする非営利団体である情報技術 - 情報共有および分析センターを通じて設立されたサイバーセキュリティの専...

AIニュース

良いニュース!中国とアメリカがAIの危険性について話し合っています

世界の2つの超大国の科学者たちは、AIのリスクについて懸念しており、これはグローバルな規制を開発するための橋渡しを提供す...

AI研究

『Google AI Researchが効率的な連成振動子のシミュレーションに革新的な量子アルゴリズムを導入』

古典力学は、物体の運動、それに作用する力、およびその活動に関連付けられたエネルギーについて扱います。量子力学は、物質...

機械学習

人工知能の未来を形作る:進歩と革新のための迅速なエンジニアリングの重要性

ChatGPTはリリース当日から話題になっています。革新的なチャットボットを既に100万人以上のユーザーが利用しています。ChatG...

機械学習

百度Ernie 3.5が中国語AIのチャンピオンとして登場:しかし、ChatGPTより本当に優れているのか?

中国語AI市場における興奮すべきブレークスルーとして、有名な検索エンジンプロバイダであるBaiduが最新モデルであるErnie 3....

機械学習

このAI論文では、COVEメソッドを紹介しています自己検証を通じて言語モデルの幻覚に取り組むための革新的なAIアプローチです

大量のテキストドキュメントからなるコーパスは、大規模な言語モデル(LLM)を訓練するために使用され、モデルのパラメータ数...