Google AIは、「ペアワイズランキングプロンプティング」という新しい方法を提案し、LLMsの負担を軽減することを目指しています

Google AI proposes a new method called pairwise ranking prompting to alleviate the burden of LLMs.

Google AIの研究者は、新しいアプローチである「ペアワイズランキングプロンプティング(PRP)」を提案する新しい論文を公開しました。この目標は、大規模な言語モデルがテキストのランキング問題を解決する際に直面する課題を軽減することです。GPT-3やPaLMなどのLLMは、自然言語のタスクで卓越したパフォーマンスを示しており、ゼロショット設定でも優れた結果を出しています。

しかし、テキストのランキングに関しては、既存の手法はトレーニングされたベースラインのランカーに比べて不十分な結果を残す傾向があります(GPT-4などのブラックボックスシステムを除く)。論文では、チームはブラックボックスシステムの価値を認めつつも、コストやアクセスの制約など、学術研究者が直面する制約にも言及しています。

そのため、彼らの研究では、現在のポイントワイズとリストワイズのアプローチを使用したLLMがランキング問題で苦戦する理由について探求しています。チームによると、彼らはLLMにとって、ポイントワイズのテクニックに対してキャリブレーションされた予測確率を生成することが極めて困難であることを発見しました。

一方、リストワイズのテクニックは一貫性のない結果や関連性のない出力をもたらし、現在のLLMの事前学習と微調整技術におけるランキングの意識の不足を示しています。そのため、この制約を補うために、研究者たちはPRPパラダイムを提案しました。

この方法は、ランキングタスクのプロンプトとしてクエリと2つのドキュメントを使用するシンプルなプロンプトアーキテクチャを活用しています。既存の手法とは異なり、PRPはデフォルトで生成とスコアリングのLLM APIの両方を提供し、キャリブレーションの問題に対処しています。効率と効果を確保するために、いくつかのPRPのバリエーションが議論されています。

彼らは、伝統的なベンチマークデータセットにおいて、中程度のサイズのオープンソースLLMを使用してPRPを評価しました。その結果、大規模なモデルサイズを持つブラックボックスの商用GPT-4に基づく従来の手法を大幅に上回る成果を収めました。

その一例がTREC-DL2020データセットです。20BパラメータのFLAN-UL2モデルに基づくPRPは、従来の最良の手法と比べてNDCG@1で5%以上の改善を達成しました。TREC-DL2019では、PRPはInstructGPTなどの既存のソリューションを多くのランキング指標で10%以上上回り、NDCG@5とNDCG@10のメトリックにおいてはGPT-4と比較してわずかなパフォーマンスの低下がありました。

全体として、PRPにはLLMのスコアリングと生成のためのAPIのサポート、および入力順序に対する無感覚性といういくつかの利点があります。この研究は3つの主要な貢献を示しています。まず、中程度のサイズのオープンソースLLMを使用した効果的なゼロショットランキングの実証です。次に、シンプルなプロンプティングとスコアリングメカニズムによる最先端のランキングパフォーマンスの達成です。

そして最後に、良好な経験的なパフォーマンスを維持しながら効率性の向上を探求します。

編集者の注:最新の生成AIについて学びたいですか?1日限りのジェネレーティブAIサミットに参加しましょう。ハイプを超えて、この最先端のテクノロジーに深く没頭しましょう。無料で今すぐ登録して、ジェネレーティブAIのパワーを解き放ってください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

スタビリティAIがアドバーサリアルディフュージョンディスティレーション(ADD)を導入します:最小限のステップでの高精度、リアルタイムイメージ合成の画期的な手法

生成モデリングにおいて、拡散モデル(DM)は、高品質な画像とビデオの合成を進めるための重要な役割を果たしています。拡張...

AI研究

スタンフォード大学とMilaの研究者は、多くの大規模言語モデルの中核構築ブロックの代替として、注目しないHyenaを提案しています

我々は皆、ChatGPTやBardなどの驚異的な生成モデル、およびそれらの基盤技術であるGPT3やGPT4などの開発競争がAI界を大きく揺...

AIニュース

「効率的な変数選択のための新しいアルゴリズムが提案されました」

中国科学院合肥物质科学研究院の研究者たちは、化学計量学の応用のために変数選択アルゴリズムを開発しました

AI研究

「Microsoftの研究者がPIT(Permutation Invariant Transformation)を提案:動的まばらさのためのディープラーニングコンパイラ」

“`html 最近、深層学習は動的スパース性に最適化されたモデルの研究によって注目されています。このシナリオでは、スパ...

AI研究

「UTオースティン大学の研究者が、安定した拡散を用いたAI手法「PSLD」を紹介追加のトレーニングなしにすべての線形問題を解決する」

逆問題を解決するためには、2つのアプローチのカテゴリがあります。監督学習の手法では、復元モデルがタスクを完了するために...

機械学習

なぜ無料のランチがあるのか

機械学習の領域における「無料の昼食はない」定理は、数学の世界におけるゲーデルの不完全性定理を思い起こさせますこれらの...