アマゾンの研究者が提案するKD-Boost:リアルタイムセマンティックマッチングのための新しい知識蒸留アルゴリズム

「アマゾンの研究者が提案するKD-Boost:新しい知識蒸留アルゴリズムによるリアルタイムセマンティックマッチング」

“`HTML

ウェブ検索と電子商取引の商品検索は、正確なリアルタイムの意味的マッチングに依存する2つの主要なアプリケーションです。商品検索では、ユーザーのクエリと関連する結果の間の意味的ギャップを埋めることが難しいです。マッチング手順は通常、2つのステップで行われます:商品の調達(PS)と自動クエリの再構築。商品の調達は、与えられたクエリに対して一致する結果を取得し、商品検索の文脈では商品として参照されることがよくあります。その後、自動クエリの再構築は、不適切に形成されたユーザーのクエリを意味的に類似した、適切に形成されたクエリに変換して結果カバレッジを広げます。

意味的マッチングは、検索エンジンが類似の意味を持つアイテムを認識し関連付けるプロセスです。意味的マッチングにより、ユーザーのクエリは単なる結果ではなく、文脈に基づいて最も関連性の高い結果を返します。トランスフォーマーベースのモデルは、リクエストをエンコードし、クエリや結果などの意味的に関連した要素と同じように埋め込み空間でクラスタリングすることで非常に成功していることが示されています。ただし、遅延の問題により、計算コストの高い大規模なトランスフォーマーモデルはリアルタイムのマッチングには実用的ではありません。

これらの課題に対処するため、Amazonの研究チームは、リアルタイムの意味的マッチング問題に特化した新しい知識蒸留技術であるKD-Boostを紹介しました。KD-Boostは、教師モデルからの正解ラベルとソフトラベルを使用して、低遅延で正確な学生モデルを訓練するために特に設計されています。ソフトラベルのソースは、ダイレクトオーディト、ユーザーの行動調査、およびタクソノミーベースのデータによって生成されるペアワイズなクエリ-商品およびクエリ-クエリのシグナルです。適切な学習プロセスを導くために、カスタム損失関数が使用されています。

研究者たちは、クエリの再構築と商品の調達の両方のニーズを満たすために、類似性と非類似性のシグナルのさまざまなソースを使用したと共有しています。クエリ-商品のエディトリアル序数関連ラベル、クリックや販売などのユーザー行動情報、製品タクソノミーなどがその例です。モデルが関連性と類似性の微妙なニュアンスを正確に捉える学習表現を獲得するようにするために、特別な損失関数が使用されています。

チームは、内部および外部の電子商取引データセットでテストを行い、生徒モデルの直接トレーニングと比較してROC-AUC(特性動作特性-カーブ下の面積)で2〜3%の大幅な向上が示されたことを共有しています。 KD-Boostは、最先端の知識蒸留ベンチマークおよび教師モデルよりも優れたパフォーマンスを示しました。

KD-Boostを使用した自動的なクエリ再構築のシミュレートされたオンラインA/Bテストで有望な結果が観察されました。クエリ間のマッチングが6.31%増加し、意味的な理解が改善されたことを示しています。関連性には2.19%の改善があり、より正確で文脈に即した一致が示され、製品カバレッジには2.76%の増加があり、より広範な関連結果が示唆されました。

まとめると、この研究は広範な商品検索に関連する遅延の問題に対処し、商品の調達と自動クエリ再構築の両方の向上を強調しています。現行のトランスフォーマーベースのモデルの欠点を認識し、解決策として知識蒸留の使用を検討することに貢献しました。

“`

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

ロボットスキル合成のための言語から報酬への変換

Googleの研究科学者、Wenhao YuとFei Xiaによる投稿 エンドユーザーがロボットに新しいタスクを教えるためのインタラクティブ...

データサイエンス

『Amazon SageMaker を使用して、Talent.com の ETL データ処理を効率化する』

この投稿では、Talent.comでの求人推薦モデルのトレーニングと展開のために開発したETLパイプラインについて説明します当社の...

人工知能

工学部は、Songyee Yoon博士(PhD '00)を訪問イノベーション学者として歓迎します

ビジョンのある起業家でありイノベーターでもあるユンは、起業、女性エンジニアの支援、包括的なイノベーションの促進に焦点...

機械学習

このAIニュースレターは、あなたが必要とするすべてです #57

「AIの世界では、LLMモデルのパフォーマンス評価が注目の話題となりました特に、スタンフォードとバークレーの学生による最近...

AIニュース

OpenAIがグローバルイルミネーションを引き継ぎ、初の企業買収を祝います

テック界に波紋を広げる動きとして、人工知能の先駆的存在であるOpenAIが、初の買収に乗り出しました。OpenAIがデジタルプロ...

機械学習

「ミット、ハーバード、ノースイースタン大学による『山に針を見つける』イニシアチブは、Sparse Probingを用いてニューロンを見つける」

ニューラルネットワークは、初期の生の入力から適切な表現を徐々に洗練して学習する、適応型の「特徴抽出器」として考えられ...