アマゾンの研究者が提案するKD-Boost:リアルタイムセマンティックマッチングのための新しい知識蒸留アルゴリズム

「アマゾンの研究者が提案するKD-Boost:新しい知識蒸留アルゴリズムによるリアルタイムセマンティックマッチング」

“`HTML

ウェブ検索と電子商取引の商品検索は、正確なリアルタイムの意味的マッチングに依存する2つの主要なアプリケーションです。商品検索では、ユーザーのクエリと関連する結果の間の意味的ギャップを埋めることが難しいです。マッチング手順は通常、2つのステップで行われます:商品の調達(PS)と自動クエリの再構築。商品の調達は、与えられたクエリに対して一致する結果を取得し、商品検索の文脈では商品として参照されることがよくあります。その後、自動クエリの再構築は、不適切に形成されたユーザーのクエリを意味的に類似した、適切に形成されたクエリに変換して結果カバレッジを広げます。

意味的マッチングは、検索エンジンが類似の意味を持つアイテムを認識し関連付けるプロセスです。意味的マッチングにより、ユーザーのクエリは単なる結果ではなく、文脈に基づいて最も関連性の高い結果を返します。トランスフォーマーベースのモデルは、リクエストをエンコードし、クエリや結果などの意味的に関連した要素と同じように埋め込み空間でクラスタリングすることで非常に成功していることが示されています。ただし、遅延の問題により、計算コストの高い大規模なトランスフォーマーモデルはリアルタイムのマッチングには実用的ではありません。

これらの課題に対処するため、Amazonの研究チームは、リアルタイムの意味的マッチング問題に特化した新しい知識蒸留技術であるKD-Boostを紹介しました。KD-Boostは、教師モデルからの正解ラベルとソフトラベルを使用して、低遅延で正確な学生モデルを訓練するために特に設計されています。ソフトラベルのソースは、ダイレクトオーディト、ユーザーの行動調査、およびタクソノミーベースのデータによって生成されるペアワイズなクエリ-商品およびクエリ-クエリのシグナルです。適切な学習プロセスを導くために、カスタム損失関数が使用されています。

研究者たちは、クエリの再構築と商品の調達の両方のニーズを満たすために、類似性と非類似性のシグナルのさまざまなソースを使用したと共有しています。クエリ-商品のエディトリアル序数関連ラベル、クリックや販売などのユーザー行動情報、製品タクソノミーなどがその例です。モデルが関連性と類似性の微妙なニュアンスを正確に捉える学習表現を獲得するようにするために、特別な損失関数が使用されています。

チームは、内部および外部の電子商取引データセットでテストを行い、生徒モデルの直接トレーニングと比較してROC-AUC(特性動作特性-カーブ下の面積)で2〜3%の大幅な向上が示されたことを共有しています。 KD-Boostは、最先端の知識蒸留ベンチマークおよび教師モデルよりも優れたパフォーマンスを示しました。

KD-Boostを使用した自動的なクエリ再構築のシミュレートされたオンラインA/Bテストで有望な結果が観察されました。クエリ間のマッチングが6.31%増加し、意味的な理解が改善されたことを示しています。関連性には2.19%の改善があり、より正確で文脈に即した一致が示され、製品カバレッジには2.76%の増加があり、より広範な関連結果が示唆されました。

まとめると、この研究は広範な商品検索に関連する遅延の問題に対処し、商品の調達と自動クエリ再構築の両方の向上を強調しています。現行のトランスフォーマーベースのモデルの欠点を認識し、解決策として知識蒸留の使用を検討することに貢献しました。

“`

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

MITの研究者は、ディープラーニングと物理学を組み合わせて、動きによって損傷を受けたMRIスキャンを修正する方法を開発しました

「この課題は、ぼやけたJPEG画像以上のものです医療画像の動きのアーティファクトを修正するには、より高度なアプローチが必...

データサイエンス

「制限されたデータで言語モデルをトレーニングするのはリスキーですか?SILOに会ってください:推論中のリスクとパフォーマンスのトレードオフを管理する新しい言語モデル」

著作権で保護されたコンテンツを頻繁に使用するため、大規模言語モデル(LM)には法的な懸念が提起されています。法的リスク...

機械学習

「オーディオソース分離のマスターキー:AudioSepを紹介して、あなたが説明するものを分離します」

Computational Auditory Scene Analysis(CASA)は、複雑な聴覚環境で個別の音源を分離し理解することに焦点を当てた音声信号...

データサイエンス

AI、デジタルツインが次世代の気候研究イノベーションを解き放つ

AIと高速計算は、気候研究者が気候研究のブレークスルーを達成するために必要な奇跡を実現するのに役立つだろう、とNVIDIAの...

AI研究

メタAIがオーディオジェネレーションに関するディープラーニングの研究のためのPyTorchライブラリであるAudioCraftをオープンソース化しました

研究者や実践者がモデルを訓練し、最先端を推進するために、メタはテキストから音楽を生成するためのソースコードであるAudio...

AIニュース

「長い尾が犬に振り回される:AIの個別化されたアートに伴う予測不可能な影響」

メタの最近の生成型映画の世界でのエミューの発表は、技術と文化が前例のない形で交差する転換点を示しています。エミューは...