「二塔モデルの限界を押し上げる」

「二塔モデルの限界を超える方法」

2つのタワーモデルの設計思想が崩れるポイントと、それを超える方法

(作者による生成AIを使用した画像)

2つのタワーモデルは、現代の推薦システムで最も一般的な設計選択肢です。それは、関連性を学ぶ1つのタワーと、位置バイアスなどの観測バイアスを学ぶ2番目の浅いタワーを持つという主要なアイデアです。

この記事では、特に2つのタワーモデルの背後にある2つの仮定について詳しく説明します:

  • 因数分解仮定、つまり、2つのタワーが計算した確率を単純に掛け合わせる(またはログオッズを足し合わせる)ことができるという仮説、および
  • 位置の独立仮定、つまり、位置バイアスを決定する唯一の変数はアイテム自体の位置であり、それが印象されるコンテキストではないという仮説。

これらの仮定の崩れる箇所と、MixEMモデル、ドット積モデル、XPAなどの新しいアルゴリズムを使用してこれらの制限を超える方法について見ていきます。

まず、非常に簡単に振り返りましょう。

推薦システムにおける2つのタワーモデルの台頭

ランキングモデルのバイアス除去に使用される最新技術の深い探求

towardsdatascience.com

2つのタワーモデル:これまでの物語

推薦システムのランキングモデルの主な学習目標は関連性です:コンテキストに基づいて最良のコンテンツを予測することがモデルの目的です。ここでのコンテキストとは、ユーザーに関して学んだすべてのことを指します。例えば、ユーザーの前回の関与や検索履歴に基づくものです。

ただし、ランキングモデルには通常、観測バイアスと呼ばれる特定のバイアスが存在します。これは、ユーザーが示された方法に応じて印象により多くまたは少なく参加する傾向を示すものです。最も顕著な観測バイアスは、位置バイアスです-最初に表示されたアイテムにユーザーがより多く関与する傾向があります。

2つのタワーモデルの核心は、関連性を学習する主要なタワーと…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more