精度を超えて：長期的なユーザー維持のための偶然性と新規性の推奨事項の受け入れ

Recommendations for Serendipity and Novelty to Ensure Long-Term User Retention Beyond Accuracy.

レコメンデーションシステム

良いレコメンデーションと長期的なユーザー維持に貢献する要因の検討

コーヒーショップで形成された信頼の絆

あなたはコーヒーショップに座って、お気に入りのコーヒーバリエーション（もちろんカプチーノ）を味わい、友人との会話に没頭しています。会話が流れる中で、最新の魅力的なテレビシリーズの話題に移ります。共有された興奮が信頼の絆を生み出し、友人があなたに向かって「次に何を見たらいいですか？何かお勧めはありますか？」と尋ねるようになります。

その瞬間、あなたは彼らのエンターテイメント体験のキュレーターになります。あなたは彼らの信頼を保つ責任を感じ、彼らを魅了する保証された提案を提供することが求められます。さらに、彼らが以前に探求したことのないジャンルやストーリーラインに触れることができるかもしれないという機会に興奮しています。

しかし、友人に完璧なお勧めを考える際に影響を与える要因は何でしょうか？

良いレコメンデーションの要素

まず、友人の好みや興味に関する理解に基づいています。複雑なプロットの展開やダークユーモアに対する彼らの嗜好を思い出し、彼らが「Sherlock」のようなクライムドラマや「Black Mirror」のような心理スリラーを楽しんでいたことを知っています。この知識を武器に、あなたはテレビ番組のメンタルライブラリーをナビゲートします。

安全なプレイをする？

友人にほぼ同一のリストを提案することに誘惑されます。これは、あなたが前に絶賛していたものにほぼ同じものが含まれ、クライムとスリルの両方を包括しています。また、同様の好みを持つ他の人たちがこれらの番組を楽しんだことを考えます。結局、彼らはこのセットを楽しむことが「保証されている」ので、安全で簡単な選択肢です。しかし、過去のお気に入りに頼ることが、新しい多様なコンテンツに露出する機会を制限する可能性があることを考慮し、安全で簡単な選択肢に頼ることはしたくありません。

最近のサイファイシリーズを思い出します。それは巧妙にミステリー、アドベンチャー、超自然的な興味深いストーリーが融合しています。彼らの典型的なジャンルから外れているにもかかわらず、新鮮で魅力的なナラティブの変化を提供することができると自信を持っています。

ロングテール問題、フィードバックループ＆フィルターバブル

レコメンデーションシステムは、より大きな規模でこのプロセスを再現することを目指しています。個人の好み、行動、過去の経験に関する膨大な量のデータを分析することで、これらのシステムは、人間の意思決定の複雑さを包括する個人に合わせたレコメンデーションを生成しようと努めています。

しかし、従来のレコメンデーションシステムは、主に安全プレイに焦点を当て（少なくとも、短期的には）、保証されたレコメンデーションに頼っています。

彼らがこれを行う方法の1つは、人気や一般的なコンテンツに優先順位を付けることです。その結果、この人気のあるコンテンツは、より多くの露出と相互作用（人気バイアス）を受け、その優位性を強化するフィードバックループを生み出します。残念ながら、これにより、知られていない、またはニッチなコンテンツが目標の視聴者に到達するのを妨げる場合があります（ロングテール問題）。

実際、レコメンデーションシステムにおける「公平性」についての文献が最近数年間で多く出ています。たとえば、「音楽レコメンデーションシステムにおける公平性：ステークホルダー中心のミニレビュー」で、Karlijn DinnissenとChristine Bauerは、音楽レコメンデーションシステムにおける公平性の問題を探求しており、複数のステークホルダーの視点から人気バイアスやジェンダーフェアネスを分析しています。たとえば、人気バイアスがアーティストの表現に与える影響などが含まれます。

「音楽推薦アルゴリズムは多様性を重視するのか？」という記事で、ジュリー・ニブが以下を共有しています:

ストリーミングプラットフォームの元プロダクトディレクターとして、「ストリーミングサービスは、インディーズやニッチな音楽よりも人気のあるアーティストをプロモーションすることを選択するのか？」といった質問をよく受けます。直感的に、人々はこれらの大きなプラットフォームでは「富者がより富者になる」と考えています。

記事の後半では、ニブはディニッセンとバウアーの感情にも共感しています:

「音楽推薦の文脈においては、…公正性はしばしば露出や注目の形で定義されます。ストリーミングサービスは2面市場です。つまり、「公正で公正な扱い」はストリーミングサービスのユーザーとアーティストの両方に適用されなければなりません。」

両方のソースは、推奨システムの公平性の二重性を強調し、「公正で公正な扱い」の考慮の重要性を強調しています。

理想的な結果はどのようになりますか？

コンテンツの分配には本来的な不均衡が存在するため、人間の経験を豊かにするものの一つは、ネットワークの複雑さにあります。一部のコンテンツは広い観客に共感し、他のコンテンツはニッチなグループ内でのみつながりを形成し、豊かさと個人化感を形成します。目的は、一様な分布を目指すことで少数派のコンテンツを人々に浮上させ、コンテンツクリエイターの仕事を本当に理解し、評価できる人々に届けることにより、意義深いつながりの機会を最小限に抑えることです。

業界はこれについてどう言っていますか？

2020年、Spotifyの研究チームは、「Spotifyの消費の多様性に対するアルゴリズムの影響」という記事を発表しました。その研究では、リスニングの多様性とユーザーのアウトカムの関係を調べました。

彼らは、次のような問いに答えることを目的としていました。「多様性は重要なユーザーアウトカムとどのような関係があるのか？多様性のあるリスニングをするユーザーは、狭くリスニングするユーザーよりも満足しているのか？」

研究者たちは、「多様なリスニングをするユーザーは、リスニングの少ないユーザーよりも10〜20パーセントポイントチャーンする可能性が低く、リスニングの多様性は ユーザーの変換と維持に関連している」と発見しました。

さらに、ジュリー・ニブによると:

「MITテクノロジーレビューによると、最近TikTokの推奨アルゴリズムがトップ10に挙げられました。彼らのアプローチで革新的なのは、アルゴリズム自体ではなく、多様性を他の要因よりも重視しているメトリックです。」

したがって、プラットフォーム内での発見可能性とユーザー維持の属性にはつながりがあります。言い換えると、推奨が予測可能になると、ユーザーはフィルターバブルの枠から抜け出し、コンテンツの「新鮮さ」を提供する代替プラットフォームを求める可能性があります。

では、どのようにして推奨システムが、友達に完璧な提案をキュレーションするときに行った思慮深さと直感を模倣できるのでしょうか？

多様性メトリックへのシフト

記事「推薦システムにおける正確さ以外の目標に関する調査と実証分析：多様性、セレンディピティ、新規性、カバレッジ」で、著者のマリウス・カミンスカスとデレック・ブリッジは以下を強調しています:

「推薦システムの研究は伝統的に正確さに焦点を当ててきました。しかし、リストの提供が多様であるか、新しいアイテムが含まれているかといった、他の推奨品質については、推奨システムの総合的な品質に重要な影響を与える可能性があることが認識されています。したがって、推奨システムの研究の焦点はより広範な「正確さ以外の」目標を含めるようになりました。」

これらの「正確さ以外の」目標とは何ですか？

多様性

友達にショーのおすすめをする文脈において、リコメンデーションシステムにおける「多様性」を理解するために、文献を調べることは困難でした。多様性は、個人レベルまたはグローバルレベルで測定することができます。次に、多様性を概念化するための3つの方法を説明します。

予測多様性

予測多様性とは、与えられたセット内で推奨事項がどの程度多様かを測定したものです。友人に番組のセットを提案する場合、予測多様性は、ジャンル、テーマ、その他関連する要因に関してお互いにどの程度異なるかを評価します。

より高い予測多様性は、推奨されたセット内のオプションの範囲が広がり、友人により多様で豊かな視聴体験を提供することを示します。

これを測定する方法の1つには、「内部リスト多様性（ILD）」を使用することがあります。これは、推奨されたアイテム間の平均ペアワイズ非類似度です。推奨されたアイテムリストが与えられた場合、ILDは以下のように定義されます。

ユーザー多様性

友人に番組の提案を行う文脈でのユーザー多様性は、特定の友人に対して与えたすべての提案の平均的な多様性を調べます。時間の経過とともに提案されたコンテンツの幅広さと多様性を考慮し、ジャンル、テーマ、その他関連する要因をカバーする範囲を捉えます。

また、友人ごとに推奨されたアイテムの埋め込み内のアイテム間の平均的な非類似度を分析することで、ユーザー多様性を評価することができます。

グローバル多様性

一方、グローバル多様性は、特定の友人を超えて、あなたがどの友人に対しても与えたすべての提案の平均的な多様性を評価します。

これは、混雑度として言及されることがあります。これは、推奨統一性または推奨の密集度を反映します。

グローバル多様性を分析するために使用できるいくつかのメトリックには、ジニ係数とエントロピーがあります。

ジニ係数は、所得格差の測定分野から適応されたもので、推奨システムの推奨分布の公正性とバランスを評価するために使用できます。より低いジニ係数は、推奨が均等に広がり、より多様なコンテンツに対する露出が促進されるように、より公平な分布を示します。一方、より高いジニ係数は、いくつかの人気アイテムに推奨が集中していることを示し、ニッチなコンテンツの可視性を制限し、推奨の多様性を減少させる可能性があります。

エントロピーは、推奨プロセスに含まれる情報量を測定するものです。推奨の分布における不確実性またはランダム性のレベルを定量化します。ジニ係数と同様に、推奨分布が均等であると最適なエントロピーが得られます。つまり、各アイテムが同じ確率で推奨されるということを示します。これは、バランスの取れた多様な推奨セットを示します。エントロピーが高い場合、より多様で予測不可能な推奨システムを示し、エントロピーが低い場合、より集中した予測可能なセットの推奨を示します。

カバレッジ

カバレッジとは、アルゴリズムが生成できる可能性のある推奨の割合/比率を定義します。つまり、推奨が可能なアイテムのカタログをどの程度効果的にカバーできるかを示します。

たとえば、様々なジャンル、アーティスト、年代にわたる膨大な曲ライブラリを持つ音楽ストリーミングプラットフォームがあるとします。推奨アルゴリズムのカバレッジは、その音楽カタログの全体をどの程度効果的にカバーできるかを示します。

欠点：このメトリックは、1回提案されたアイテムを何千回も提案されたアイテムと同じように扱います。

新規性

新規性は、推奨アイテムの新しさまたは独創性のレベルを測定するメトリックです。ユーザー依存とユーザー非依存の新規性の2つの側面を含みます。ユーザー依存の新規性は、推奨がユーザーにとってどの程度異なるかを測定し、新鮮で未開拓のコンテンツの存在を示します。しかし、ユーザー非依存の方法でアイテムの新規性を参照することが増えています。

新規性を推定するために、1つの一般的なアプローチは、アイテムの人気を考慮して、アイテムのレア度として測定することです。このアプローチは、アイテムの新規性をその人気度と逆の関係に置き、一般的または広く知られた選択肢からの逸脱によってしばしばより少なく人気のあるアイテムが新規性が高いと認識されることを示します。この視点を統合することで、新規性メトリックは、推奨アイテムに存在する革新性と多様性のレベルに関する洞察を提供し、より豊かで探究的な推奨体験に貢献します。

予期せぬ要素（サプライズ）

レコメンドシステムにおけるサプライズは、ユーザーの過去のインタラクションに基づいて推奨アイテムの予想外のレベルを測定します。サプライズを量化する方法の1つは、推奨アイテムとユーザーの過去のインタラクションのコサイン類似度を計算することです。より高い類似度はサプライズが少ないことを示し、より低い類似度は推奨におけるより大きなサプライズを示します。

Discoverability

レコメンドシステムにおけるディスカバラビリティは、モデルが提案するレコメンドを容易に見つけることができるかどうかを表します。これは、ユーザーインターフェースやプラットフォーム内でのレコメンドの可視性とアクセシビリティに似ています。

これは、推奨リストの上位ランクにある推奨により重要度が高く、ランク位置が下がるにつれて重みが徐々に減少する減少ランク割引関数を使用して量子化されます。

Serendipity

レコメンドシステムにおけるセレンディピティは、予想外さと関連性の2つの主要な側面を包含します。

セレンディピティは、興味深く予想外のレコメンドの発生を指します。セレンディピティを量子化するために、以下の式を使用して、ユーザーごとおよびアイテムごとに計算されます。

予想外さと関連性を乗算することにより、セレンディピティメトリックは、興味深く適切である要素を組み合わせ、推奨プロセスでのセレンディピティの経験の度合いを量子化します。

ユーザーと推奨アイテム全体のセレンディピティの平均は、以下のように計算できます。

結論

業界が進化するにつれて、より豊富なパーソナライズ、セレンディピティ、および新規性を含むユーザーの好み全体をカバーする推奨アルゴリズムの改良に注力する傾向が高まっています。これらの次元のバランスを最適化するレコメンドシステムは、改善されたユーザーリテンションメトリックとユーザーエクスペリエンスと関連があるとされています。最終的な目標は、ユーザーの既知の好みに対応するだけでなく、新鮮で多様で個人的に関連性の高いレコメンドを提供し、長期的なエンゲージメントと満足感を促進するレコメンドシステムを作成することです。

参考文献

Diversity, Serendipity, Novelty, and Coverage: A Survey and Empirical Analysis of Beyond-Accuracy Objectives in Recommender Systems
Post Processing Recommender Systems for Diversity
Diversity in recommender systems — A survey
Avoiding congestion in recommender systems
The Definition of Novelty in Recommendation System
Novelty and Diversity in Recommender Systems: an Information Retrieval approach for evaluation and improvement
Quantifying Availability and Discovery in Recommender Systems via Stochastic Reachability
A new system-wide diversity measure for recommendations with efficient algorithms
Automatic Evaluation of Recommendation Systems: Coverage, Novelty and Diversity
Serendipity: Accuracy’s Unpopular Best Friend in Recommenders

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Data scienceMachine learningPersonalizationRecommendation SystemThoughts And Theory

Was this article helpful?

93 out of 132 found this helpful