アップリフトモデリング—クレジットカード更新キャンペーンの最適化ガイド データサイエンティストのための

アップリフトモデリングガイド

因果的機械学習を応用してキャンペーンのターゲットオーディエンスを絞り込む

Photo by rupixen.com on Unsplash

新進気鋭のデータサイエンティストとして、私の学術的バックグラウンドは成功したプロジェクトの兆候として正確さを重視するように教えてくれました。一方で、業界は短期的および長期的にお金を稼ぐことに関心を持っています。この記事は、ビジネス活動の究極の目標であるROI(投資対効果)についての教訓です。

多くのプロモーションキャンペーンは、個々の顧客ではなく顧客セグメントをターゲットにしています。これには有料検索、ディスプレイ広告、有料ソーシャルなどがあります。一方、Direct-To-Consumer(D2C)キャンペーンは、個々の顧客を直接対象としています。これにはダイレクトメール、メール、SMS、さらにはプッシュ通知などがあります。銀行やフィンテック業界の企業は、アプリを持っている全員に大規模なD2Cキャンペーンを実施することができます。しかし、最近では、これらの企業もプロモーション費用の効率化を図ろうとしています(どのように?)。

問題の理解

それを踏まえて、クレジットカード発行会社であるFlexについて話しましょう。Flexは初年度は年会費無料であり、二年目以降には年会費を全額請求するという特典を提供しています。過去3年間、Flexはカードを使用した後も継続するホルダーはわずか30%であるという低い年次継続率を観測しています。Flexは、リニューアルのオファーを選択された顧客に実施して、顧客基盤を拡大し続ける実験をすることを決定しました。ただし、この戦略は慎重でなければ高額になる可能性があります。

データサイエンティストとして、リニューアルの対象となる500万人の顧客リストから、これらのオファーを受ける対象顧客の最小グループを準備するというタスクが与えられています。

アップリフトモデリングの簡単な説明

長年、データサイエンティストは、顧客が直接的なキャンペーンに反応する可能性を予測する反応モデルの構築に従事してきました。新しいビジネスにとってはこれで問題ありませんが、ブランドが成熟するにつれて、彼らの質問は変化していきます。

反応モデルでは解決できない問題は次のとおりです:

  1. キャンペーンにさらされた場合、顧客はどれだけの確率で反応するのでしょうか?
  2. 離反のリスクにさらされている顧客を優先的に対象にする方法はありますか?彼らは誰ですか?
  3. プロモーションメッセージに否定的に反応する可能性のある顧客はいますか?彼らは誰ですか?
  4. キャンペーンの対象顧客を減らすことなく、増加収益に影響を与えずにどのようにしてできますか?

アップリフトモデリングが登場します。これは、個々の購買行動の増加的な影響を予測する機械学習の技術であり、単に行動の可能性を予測するのではなく、キャンペーンによる影響を受けやすい顧客に焦点を当てることができます。これにより、リソースを無駄にせずにキャンペーンの投資対効果と顧客満足度を向上させることができます。

Image by author

おそらく、これまでに顧客の分類を見たことがあるかもしれません。確実な顧客は、あなたのブランドや製品に強い愛着を持ち、どちらにせよ購入するでしょう。失われた顧客は、あなたの製品にニーズがないですし、プロモーションキャンペーンもこれら2つの顧客クラスを動かすことはできません。スリーピングドッグは、プロモーションによって邪魔されなければ購入する可能性のある顧客です。 最大の機会を持つのは説得可能な顧客です — 彼らはマーケティング次第でのみ購入します。 彼らがキャンペーンのROIを向上させます。

このタスクでは、まず説得可能な顧客を特定する必要があります。次に、それぞれに最適なオファーを見つける必要があります。

クレジットカード顧客データセットの準備

私たちは、10ヶ月のテナーである500万人の顧客のデータセットを持っています。つまり、彼らは2ヶ月で更新する必要があります。これは、Pythonコードを使用して自分で作成できるシミュレートされた顧客データです。

Image by author

ここでEDA(探索的データ分析)を行う必要があり、ydata-profiling(以前はPandas Profilingと呼ばれていました)ツールを使用してインタラクティブなレポートを生成しました。

Image by author
Image by author

20の顧客変数があります – qualititativeなもの(年齢、所得層など)とquantitativeなもの(取引、カテゴリごとの支出など)が含まれています。いくつかの変数は相関が非常に高いです。

パイロット – 以前の更新キャンペーンを詳しく見る

Flexはすでに、以下のようなメッセージを含む50,000人の顧客を対象にパイロットキャンペーンを実施しました。

お客様のクレジットカードが特別オファー付きで更新可能であることをお知らせいたします。限られた期間内に、通常料金と比較して年会費をわずか$49に引き下げてクレジットカードを更新することができます。このオファーは、当社のクレジットカードを1年以上使用しているような忠実なお客様のみに提供されます。

支払い額に基づいて3つのオファーがありました – 30%、50%、70%。キャンペーンから、処理されたセグメントのリテンション率が55%であることが結論付けられました。これは、フルの年会費を支払った対照グループからの25%(55マイナス30)のリフトです。これを平均処置効果(ATE)と呼びます。

Image by author

キャンペーンの結果があり、このデータを使用して次のキャンペーンを最適化することができます。それには、すべての顧客に対して条件付き平均処置効果(CATE)を計算する必要があります – これは顧客レベルでの効果のファンシーな名前です。

注 – パイロットキャンペーンは、大規模な導入前に宣伝またはマーケティング戦略の小規模なテストです。マーケターは、戦略の効果、実現可能性、コストを評価し、問題や課題を特定して解決することができます。パイロットキャンペーンは、マーケティング計画を最適化し、投資利益を増やし、失敗のリスクを減らすのに役立ちます。

傾向スコアマッチング – 代表的な対照グループの取得

傾向スコアマッチング(PSM)は、観察的研究においてランダム割り当てが不可能な場合に、処置を受ける確率が類似した顧客を特徴の観点からマッチングすることを目的としています。PSMは、交絡変数によるバイアスを軽減するのに役立ちます。これには、各顧客の傾向スコア(共変量が与えられた場合の処置を受ける条件付き確率)を推定し、それに基づいて処置を受けた顧客と処置を受けていない顧客をマッチングすることが含まれます。

パイロットキャンペーンでは3つの異なる処置があるため、傾向スコアマッチングを使用して、各処置グループに対して同一の対照グループを近似します。例えば – 年会費×30%の処置を受けた顧客に類似した制御グループ(フルの年会費を支払った顧客)のセット。同様に、年会費×50%と年会費×70%のグループに対しても同様にします。これにより、実験設定内の交絡変数を排除し、各処置グループの真のリフトを特定することができます。

通常、傾向スコアは簡単なロジスティック回帰モデルを使用して計算されます。また、クラスの不均衡も処理するpsmpyなどのパッケージもおすすめです。

特徴選択 – リフト増加の要因

傾向スコアマッチングの後、3つのデータセットのペアが得られます -(Control₃₀、Treatment₃₀)、(Control₅₀、Treatment₅₀)、(Control₇₀、Treatment₇₀)

これらのペアを使用して、CausalMLライブラリのX-learnerアルゴリズムを使用して、各処置グループごとに3つのモデルを構築しました。SHAP値を使用して、リフトに関連する特徴を確認できます。

著者による画像

X-learnerモデルの評価

私たちは3つのQiniカーブを構築します。これにより、最高のCATEから最低のCATEまでの顧客の追加による累積的なリフトアップがわかります。これは、従来の機械学習のROCカーブに似ています。下の線は、ランダムな割り当てを治療/対照群にした場合のリフトアップです。ここでは、アップリフトカーブの下の面積またはQiniスコアを報告します。値が高いほど良いです。

著者による画像

予想通り、年会費×30%の処置が最も高いQiniスコアを持っています。これでモデルは準備ができましたので、新しいデータに適用することができます。

サンプル外のアップリフトの予測 — 次のキャンペーンの設計

更新の必要がある500万人の顧客に移ります。年会費×30%、年会費×50%、または年会費×70%の提供オプションがあります。または、何も提供しない — フル年会費です。3つのX-learnerから、それぞれのCATEを予測します。最大のCATEを持つ処置がベストな処置となります。すべての処置が似たようなCATE(お互いの+-10%以内)を持つ場合は、年会費×70%の処置を選びます(もちろん、収益が高い方が良いです)。最大のCATEが負の場合、この顧客にはマーケティングを行いません(寝た犬です)。

著者による画像

以下のような表現では、CATEに基づいて顧客を10分位に分割しています。デシル1は最も高いCATEを持ち、デシル10は最も低いCATEを持っています。すべての顧客に1つのタイプの処置を与えると、下位のデシルは早期に0を下回ることがわかります。したがって、次のキャンペーンではベストな処置に固執します。

著者による画像

Qiniカーブからは、このキャンペーンでかなりのリフトが期待されることがわかります。明確なカットオフや曲線の変曲点は、説得力のある顧客を区別するためにありません。

著者による画像

増分応答 — どの顧客にターゲットを絞るべきか?

次のキャンペーンの平均リフトは0.052と予想されています。平均を上回るリフトを持つデシルは、ターゲット可能な顧客です。しかし、このキャンペーンでは質素であるため、上位20%のみを選び、説得力のある顧客と呼びます。リフトが負のデシルは寝た犬です。残りは確実なものまたは失われたものです。

この改訂されたベストな処置のプロットで説得力のある顧客を視覚化するのは簡単です。この場合、上位5つのデシルです。

著者による画像

ビジネスチームにはアップリフトを報告できないため、これを増加ROIおよび収益スケールに変換しましょう。デシルdに対する増加ROIは次のようになります。

収益はデシルからの継続料金の合計額です。キャンペーンコストはFlexが負担する継続料金の部分です。顧客の最初の7つのデシルまたは上位70%にのみ割引を提供することが収益を生み出すことがわかります。

著者による画像

トップ20%、または説得可能な顧客は、これら500万人の顧客の更新からの総収益の80%をもたらすことが期待されています。これはビジネスでよく見られ、パレートの法則と呼ばれています。このような棒グラフは、キャンペーンの長期ROIを学ぶために、CLV(顧客生涯価値)に対しても構築することができます。

著者による画像

では、誰をターゲットにするかという質問に答えましょう。それは、約100万人の説得可能な顧客です。彼らのオファーをどのように個別化するのか?最も高い条件付き平均処置効果を使用します。

結論

このように、アップリフトモデリングはキャンペーンに最も増加ROIをもたらす顧客を特定し、それらにターゲットを絞ります。これにより、アップリフトモデリングはキャンペーンの投資対効果を最適化し、無駄な支出を削減します。

この投稿が役に立ち、情報を提供できたことを願っています。次のプロモーションやマーケティングキャンペーンでアップリフトモデリングを試してみてください。

アップリフトモデリングは通常、ダイレクトメール、メール、SMS、またはアプリ通知などのD2C(Direct To Consumer)キャンペーンに適用されます。 もし有料メディアの最適化をお探しの場合は、マーケティングミックスモデリングのシリーズに移動してください。

読んでくれてありがとう! 😄

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more