「ジェネラティブAIおよびMLモデルを使用したメールおよびモバイル件名の最適化」

Optimizing email and mobile subject lines using generative AI and ML models.

電子メールやプッシュ通知の件名やタイトルは、エンゲージメント率を決定する上で重要な役割を果たします。デジタルコミュニケーションでは、ユーザーの注意を引く魅力的な件名と簡潔なプッシュ通知タイトルを作成するスキルが求められます。マーケターは、伝えたいメッセージのトーンと対象のオーディエンスに基づいて件名を作成します。効果的な件名とプッシュ通知メッセージを生成し、それに加えて古典的な機械学習モデルを組み合わせて開封率を予測するために、生成AIモデルは自動化の手段を提供します。この記事では、ジェネレーティブAI(大規模言語モデル)を使用して、効果的な件名とプッシュ通知メッセージを作成するためのいくつかのアプローチについて説明します。

方法論

今日の大規模言語モデル(LLM)が簡単に生成できる魅力的な件名を作成するだけでなく、クリックしてメッセージを表示するようなコンテキストと内容に適した理想的な候補を生成することが目標です。機械学習(ML)モデル、特にランダムフォレストアルゴリズムは、適切にトレーニングされると、受信者がメッセージをクリックする可能性を高い確信度で予測することができます。LLMと予測MLモデルを組み合わせることで、高品質な件名とプッシュ通知タイトルを生成することが可能です。以下にいくつかの可能な方法を示します。

アプローチ1:トレーニングデータから件名の長さ、言語の複雑さ、感情、対応する開封率(ラベル)などの件名の主要な特徴を抽出して予測MLモデルをトレーニングします。LLMを使用して複数の候補件名を生成します。MLモデルは、主要な特徴を抽出して入力として渡すことで、各候補件名の開封率を予測することができます。予測された開封率が最も高い件名を選択します。

アプローチ2:前のアプローチと同様に、モデルはデータセットからの生のメッセージとそれに対応する開封率のラベルでトレーニングされます。このトレーニングされたモデルを使用して、LLMが生成した件名の予測開封率を生成します。予測された開封率が最も高い件名を選択します。

アプローチ3:このアプローチはアプローチ1を拡張したものです。主要な特徴に加えて、LLMは電子メールの内容、開封率、トーン(緊急性、ポジティブなど)およびターゲットオーディエンスのペルソナ(人口統計など)に基づいて件名を生成するために微調整されます。微調整されたLLMは複数の候補件名を生成し、件名の特徴に基づいてトレーニングされた予測MLモデルが候補の中から最も効果的なものを選択します。

重要なアイデアは、LLMの言語的な能力と伝統的なMLモデルの予測力を組み合わせて使用することです。LLMが候補を生成し、MLモデルがそれらを評価します。

アプローチ3について詳しく説明しましょう。

トレーニングフェーズ

モデルのトレーニングデータを収集する

まず、電子メールやモバイルプッシュ通知のサンプルを収集します。トレーニングデータには、メッセージの内容、件名、チャネル、開封率だけでなく、トーンとオーディエンスのラベルも含める必要があります。データセットでは、各エントリを以下のようにラベル付けします:コンテンツ、件名、モバイルプッシュタイトル、チャネルの種類、開封/クリック率、トーン、およびオーディエンスセグメント。メッセージングでは、「チャネル」タイプは、メッセージやコンテンツが配信されるVoAGIを指します。最適な件名の長さとスタイルは、電子メールやモバイルプッシュ通知などのチャネルによって異なります。

#トレーニングデータのサンプル

コンテンツ:新製品発表!
件名:新しいXYZ製品の発表!
トーン:エキサイティング
オーディエンス:テック愛好家
チャネル:電子メール
開封率:0.25

コンテンツ:ブラックフライデーセール開催中!
タイトル:ブラックフライデーセール!
トーン:緊急
オーディエンス:掘り出し物探しの人々
チャネル:モバイル
クリック率:0.15

開封/クリック率のラベル付きの十分なトレーニングデータを提供するようにしてください。

大規模言語モデル(LLM)の微調整

収集したサンプルに基づいてLLMモデルを微調整します。これにより、チャネルに基づいて件名やタイトルを生成することができるようになります。また、チャネルだけでなく、メッセージのトーンと対象の受信者も指定することが重要です。これにより、テキスト生成がチャネルだけでなく、メッセージのトーンと意図された受信者にも依存するようになります。モデルを微調整するために、たとえばOpenAIのGPTを使用している場合は、データセットのためのJSONファイルを作成します。このファイルは、OpenAI CLIツールのfine_tunes.createコマンドを使用してOpenAIモデルを微調整するために使用することができます。

JSON
{"prompt": "コンテンツ:新製品発表! トーン:エキサイティング オーディエンス:テック愛好家 チャネル:電子メール", "rate": "開封率:0.25", "completion": "件名:新しいXYZ製品の発表!"}
{"prompt": "コンテンツ:ブラックフライデーセール開催中! トーン:緊急 オーディエンス:掘り出し物探しの人々 チャネル:モバイル", "rate": "クリック率:0.15", "completion": "タイトル:ブラックフライデーセール!」

予測モデルのトレーニング

LLMモデルの微調整が完了した後、効果的な件名をスコアリングして選択するために、MLモデルをトレーニングする必要があります。これは、さまざまな予測モデルを使用して達成することができます。ランダムフォレストアルゴリズムを使用して、どの件名が最も開封率が高いかを予測することができます。トレーニングデータセットから件名を抽出し、主要な特徴を抽出する必要があります。これらの主要な特徴から得られたベクトルを使用して、ランダムフォレストモデルをトレーニングすることができます。

主要な特徴ベクトルの抽出

主要な特徴を抽出するためには、いくつかのオープンソースのライブラリが使用できます。感情の抽出には、TextBlobの組み込みの感情メソッドとVADER(Valence Aware Dictionary and Sentiment Reasoner)を使用することができます。TextStatを使用して読みやすさ、Flesch-Kincaidグレードレベルなどの読みやすさの指標を決定することができます。RAKE(Rapid Automatic Keyword Extraction)を使用してキーワードを抽出することができます。

from textblob import TextBlob
import rake
import nltk

def get_features_of_subject_line(text):

  # 件名の長さ
  length = len(text)

  # 感情
  sentiment = TextBlob(text).sentiment.polarity

  # キーワードの一致数
  keywords_to_match = ["セール", "新着", "人気", "無料"]
  matches = 0
  rake_extractor = rake.Rake()
  keywords = rake_extractor.extract_keywords_from_text(text)
  for kw in keywords:
    if kw in keywords_to_match:
      matches += 1

  # 読みやすさ
  readability = nltk.textstat.flesch_reading_ease(text)
  return [length, sentiment, matches, readability]

電子メールの場合、長さ、感情、キーワードの一致、読みやすさなどの特徴を抽出します。モバイルの特徴には、文字数、トーン、絵文字、セグメンテーションなどが含まれます。主な違いは、メールとモバイルのスタイルの違いを考慮したチャネル固有の特徴を抽出することです。モデルは、各チャネルに適切に重み付けされた特徴を学習することができます。これにより、各チャネルの制約と観客の期待に合わせて、件名の生成と選択を最適化することができます。

トレーニング手順を示すフローダイアグラム(著者による画像)

予測フェーズ

件名候補の生成

新しいメッセージの件名候補を生成するには、メッセージの内容、チャネル、希望するトーン、対象の視聴者セグメントを微調整済みのLLMモデルに入力します。プロンプトで希望する候補の数を指定します。モデルは、指定された数の候補を生成し、チャネルに適した言語で、指定されたトーンで、対象の視聴者に合わせてカスタマイズされた件名を生成します。

トレーニング済みの予測モデルを使用して最適な候補を選択する

以前にトレーニングされた予測モデルは、LLMによって生成された候補の中から最適な件名を選択するために使用することができます。各候補について、主要な特徴が抽出され、モデルに入力されて予測が生成されます。最も高い予測スコアを持つ件名が最適なオプションとして選ばれ、対象の視聴者がメッセージをクリックして開封する可能性が最も高くなります。

予測手順を示すフローダイアグラム(著者による画像)

製品化へのステップ

このアプローチを製品化するために真剣に検討する場合、ユーザーエクスペリエンスを向上させるためにいくつかの領域を探る必要があります。件名や通知タイトルの効果を向上させるために、どのような改善や効果の低下が考えられるかについての詳細な洞察を提供することは、特にマーケターにとって役立つでしょう。

テキストの長さ:各視聴者に最適な長さを超えるテキストの短縮の提案。

キーワードの影響:エンゲージメント率に影響を与えるキーワードを強調し、ネガティブなキーワードの排除とポジティブなキーワードの追加を提案します。

キーワードの使用と頻度:キーワードを適切な頻度で使用することによって視聴者の疲労を避ける方法についての洞察を提供します。

過去の成功事例:過去に非常にエンゲージメントが高かった類似のテキストを提供します。

業界のベンチマーク:予測されるエンゲージメント率を業界のベンチマークと比較し、パフォーマンスが低い場合は変更を提案します。

テスト:トップの候補をA/Bテストし、パフォーマンスに基づいて反復します。

トレーニングループ:予測の改善のために新しいデータでモデルを継続的に再トレーニングします。

パーソナライゼーション:過去のメッセージへのエンゲージメントに基づいて、個々の購読者に対して件名をパーソナライズします。

ヒューマン・イン・ザ・ループ:AIと人間の介入のバランス

AIがマーケティング戦略に統合されるにつれて、人間の関与が重要となります。マーケターは、モデルが展開される前に作成された件名や通知タイトルをレビューし、編集できるようにする必要があります。コミュニケーションの品質と適切さを確保するだけでなく、モデルができなかった創造的な意見を取り入れることも可能になります。

さらに、フィードバックループのメカニズムを持つことにより、継続的な改善と学習の道が開かれます。展開後に収集されたエンゲージメントデータは貴重なインサイトを提供し、それをさらなる改善のためにモデルにフィードバックすることができます。データプライバシー法に準拠するために、展開後のデータを匿名化することは重要です。

最後のステップとして、LLMや他のモデルの出力の正確性を向上させるために、ガードレールと基盤技術の構築がマーケターを法的、倫理的、ブランドコンプライアンスの状態に保つのに役立ちます。これにより、AIによって駆動されていても、すべてのコミュニケーションの中心にある個人的なつながりを信頼し続けることができます。

結論

生成型AIと従来の機械学習モデルの組み合わせを活用することで、魅力的な件名や通知タイトルを作成することができます。生成型AIは、トーンや対象読者に基づいて件名を作成するように微調整することができます。ランダムフォレストのような予測モデルは、最も効果的な件名やタイトルを選択するために活用することができます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

最近の記録的な売上で.AIドメイン名の価値が急上昇しています

2023年には.aiドメイン名の取引価値が著しい増加を見ています元々、「.ai」はアンギラの国別コードトップレベルドメイン(ccT...

機械学習

「OpenAIは、パーソナライズされたAIインタラクションのためのChatGPTのカスタムインストラクションを開始」

OpenAIは、AI言語モデルChatGPTのユーザーコントロールを向上させるために、新しい機能「カスタムインストラクション」を導入...

人工知能

「Cassandra To-Doリスト ChatGPTプラグインの構築」

「Cassandraのステップバイステップガイド:ChatGPTプラグインを実装して、自分のやるべきことリストを管理するための仮想パ...

データサイエンス

「グーグルのAI研究によると、グラフデータのエンコーディングが言語モデルのパフォーマンスを複雑なタスクに向上させることが明らかになりました」

近年、大型言語モデル(LLM)の研究と応用は著しく進歩しています。これらの生成モデルは人工知能コミュニティを魅了し、様々...

機械学習

「AIへの恐怖は迷信的なくだらないことだ」

「人工知能が私たちを皆殺しにすると恐れている人々は、200,000年にわたる宗教的な迷信のナンセンスと同じ間違いをしています」

データサイエンス

十年生のためのニューラルネットワークの簡略化

複雑なニューラルネットワークの概念を、コスト関数、ニューロン、バックプロパゲーション、重みとバイアスを非技術的で楽し...