「SuperDuperDBを活用して簡単にシンプルな重複排除システムを作成する」

「簡単でシンプルな重複排除システムの作成に、SuperDuperDBを駆使する方法」

類似する顧客アカウントを特定するためのセマンティック検索の使用方法

Image by Author

イントロダクション

私は身元解決の分野で多くの年月を過ごし、重複する顧客アカウントを特定し、グループ化するための試みをしてきました。

私の経験では、B2Cの新規顧客には2種類あります:

  1. 真の新規顧客: 会社のデータベースに既存のアカウントがない顧客。

2. 偽の新規顧客: 会社のデータベースに1つ以上の既存のアカウントを持つ顧客

多くの大規模なB2C企業が直面する共通の問題は、顧客アカウントの重複です。つまり、顧客が1つ以上のアカウントを会社に開設します。会社の新規顧客インセンティブによって、複数のアカウントを持つ顧客はインセンティブを複数回利用する可能性があります。追跡されない場合、より多くの偽の新規顧客が増加するため、長期的には重大な金銭的損失につながる可能性があります。

最近では、LLMがリアルタイムで顧客を特定し、関連付けるのにどのように役立つかについて考えています。つまり、顧客が登録した直後に、顧客が新規顧客インセンティブの対象であるかどうかを判断することです。

これにより、次のように要約できる解決策の作成に至りました:

  • 顧客が登録した直後に、データベース内の顧客の詳細間のセマンティックな類似性を見つけるためにLLMを使用する。ただし、セマンティック検索だけでは十分ではありません。それは偽の陽性の類似性を出力する可能性があり、これらの類似性は特に実際の新規顧客が不当に罰せられる場合にビジネスの評判に悪影響を与えることがあります。
  • シンプルな再評価ロジックレイヤーを作成することにより、ポストプロセッシングタスクまたはバリデーションの第2レイヤーとして利用することで、真の陽性の結果を絞り込むのに役立ちます。

いつものように、私の思考プロセスは通常、簡単なMVPデモを迅速に構築するのに役立つツールを見つけることに終わります。そして今回も例外ではありませんでした。

最近試している新しいフレームワークはSuperDuperDBです

SuperDuperDBは、複雑なMLOpsパイプライン、専用のベクトル…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIテクノロジー

アンソニー・グーネティレケ氏は、Amdocsのグループ社長であり、テクノロジー部門および戦略部門の責任者です- インタビューシリーズ

アンソニー・グーネティレーケは、Amdocsでグループ社長、テクノロジーと戦略担当です彼と企業戦略チームは、会社の戦略を策...

人工知能

『ジュリエット・パウエル&アート・クライナー、The AI Dilemma – インタビューシリーズの著者』

『AIのジレンマ』は、ジュリエット・パウエルとアート・クライナーによって書かれましたジュリエット・パウエルは、著者であ...

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...

人工知能

「スノーケルAIのCEO兼共同創設者、アレックス・ラットナー - インタビューシリーズ」

アレックス・ラトナーは、スタンフォードAIラボを母体とする会社、Snorkel AIのCEO兼共同創設者ですSnorkel AIは、手作業のAI...

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...