「RAGの語義における課題に取り組む ドメイン固有の検索の見落とされがちな面について」

「RAGの語義における課題と、見落とされがちなドメイン固有の検索の面について取り組む」

ハイブリッド検索、階層的なランキング、およびインストラクターの埋め込みを使用して、私たちの RAG セットアップに類似性を持つドメイン固有のドキュメントに対処する。

Generative AI augmented search technology (image generated with MidJourney)

Carsales は、オーストラリア、チリ、韓国、米国をカバーする主要な自動車プラットフォームであり、自動車およびライフスタイル車市場において、類を見ない基準を設定するために、革新的な車の売買体験を提供しています。そのために、私たちの鍵となる機能の1つは、数万件の車に関連する編集記事をスキャンする包括的な検索ツールです。現在は、私たちの編集コンテンツに専用に調整された Google 検索を組み込んで提供していますが、その結果はまずまずでしたが、主に語彙的(キーワード)の関連性に頼っており、検索クエリの本質や意味の裏にあるものを見落とすこともありました。

Search result using existing Google search

たとえば、「トヨタ・カローラ 2020 年のエアバッグの数は?」という検索では、「トヨタ・カローラ」と「エアバッグ」という単語を含む記事の結果が返されます。しかし、これらの記事は主にエアバッグのリコールについてのものであり、実際のエアバッグの数については述べられていません。ビジネス側からは、このツールを技術的に強化するだけでなく、単なる Google 検索結果の iframe から脱却し、ウェブサイトによりシームレスに統合されたインターフェースに再設計することが要望されています。

2023年7月、私たちは年に2回のグローバルハッカソンの1つを開催しました。このイベントでは通常、各部署からの参加があり、チームが結成され、アイデアが提案され、3日間の短い期間内に動作するプロトタイプに変身します。言語モデルの重要性の高まりに伴い、このハッカソンには理想的なプロジェクトが見つかりました:LLM を使用して私たちの検索ツールを刷新することです。その上で、私たちはハッカソンに勝利しました!素晴らしいチームの手の込んだ取り組みに感謝です!

この記事では、まずプロジェクトの基本的なコンセプトを概説します。その後、初期の RAG アプローチについて触れます。その後、課題に焦点を当てます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more