「Verbaに会ってください:自分自身のRAG検索増強生成パイプラインを構築し、LLMを内部ベースの出力に活用するためのオープンソースツール」

Verba an open-source tool to build a self-enhancing RAG search generation pipeline and utilize LLM for internal-based output.

Verbaは、RAGアプリにシンプルで使いやすいインターフェースを提供するオープンソースプロジェクトです。データにダイブして関連する会話をすばやく開始することができます。

Verbaは、データのクエリと操作に関する単なるツールではなく、むしろコンパニオンです。文書間の書類作成、比較、数値セット間の対比、データ分析など、WeaviateとLarge Language Models(LLMs)を通じて、Verbaはこれらすべてを実現することができます。

Weaviateの先端的なGenerative Searchエンジンに基づいて、Verbaは検索を実行するたびに必要な背景情報を自動的に取得します。LLMsの処理能力を使用して、徹底的でコンテキストに即したソリューションを提供します。Verbaのわかりやすいレイアウトにより、これらすべての情報を簡単に取得することができます。Verbaのわかりやすいデータインポート機能は、.txt、.mdなどさまざまなファイル形式をサポートしています。データをWeaviateにフィードする前に、技術はデータのチャンキングとベクトル化を自動的に実行し、検索と取得に適した形式にします。

Verbaを使用する際には、Weaviateの作成モジュールとハイブリッド検索オプションを利用してください。これらの高度な検索方法は、重要な文脈の断片を探し出すために論文をスキャンし、それを元にLarge Language Modelsが照会に対して詳細な応答を提供します。

将来の検索の速度を向上させるために、Verbaは生成された結果とクエリをWeaviateのSemantic Cacheに埋め込みます。質問に答える前に、VerbaはSemantic Cacheを調べて、すでに似たような質問に回答されているかどうかを判断します。

データ入力とクエリ機能を有効にするには、デプロイメントの方法に関係なくOpenAI APIキーが必要です。プロジェクトをクローンする際に、APIキーをシステムの環境変数に追加するか、.envファイルを作成してください。

Verbaは、特定のユースケースに応じてさまざまな方法でWeaviateインスタンスに接続することができます。VERBA_URLおよびVERBA_API_KEYの環境変数が存在しない場合、VerbaはWeaviate Embeddedを使用します。プロトタイピングやテストのためにWeaviateデータベースを起動する最も簡単な方法は、このローカルデプロイメントです。

Verbaは、さらなる処理のためのデータのインポートに関する簡単な指示を提供します。続行する前に、OpenAIアクセスキーの設定に基づいてデータのインポートにはお金がかかることに注意してください。OpenAIモデルはVerbaのみで使用されます。APIキーの料金はこれらのモデルの使用料にかかります。データの埋め込みと回答の生成が主なコスト要素です。

https://verba.weaviate.io/ で試すことができます。

Verbaには3つの主要なパートがあります:

  • Weaviate Cloud Service(WCS)またはサーバー上でWeaviateデータベースをホストすることができます。
  • このFastAPIエンドポイントは、Large Language ModelプロバイダーとWeaviateデータストアの間を仲介します。
  • React Frontend(FastAPI経由で提供される静的コンテンツ)は、データの探索と操作のためのダイナミックなユーザーインターフェースを提供します。開発。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

このAI研究論文は、視覚の位置推定とマッピングのための深層学習に関する包括的な調査を提供しています

もし私があなたに「今どこにいるの?」または「周りの様子はどうですか?」と尋ねたら、人間の多感覚知覚という独特な能力の...

人工知能

「生成AIの時代における品質保証の再考」

「GenAI が生成したコードに追いつくために、テストエンジニアはGenAIツールを活用し、QA計画の基礎を形成する必要があります」

機械学習

大規模言語モデル(LLM)と潜在ディリクレ配分(LDA)アルゴリズムを用いたドキュメントのトピック抽出

「私は、1000ページ以上の大きなドキュメントを処理することができるPDFファイルとのチャット用のウェブアプリケーションを開...

AI研究

「新しいAI研究は、3D構造に基づいたタンパク質表現学習のためのシンプルで効果的なエンコーダーを提案する」

細胞のエネルギーであるタンパク質は、材料や治療など、さまざまなアプリケーションに関与しています。タンパク質はアミノ酸...

機械学習

「2023年に知っておく必要のあるトップ10のディープラーニングツール」

コンピュータと人工知能の世界の複雑な問題には、ディープラーニングツールの支援が必要です。課題は時間とともに変化し、分...

AIテクノロジー

シンガポールがAIワークフォースを3倍に増やす予定

シンガポールは、人工知能の分野に目を向けています。国家AI戦略(NAIS)2.0の発表により、この都市国家は次の3〜5年でAIの労...