Langchain、Weviate、およびStreamlitを使用してカスタムAIベースのチャットボットを構築する

Langchain, Weviate, and Streamlitを使用してカスタムAIベースのチャットボットを構築する

複数の組織がカスタマイズされたLLMを構築するために競い合っている中で、私がよく聞かれる共通の質問は、このプロセスを効率化するためのツールはどれですか?

この記事では、ドキュメントの上に構築されたチャットボットを通じて会話を行うための完全に機能するアプリケーションの作成方法を紹介します。このアプリケーションでは、埋め込みとして保存されたドキュメントデータから情報を抽出するためにChatGPT/GPT-4(または他の大規模言語モデル)のパワーを活用し、プロンプトチェイニングにはLangchainを使用します。以下にプレビューを示します。

Docs QA Bot | Skanda Vivek

それでは、始めましょう!

アプリの構築🏗️

まず、アプリケーションのソースコードが存在する `app` という名前の新しいフォルダを作成します。これはstreamlitアプリケーションのエントリーポイントとして機能します。次に、PDFからテキストを抽出する、テキストの埋め込みを作成する、埋め込みを保存する、最後にチャットするといったさまざまなタスクを実行するフォルダを作成します。`app` ディレクトリの構造は以下のようになります:

App Directory Structure | Skanda Vivek

PDFのアップロード

PDFをアップロードし、後続の処理のためにテキストを抽出します。

from PyPDF2 import PdfReaderimport streamlit as [email protected]_data()def extract_text(_file):    """        :param file: 抽出するPDFファイル    """    content = ""    reader = PdfReader(_file)    number_of_pages = len(reader.pages)    # 複数ページからテキストをスクレイピング    for i in range(number_of_pages):        page = reader.pages[i]        text = page.extract_text()        content = content + text    return content

コードリンク:

https://github.com/LLM-Projects/docs-qa-bot/blob/main/app/extract.py

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「aiOlaのCEO兼共同創設者、アミール・ハラマティによるインタビューシリーズ」

アミール・ハラマティは、aiOlaのCEO兼共同創業者であり、スピーチを作業可能にし、どこでも完全な正確さで業界固有のプロセ...

データサイエンス

「David Smith、TheVentureCityの最高データオフィサー- インタビューシリーズ」

デビッド・スミス(別名「デビッド・データ」)は、TheVentureCityのチーフデータオフィサーであり、ソフトウェア駆動型のス...

機械学習

3つの質問:大規模言語モデルについて、Jacob Andreasに聞く

CSAILの科学者は、最新の機械学習モデルを通じた自然言語処理の研究と、言語が他の種類の人工知能をどのように高めるかの調査...

人工知能

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、...

人工知能

「パクストンAIの共同創業者兼CEO、タングイ・シャウ - インタビューシリーズ」

タングイ・ショウは、Paxton AIの共同創設者兼CEOであり、法的研究と起草の負担を軽減するためにGenerative AIを使用するプラ...

人工知能

「ElaiのCEO&共同創業者、Vitalii Romanchenkoについてのインタビューシリーズ」

ヴィタリー・ロマンチェンコは、ElaiのCEO兼共同創設者であり、マイク、カメラ、俳優、スタジオの必要なく、個人が一流のビデ...