Langchain、Weviate、およびStreamlitを使用してカスタムAIベースのチャットボットを構築する

Langchain, Weviate, and Streamlitを使用してカスタムAIベースのチャットボットを構築する

複数の組織がカスタマイズされたLLMを構築するために競い合っている中で、私がよく聞かれる共通の質問は、このプロセスを効率化するためのツールはどれですか?

この記事では、ドキュメントの上に構築されたチャットボットを通じて会話を行うための完全に機能するアプリケーションの作成方法を紹介します。このアプリケーションでは、埋め込みとして保存されたドキュメントデータから情報を抽出するためにChatGPT/GPT-4(または他の大規模言語モデル)のパワーを活用し、プロンプトチェイニングにはLangchainを使用します。以下にプレビューを示します。

Docs QA Bot | Skanda Vivek

それでは、始めましょう!

アプリの構築🏗️

まず、アプリケーションのソースコードが存在する `app` という名前の新しいフォルダを作成します。これはstreamlitアプリケーションのエントリーポイントとして機能します。次に、PDFからテキストを抽出する、テキストの埋め込みを作成する、埋め込みを保存する、最後にチャットするといったさまざまなタスクを実行するフォルダを作成します。`app` ディレクトリの構造は以下のようになります:

App Directory Structure | Skanda Vivek

PDFのアップロード

PDFをアップロードし、後続の処理のためにテキストを抽出します。

from PyPDF2 import PdfReaderimport streamlit as [email protected]_data()def extract_text(_file):    """        :param file: 抽出するPDFファイル    """    content = ""    reader = PdfReader(_file)    number_of_pages = len(reader.pages)    # 複数ページからテキストをスクレイピング    for i in range(number_of_pages):        page = reader.pages[i]        text = page.extract_text()        content = content + text    return content

コードリンク:

https://github.com/LLM-Projects/docs-qa-bot/blob/main/app/extract.py

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ピーター・マッキー、Sonarの開発者担当責任者-インタビューシリーズ

ピーター・マッキーはSonarのDeveloper Relationsの責任者です Sonarは、悪いコードの1兆ドルの課題を解決するプラットフォー...

人工知能

「クリス・サレンス氏、CentralReachのCEO - インタビューシリーズ」

クリス・サレンズはCentralReachの最高経営責任者であり、同社を率いて、自閉症や関連する障害を持つ人々のために優れたクラ...

人工知能

「ジャスティン・マクギル、Content at Scaleの創設者兼CEO - インタビューシリーズ」

ジャスティンは2008年以来、起業家、イノベーター、マーケターとして活動しています彼は15年以上にわたりSEOマーケティングを...

人工知能

「Zenの共同創設者兼CTO、イオン・アレクサンドル・セカラ氏によるインタビューシリーズ」

創業者兼CTOであるIon-Alexandru Secaraは、Zen(PostureHealth Inc.)の開発を牽引しており、画期的な姿勢矯正ソフトウェア...

人工知能

「リオール・ハキム、Hour Oneの共同創設者兼CTO - インタビューシリーズ」

「Hour Oneの共同創設者兼最高技術責任者であるリオール・ハキムは、専門的なビデオコミュニケーションのためのバーチャルヒ...

AIニュース

OpenAIのCEOであるSam Altman氏:AIの力が証明されるにつれて、仕事に関するリスクが生じる

OpenAIのCEOであるSam Altmanは、特に彼の作品であるChatGPTに関するAIの潜在的な危険性について公言してきました。最近のイ...