会社の文書から洞察を抽出するために、ビジネスユーザーにAmazon SageMaker Canvas Generative AIを活用する力を与えましょう
ビジネスユーザーに洞察を抽出する力を与えるために、Amazon SageMaker Canvas Generative AIを活用しましょう
企業は、複雑な問題を解決し、結果を改善するために機械学習(ML)の潜在能力を活用しようとしています。これまでは、MLモデルの構築と展開には、MLモデルのチューニングや運用パイプラインのメンテナンスを含む、高度な技術的およびコーディングスキルが必要でした。2021年の導入以来、Amazon SageMaker Canvasは、ビジネスアナリストがコードを1行も書かずに、表形式、コンピュータビジョン、自然言語処理などさまざまなMLモデルを構築、展開、使用することを可能にしました。これにより、タイムシリーズの予測、顧客の離脱予測、感情分析、産業の欠陥検出などのユースケースにおいて、企業がMLを適用する能力が向上しました。
2023年10月5日に発表された2023年10月12日のリリースにより、SageMaker Canvasはモデルのサポートを拡大し、ファウンデーションモデル(FM)に対応しました。このファウンデーションモデルは、コンテンツの生成と要約に使用される大規模な言語モデルです。SageMaker Canvasを使用すると、ユーザーは企業データに基づいた質問を行い、それに対する回答を得ることができます。これにより、結果はコンテキストに基づいており、コードのないMLをビジネスの問題解決に適用できる追加のユースケースが開かれます。たとえば、ビジネスチームは、組織の特定の語彙と原則に一貫した回答を作成し、長文のドキュメントを迅速にクエリして、そのドキュメントの内容に特定かつ具体的な回答を得ることができます。すべてのコンテンツは、プライベートかつ安全な方法で実行され、すべての機密データが適切なガバナンスと保護措置でアクセスされることが保証されます。
まず、クラウド管理者はAmazon Kendraインデックスをエンタープライズデータで構成し、SageMaker Canvasのデータソースとしてポプレートします。Canvasのユーザーは、自分のドキュメントがあるインデックスを選択し、ソースオブスルースによって常にバックアップされることを知って、アイデアを出したり、調査したり、探索したりすることができます。SageMaker Canvasは、Amazon BedrockとAmazon SageMaker JumpStartの最新のFMを使用します。複数のFMを並べて会話を開始し、出力を比較することもできます。これにより、生成型AIを誰にでもアクセス可能にできます。
今回の投稿では、最近リリースされた機能をレビューし、アーキテクチャについて説明し、SageMaker Canvasがナレッジベースからドキュメントをクエリできるようにするステップバイステップガイドを紹介します。次のスクリーンキャプチャで示されるように。
- 「Amazon Kendraを使用した知的にDrupalコンテンツを検索する」
- 「Intuitivoは、AWS InferentiaとPyTorchを使用して、AI/MLのコストを節約しながら、より高いスループットを実現します」
- 「サンゴ礁の衰退を転換する:CUREEロボットが深海にディープラーニングでダイブする」
ソリューションの概要
ファウンデーションモデルは、一般的、曖昧、関連性のない、事実に基づかない回答(幻影)を生成する場合があります。Retrieval Augmented Generation (RAG)は、幻影を減らすために頻繁に使用されるアプローチです。RAGアーキテクチャは、FMの外部からデータを取得し、それをコンテキストに基づいた学習に使用して、ユーザーのクエリに答えます。これにより、FMは信頼性のあるナレッジベースからデータを使用し、その知識を利用してユーザーの質問に答えることができます。
RAGでは、FM以外のデータとして、ドキュメントリポジトリ、データベース、APIなど複数の異なるデータソースからデータを取得することができます。最初のステップは、ドキュメントコレクションまたはナレッジライブラリと、ユーザーからのクエリを共通の形式に変換して関連性の意味的検索を実行することです。フォーマットを互換性のあるものにするために、ドキュメントコレクションやユーザーからのクエリは、埋め込みモデルを使用して数値表現に変換されます。
このリリースでは、RAG機能がコードなしでシームレスに提供されます。エンタープライズは、Amazon Kendraを基礎としたナレッジマネジメントシステムとの統合により、Canvasのチャットエクスペリエンスを豊かにすることができます。次のダイアグラムは、ソリューションのアーキテクチャを示しています。
SageMaker CanvasとAmazon Kendraを接続するには、1度だけのセットアップが必要です。詳細な手順は、「ドキュメントのクエリ設定」で詳細に説明しています。SageMakerドメインの設定がまだの場合は、「Amazon SageMakerドメインへの参加」を参照してください。
ドメインの設定の一部として、クラウド管理者はビジネスアナリストがFMとのやり取りでクエリできるKendraのインデックスを1つ以上選択することができます。
Kendraのインデックスが水分補給され、設定された後、ビジネスアナリストはSageMaker Canvasでそれらを使用します。「新しいチャットを開始」ボタンをクリックし、「ドキュメントのクエリ」トグルを選択します。そうすることで、SageMaker CanvasがAmazon Kendraと選択したFM間の通信を管理し、以下の操作を実行します:
- ユーザーからの質問でKendraのインデックスをクエリします。
- スニペット(およびソース)をKendraのインデックスから取得します。
- オリジナルのクエリとスニペットでプロンプトをエンジニアリングし、基礎モデルが取得されたドキュメントから回答を生成できるようにします。
- 応答の形成に使用されたページ/ドキュメントへの参照とともに、生成された回答をユーザーに提供します。
ドキュメントのクエリ設定
このセクションでは、Kendraインデックスを介して提供されるドキュメントをクエリするためのキャンバスの設定手順を説明します。以下の前提条件が必要です:
- SageMakerドメインの設定 – Amazon SageMakerドメインへの参加
- Kendraインデックス(1つ以上)の作成
- Kendra Amazon S3コネクタの設定 – Amazon S3コネクタに従い、PDFファイルおよびその他のドキュメントをKendraインデックスに関連付けられたAmazon S3バケットにアップロードします
- CanvasがAmazon Bedrockおよび/またはSageMakerエンドポイントを呼び出すために必要な権限を持つようにIAMを設定します – キャンバスチャットのセットアップのドキュメントに従います
これで、ドメインを更新して所望のインデックスにアクセスできるようにできます。SageMakerコンソールで、指定されたドメインの「ドメイン設定」タブの下で「編集」を選択します。Canvas設定のステップで、「Amazon Kendraでドキュメントをクエリする」トグルを有効にします。有効にしたら、Canvasで使用する1つ以上のKendraインデックスを選択します。
これで、キャンバスのドキュメントクエリ機能を設定するために必要なものは以上です。ユーザーはキャンバス内のチャットに参加し、Kendraインデックスを介してドメインに添付されたナレッジベースを使用できます。ナレッジベースの管理者は、ソースオブトゥルースを引き続き更新でき、Kendraの同期機能により、チャットユーザーは最新の情報をシームレスに使用できます。
チャットでのドキュメントクエリ機能の使用方法
SageMaker Canvasユーザーとして、ドキュメントクエリ機能はチャットからアクセスできます。SageMaker Canvasの「Ready-to-use models」タブで、「Generate, extract and summarize content」ボタンをクリックまたは検索して、チャットセッションを開始できます。
その後、画面のトグルでクエリドキュメントをオンまたはオフにすることができます。機能について詳しくは情報プロンプトをご覧ください。
クエリドキュメントが有効になっている場合、クラウド管理者によって有効化されたKendraインデックスのリストから選択することができます。
新しいチャットを開始する際にインデックスを選択することができます。その後、選択したインデックスから自動的に知識が取得されるUXで質問をすることができます。ただし、特定のインデックスに対して会話が開始された後は、他のインデックスに切り替えることはできません。
質問に対しては、チャットにはFMによって生成された回答とその回答の生成に貢献したソースドキュメントが表示されます。ソースドキュメントのいずれかをクリックすると、Canvasがドキュメントのプレビューを開き、FMが使用した抜粋が強調表示されます。
結論
対話型AIは、顧客や従業員の体験を人間のようなアシスタントとして変革する可能性を持っています。以下のような自然で直感的な対話を提供します:
- 特定のトピックの調査、組織の知識ベースの検索や閲覧
- 大量のコンテンツの要約による洞察の迅速な収集
- エンティティ、センチメント、PIIなどの有用なデータの検索、非構造化コンテンツのビジネス価値の向上
- 文書や業務文書の草稿の生成
- 内部ソース(インシデント、チャットログ、ウィキ)からの知識記事の作成
チャットインターフェース、知識検索、およびFMの革新的な統合により、企業はドメイン知識と真実の情報源を使用してユーザーの質問に正確で関連性のある回答を提供することができます。
SageMaker CanvasをAmazon Kendraの知識ベースに接続することで、独自のデータを独自の環境内に保持しながら、FMの最先端の自然言語能力を活用することができます。SageMaker CanvasのQuery Documents機能の導入により、どの企業でも安全なチャット体験を提供するためにLLMsと企業の知識を真実の情報源として使用することが容易になりました。このすべての機能はノーコード形式で利用でき、企業は反復的で非専門化されたタスクを処理する必要がありません。
SageMaker Canvasについて詳しくは、「SageMaker Canvasの発表」をご覧ください。データサイエンティストとビジネスアナリストの間でのコラボレーションを促進するSageMaker Canvasの詳細については、「ビルド、共有、展開ポスト」をお読みください。最後に、自分自身のRetrieval Augmented Generationワークフローを作成する方法については、SageMaker JumpStart RAGを参照してください。
参考文献
Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S., Kiela, D. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Advances in Neural Information Processing Systems, 33, 9459-9474.
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles