Amazon SageMakerのCanvas sentiment analysisとtext analysisモデルを使用して製品レビューから洞察を抽出するために、ノーコードの機械学習を使用してください

ノーコードの機械学習を活用した製品レビューからの洞察抽出において、Amazon SageMakerのCanvas sentiment analysisとtext analysisモデルをご利用ください

根据Gartner的数据,85%的软件买家与个人推荐一样信任在线评论。客户通过多个渠道提供关于他们购买的产品的反馈和评论,包括评论网站、供应商网站、销售电话、社交媒体等等。多渠道的客户评论数量不断增加的问题在于,传统方法很难让公司从这些数据中进行处理和提取有意义的见解。机器学习(ML)可以分析大量的产品评论并识别出其中的模式、情感和讨论主题。凭借这些信息,公司可以更好地了解客户的偏好、痛点和满意度。他们还可以利用这些信息来改进产品和服务、发现趋势,并采取推动业务增长的战略行动。然而,对于没有机器学习从业者、数据科学家或人工智能(AI)开发人员等资源的公司来说,实施ML可能是个挑战。有了新的亚马逊SageMaker Canvas功能,业务分析师现在可以使用机器学习从产品评论中得出见解。

SageMaker Canvas专为业务分析师的功能需求而设计,使用AWS的无代码机器学习进行表格数据的即席分析。SageMaker Canvas是一个视觉化的、点对点的服务,允许业务分析师在不编写一行代码或不需要机器学习的专业知识的情况下生成准确的机器学习预测。您可以使用模型进行交互式预测和批量评分。SageMaker Canvas提供完全托管的可用AI模型和自定义模型解决方案。对于常见的机器学习用例,您可以使用可用的AI模型来生成与您的数据相关的预测,而无需进行任何模型训练。对于特定于您业务领域的机器学习用例,您可以使用自己的数据对机器学习模型进行训练,以进行自定义预测。

在本文中,我们演示如何使用可用的情感分析模型和自定义文本分析模型从产品评论中得出见解。在这个用例中,我们有一组合成的产品评论,我们想要分析其情感,并按产品类型对评论进行分类,以便更容易绘制出有助于业务利益相关者做出更明智决策的模式和趋势。首先,我们介绍了使用可用的情感分析模型确定评论情感的步骤。然后,我们将为您介绍使用文本分析模型对评论进行分类的过程。接下来,我们解释如何查看训练模型的性能。最后,我们解释如何使用训练好的模型进行预测。

情感分析是一种自然语言处理(NLP)的即用模型,用于分析文本情感。情感分析可以用于单行或批量预测。每一行文本的预测情感可以是积极的、消极的、混合的或中性的。

文本分析允许您使用自定义模型将文本分类为两个或多个类别。在本文中,我们希望基于产品类型对产品评论进行分类。要训练一个文本分析的自定义模型,您只需提供一个包含文本和相关类别的CSV文件的数据集。数据集需要至少有两个类别和每个类别125行的文本。在训练完成模型后,您可以查看模型的性能并在使用它进行预测之前进行重新训练(如果需要)。

先决条件

完成以下先决条件:

  1. 拥有一个AWS账户
  2. 设置SageMaker Canvas
  3. 下载样本产品评论数据集:
    • sample_product_reviews.csv – 包含2,000条合成的产品评论,用于情感分析和文本分析预测。
    • sample_product_reviews_training.csv – 包含600条合成的产品评论和三个产品类别,用于文本分析模型训练。

情感分析

まず、製品レビューの感情を判定するために、以下の手順を完了して感情分析を使用します。

  1. SageMakerコンソールで、ナビゲーションペインでCanvasをクリックし、Open CanvasをクリックしてSageMaker Canvasアプリケーションを開きます。
  2. ナビゲーションペインでReady-to-use modelsをクリックし、Sentiment analysisをクリックします。
  3. Batch predictionをクリックし、Create datasetをクリックします。
  4. Dataset nameを指定し、Createをクリックします。
  5. Select files from your computerをクリックして、sample_product_reviews.csvデータセットをインポートします。
  6. Create datasetをクリックし、データを確認します。最初の列にはレビューが含まれ、感情分析に使用されます。2番目の列にはレビューIDが含まれ、参照用にのみ使用されます。
  7. データのアップロードプロセスを完了するために、Create datasetをクリックします。
  8. Select dataset for predictionsビューで、sample_product_reviews.csvを選択し、Generate predictionsをクリックします。
  9. バッチ予測が完了したら、Viewをクリックして予測を表示します。
Sentiment Analysis Steps

感情と信頼度の列は、それぞれ感情と信頼スコアを提供します。信頼スコアは、感情が正しく予測される確率を示す、0から100%の間の統計値です。

  1. 結果をコンピュータにダウンロードするためにDownload CSVをクリックします。

テキスト分析

このセクションでは、カスタムモデルを使用してテキスト分析を実行する手順を説明します:データのインポート、モデルのトレーニング、および予測の作成。

データのインポート

まず、トレーニングデータセットをインポートします。以下の手順を完了します:

  1. Ready-to-use modelsページで、Create a custom modelをクリックします。
  2. Model nameに名前を入力します(たとえば、Product Reviews Analysis)。Text analysisをクリックし、Createをクリックします。
  3. Selectタブで、sample_product_reviews_training.csvデータセットをインポートするためにCreate datasetをクリックします。
  4. Dataset nameを指定し、Createをクリックします。
  5. Create datasetをクリックし、データを確認します。トレーニングデータセットには、製品カテゴリを説明する第三の列と、本、ビデオ、音楽の3つの製品からなるターゲット列が含まれています。
  6. データのアップロードプロセスを完了するために、Create datasetをクリックします。
  7. Select datasetページで、sample_product_reviews_training.csvを選択し、Select datasetをクリックします。
Classification Steps

モデルのトレーニング

次に、モデルを構成してトレーニングプロセスを開始します。

  1. Buildタブで、Target columnのドロップダウンメニューで、トレーニングターゲットとしてproduct_categoryをクリックします。
  2. ソースとしてproduct_reviewをクリックします。
  3. モデルトレーニングを開始するためにQuick buildをクリックします。

Quick buildとStandard buildの違いについては、Build a custom modelを参照してください。

モデルのトレーニングが完了したら、予測に使用する前にモデルのパフォーマンスを確認することができます。

  1. Analyzeタブでは、モデルの信頼スコアが表示されます。信頼スコアは、モデルの予測が正しいかどうかを示します。また、Overviewタブでは、各カテゴリのパフォーマンスを確認することができます。
  2. Scoringをクリックしてモデルの精度に関する情報を確認します。
  3. Advance metricsをクリックして混同行列とF1スコアを確認します。

予測の作成

カスタムモデルを使用して予測を行うには、以下の手順を完了します。

  1. Predictタブで、Batch predictionをクリックし、Manualをクリックします。
  2. 以前に感情分析に使用した同じデータセット、sample_product_reviews.csvをクリックし、Generate predictions.をクリックします。
  3. バッチ予測が完了したら、Viewをクリックして予測を表示します。

カスタムモデルの予測には、SageMaker Canvasが初回使用のためにモデルを展開するために時間がかかります。15分間アイドル状態になると、SageMaker Canvasはモデルの展開を自動的に解除してコストを節約します。

Prediction(カテゴリ)列とConfidence列は、予測された製品カテゴリと信頼スコアを提供します。

  1. 完了したジョブをハイライトし、3つの点を選択してDownloadをクリックして結果をコンピュータにダウンロードします。

クリーンアップ

ナビゲーションパネルでLog outをクリックしてSageMaker Canvasアプリケーションからログアウトし、Canvasセッション時間の消費を停止し、すべてのリソースを解放します。

結論

この投稿では、MLの専門知識なしで製品レビューから洞察を得る方法をAmazon SageMaker Canvasを使用して示しました。最初に、準備ができた感情分析モデルを使用して製品レビューの感情を判断しました。次に、クイックビルドプロセスを使用してカスタムモデルをテキスト分析でトレーニングしました。最後に、トレーニングされたモデルを使用して製品レビューを製品カテゴリに分類しました。これを行うために、1行のコードも書く必要はありませんでした。モデルの結果と予測の信頼性を比較するために、標準ビルドプロセスでテキスト分析プロセスを繰り返すことをおすすめします。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

リトリーバル・オーグメンテッド・ジェネレーションにおける関連性の課題にどのように対処するか

パート1では、非最適な埋め込みモデル、効率の悪いチャンキング戦略、およびメタデータフィルタリングの不足により、LLMから...

人工知能

認知AI:人間のように考えるAIへの道

目的は、関連する予測を行い、自動的な意思決定をすることができるようにすることですつまり、新しい文脈情報をアクションに...

データサイエンス

LLMs (Language Models)による電子メール効率化の次なるフロンティア

紹介 人工知能(AI)は、特に大規模な言語モデル(LLM)の台頭のおかげで、過去数年間で大きく成長しました。豊富な人間の言...

データサイエンス

ユーザーフィードバック - MLモニタリングスタックの欠けている部分

「AIモデルを数ヶ月もかけて実装し、何百万円も投資してみたけれど、誰も使ってくれないことって経験ありますか?採用の課題...

人工知能

オープンソースとオープンイノベーションによるAIシーンの破壊

AIの運命は、オープンソースとオープンイノベーションを活用する小規模なVoAGI企業によって追い越されることですGoogleやOpen...

AIニュース

検索における生成AIが120以上の新しい国と地域に拡大します

「Generative AI in Search」または「Search Generative Experience(SGE)」は、世界中で拡大し、4つの新しい言語が追加され...