「産業界が音声AIを活用して消費者の期待に応えている方法」

Industrial application of voice AI to meet consumer expectations

急速な技術の進歩のおかげで、消費者は前例のないほどの便利さと効率性に慣れてきました。

スマートフォンを使えば、商品を検索して玄関先に配達してもらうのが今まで以上に簡単になりました。ビデオチャット技術を使えば、異なる大陸に住む友人や家族と簡単につながることができます。音声コマンドのツールを使えば、AIアシスタントが曲を再生したり、電話をかけたり、半径10マイル以内で最高のイタリア料理をおすすめしたりすることができます。AIのアルゴリズムは、ユーザーが次に見たいと思う番組を予測したり、購入前に読む記事を提案したりすることさえできます。

そのため、顧客は企業との迅速かつ個別化された対話を期待しています。Salesforceの調査レポートによると、83%の消費者は企業に連絡した際に即座の対話を期待し、73%の消費者は自分たちの独自のニーズと期待を理解してもらいたいと考えています。ほぼ60%の顧客は、自己サービスの機能を使って問題を解決することを望んでおり、顧客サービスを避けたいと考えています。

このような顧客の期待に応えることは、スタッフや技術的なニーズを含め、あらゆる業界の企業にとって大きな負担ですが、音声AIが助けになることがあります。

音声AIは自然言語を理解し、会話することができるため、従業員の能力を補完しながら、シームレスで多言語対応の顧客対応の機会を生み出すことができます。金融サービス業界では、銀行業務の自己サービスを支援し、レストランでのフードキオスクのアバターを可能にし、医療施設での臨床ノートの転記を行い、公共料金会社の請求支払いを効率化することができます。これにより、あらゆる業界の企業が個別化された顧客体験を提供することができます。

銀行と支払いのための音声AI

ほとんどの人々は今やデジタルと従来のチャネルの両方を使って銀行サービスにアクセスしており、オムニチャネルの個別化された顧客サポートの需要が生まれています。しかし、高いサポートの需要と高いエージェントの離職率により、多くの金融機関が顧客のサービスとサポートのニーズに追いつくのに苦労しています。

一般的な消費者の不満は、複雑なデジタルプロセスの難しさ、有益で容易に利用できる情報の不足、十分な自己サービスのオプションの不足、長い待ち時間、サポートエージェントとのコミュニケーションの困難などがあります。

NVIDIAの最近の調査によると、金融機関のAIの主な活用事例は自然言語処理(NLP)と大規模言語モデル(LLM)です。これらのモデルは、顧客サービスの対話を自動化し、非構造化の金融データを処理して、リスク管理や不正検知からアルゴリズム取引や顧客サービスまで、金融機関全体の事業をサポートするAI駆動の洞察を提供します。

銀行は音声対応の自己サービスオプションを提供し、AI搭載の仮想アシスタントで顧客サービスエージェントをサポートすることで、顧客体験を向上させながらコストを抑えることができます。AI音声アシスタントは、金融に特化した語彙や言い換えの技術を学習して、ユーザーの要求を理解してから回答を提供することができます。

会話AIソフトウェア企業であるKore.aiは、BankAssistソリューションを小売銀行の400以上のユースケースにトレーニングし、対話型音声応答、Web、モバイル、SMS、ソーシャルメディアチャネルで利用できるようにしました。顧客は音声アシスタントを使って資金を送金したり、請求書を支払ったり、紛失したカードを報告したり、請求の異議を申し立てたり、パスワードをリセットしたりすることができます。

Kore.aiのエージェント音声アシスタントは、ライブエージェントが問題を迅速に解決できるようにするために、パーソナライズされた提案をするのにも役立っています。このソリューションは、顧客処理時間を40%削減することでライブエージェントの効率を向上させ、1回の音声セッションあたりの投資対効果は2.30ドルとなっています。

このようなトレンドにより、金融機関は顧客サポートを効率化し、待ち時間を短縮し、より多くの自己サービスオプションを提供し、ローン処理を迅速化し、コンプライアンスを自動化し、話されたコンテンツから洞察を抽出し、全体的な生産性と業務のスピードを向上させるために、音声AIの展開を加速することが予想されます。

通信のための音声AI

5Gインフラへの大規模な投資と新しいネットワークの収益化と利益を追及する激しい競争が、通信業界において顧客満足度とブランドロイヤリティの維持が最重要となっています。

400以上の業界プロフェッショナルを対象としたNVIDIAの調査によると、通信業界のAIの主な活用事例はネットワークの運用の最適化と顧客体験の向上です。回答者の73%がAIからの収益増加を報告しました。

音声AI技術を使ってチャットボット、コールルーティング、自己サービス機能、およびおすすめシステムを強化することで、通信事業者は顧客のエンゲージメントを向上させ、個別化することができます。

2,200万人以上のユーザーを持つ韓国の携帯通信事業者KTは、LLMを使って韓国語を理解し使用するためにトレーニングされたインテリジェントな音声アシスタント「GiGa Genie」を開発しました。これまで800万人以上のユーザーと対話しています。

GiGA Genie AIスピーカーは、音声コマンドを理解することで、スマートテレビや照明をオンにしたり、テキストメッセージを送ったり、リアルタイムの交通情報を提供したりすることができます。

KTはさらに、1日あたり10万件以上の電話を自律的に処理できるトランスフォーマーベースの音声AIモデルを備えたAIパワードの顧客連絡センターを強化しました。システムの生成AIコンポーネントは、顧客に提案された解決策で自動的に応答し、微妙な質問や解決策については人間のエージェントに転送します。

通信会社は、顧客のセルフサービス能力を向上させ、ネットワークのパフォーマンスを最適化し、総合的な顧客満足度を向上させるために、音声AIによる活用を積極的に取り組むことが期待されています。

クイックサービスレストラン向け音声AI

飲食サービス業界は2023年に9970億ドルの売上を達成すると予測されており、その労働力は50万人の求人増加が見込まれています。一方、ドライブスルーやカーブサイドピックアップ、宅配需要の高まりは、消費者の飲食嗜好の永続的な変化を示唆しています。この変化により、高い離職率で知られる業界でスタッフの雇用、研修、定着をするという課題が生まれます。それらの課題に対応するため、音声AIを搭載したドライブスルーオーダーアシスタントや店内フードキオスクが負担を軽減することができます。例えば、音声対応のアバターは、メニューの推薦をしたり、プロモーションを提案したり、カスタマイズオプションを提供したり、食品注文を直接キッチンに伝えることで、注文プロセスの自動化を支援します。

トロントを拠点とするスタートアップであり、NVIDIA InceptionのメンバーでもあるHuExは、ドライブスルーの運営を向上させるために多言語対応の自動オーダーアシスタント「AIDA」を開発しました。このAIアシスタントは、ドライブスルースピーカーボックスでの注文を受け取り、応答し、同時に音声注文をテキストに書き起こして調理スタッフに提供します。

AIDAは、一般的な「ミルク入りコーヒー」から「バター入りコーヒー」といったあまり一般的でない注文まで、約30万以上の商品組み合わせを90%の正確性で理解することができます。さらに、さまざまなアクセントや方言も理解することで、多様な消費者にとって円滑な注文体験を提供します。

音声AIは、受注プロセスを効率化し、意思疎通のミスを減らし、顧客の待ち時間を最小限に抑えることで注文プロセスをスムーズにします。早期に取り組む企業は、音声対話から顧客のインサイトを抽出してメニューオプションを提案し、アップセルを推奨し、コストを削減しながら全体的な業務効率を改善するために音声AIを活用し始めるでしょう。

医療向け音声AI

後続パンデミック時代において、医療のデジタル化が加速し続けています。テレメディスンとコンピュータビジョンは、遠隔患者モニタリングをサポートし、音声アクティベートされた臨床システムは患者のチェックインとゼロタッチケアを支援し、音声認識技術は臨床文書の責任をサポートします。IDCによると、36%の調査回答者が患者医療のためにデジタルアシスタントを導入していると報告しています。

自動音声認識とNLPモデルは、医療現場で重要な詳細をキャプチャし、認識し、理解し、要約することができます。NVIDIAの研究者は、Machine Intelligence in Medical Imagingの会議で、最新の事前学習済みアーキテクチャを紹介し、医師と患者の会話から臨床エンティティを抽出する音声テキスト変換機能を実現しました。このモデルは、症状、薬剤名、診断、および推奨治療などを含む臨床用語を識別し、自動的に医療記録を更新します。

この技術により、手動のノート作成の負担が軽減され、保険や請求処理が加速され、介護者向けに相談の要約が作成される可能性があります。医師は行政業務から解放され、優れた体験を提供するために患者のケアに集中することができます。

医療用AIプラットフォームであるArtisightは、音声認識を使用してゼロタッチチェックインを支援し、音声合成を使用して医師が利用可能になったときに待合室の患者に通知します。Artisightキオスクを毎日1,200人以上の患者が利用し、登録プロセスを効率化し、患者体験を向上させ、自動化によるデータ入力エラーを排除し、スタッフの生産性を向上させます。

医療がスマートホスピタルモデルに向かうにつれて、医療専門家をサポートし、患者に対する低接触体験を実現するために音声AIがより大きな役割を果たすことが予想されます。これには、臨床ノート分析によるリスク要因予測と診断、多言語ケアセンターへの翻訳サービス、医療の口述と転写、その他の行政業務の自動化などが含まれます。

エネルギー向け音声AI

クリーンエネルギーへの需要の増加、高い運営コスト、高齢化する労働力に直面して、エネルギー・公益事業会社はより少ないリソースでより多くのことを行う方法を探しています。

新たな効率性を実現し、エネルギーの将来に備え、顧客の期待に応えるために、公益事業は音声AIを活用することができます。音声に基づいた顧客サービスにより、顧客は障害報告や請求について問い合わせたり、他の問題についてサポートを受けたりすることができます。音声AIはメーター読み取りを効率化し、現場技術者を音声メモや音声コマンドでサポートし、公益事業はNLPを活用して顧客の嗜好を分析することができます。

小売エネルギー向けに特別に設計されたAIアシスタントであるMinerva CQは、会話をリアルタイムでテキストに書き起こすことでカスタマーサービス担当者をサポートします。テキストはMinerva CQのAIモデルに供給され、顧客の感情、意図、傾向などを分析します。

AIアシスタントは動的にリスニングすることで、エージェントの画面に対話の提案、行動の手がかり、パーソナライズされたオファー、感情分析を表示します。知識提示機能は、顧客のエネルギー使用履歴を表示し、脱炭素化オプションを提案します。これにより、エージェントは顧客のエネルギー消費についての情報を提供し、顧客が意思決定を行う際に必要な情報を提供することができます。

AIアシスタントによる一貫した簡単な説明を通じて、エネルギー源、料金プラン、請求変更、最適な支出についてのお客様へのガイドをカスタマーサービス担当者が簡単に行うことができるようになります。Minerva CQを導入したある公益事業者は、通話処理時間の44%の削減、最初の連絡解決率の12.5%の増加、通話ごとの平均節約額が2.67ドルであると報告しています。

音声AIは、公益事業者が訓練コストを削減し、顧客サービスの対話から摩擦を取り除き、声による操作ツールをフィールド技術者に提供して生産性を向上させ、安全性を高めるのに役立つと期待されています。すべてのことを通じて、顧客満足度も向上させることができます。

公共セクター向けの音声および翻訳AI

公共サービスプログラムは予算不足や人員不足のため、重要なサービスや情報を求める市民は時間を浪費し、イライラすることがあります。この課題に対処するために、一部の連邦および州レベルの機関は、よりタイムリーなサービス提供を実現するために音声AIを活用しています。

連邦緊急事態管理庁は、自動音声認識システムを使用して緊急ホットラインを管理し、苦情信号を分析し、効率的にリソースを誘導しています。米国社会保障局は、対話型音声応答システムとバーチャルアシスタントを使用して、社会保障給付および申請プロセスに関する問い合わせに対応し、一般的な情報を提供しています。

退役軍人省は、AIのディレクターを任命して、医療システムへの技術の統合を監督しています。VAは、テレヘルスの予約中にメモを取るために音声認識技術を使用しています。また、高齢患者の認知機能の低下の分析のための神経心理学的テストのスコアリングを支援するために、高度な自動音声転写エンジンを開発しました。

公共セクターでの音声AIの追加の可能性には、市民との対話、公共イベント、または訪問外交官のためのリアルタイムの言語翻訳サービスが含まれます。多くの通話を処理する公共機関は、多言語対応の音声ベースのインターフェースを利用して、市民が異なる言語で情報にアクセスしたり、問い合わせたり、サービスをリクエストしたりできるようにすることで利益を得ることができます。

音声および翻訳AIは、多言語のオーディオ録音や口頭でのコンテンツを翻訳されたテキストに変換することにより、文書処理を自動化することもできます。これにより、コンプライアンスプロセスの効率化、データの正確性の向上、管理タスクの効率化が図られます。また、音声AIは視覚障害や身体的障害を持つ人々に対してサービスへのアクセスを拡大する可能性もあります。

自動車向けの音声AI

自動車メーカー、販売店、ドライバー、乗客にとって、音声AIは多くの利益をもたらすことができます。

ディーラーシップに直接訪れる前に、車の購入を検討する半数以上の車のショッピングは、まずオンラインで検索を開始し、情報を収集するために電話で最初の連絡を取ります。車のマニュアルに基づいてトレーニングされた音声AIチャットボットは、技術的な能力、ナビゲーション、安全性、保証、メンテナンスコストなどの質問に答えることができます。AIチャットボットはまた、試乗のスケジュールを組み立て、価格に関する質問に答え、在庫車種をショッパーに知らせることもできます。これにより、自動車メーカーは、顧客との賢明で自動化されたエンゲージメントを通じてディーラーネットワークを差別化することができます。

メーカーは、運転体験、安全性、サービスを向上させるために、高度な音声AIを車両やアプリに組み込んでいます。オンボードのAIアシスタントは、ナビゲーション、インフォテインメント、一般的な車両診断、およびユーザーマニュアルのクエリに対して自然言語音声コマンドを実行することができます。物理的なコントロールやタッチスクリーンの操作が不要なため、ドライバーはハンドルを握り、道路に目を向けたままでいられます。

音声AIは、商用フリートの車両の稼働時間を最大化するのに役立ちます。技術サービス情報とソフトウェアの更新頻度に基づいてトレーニングされたAIは、修理に対するより正確な見積もりを技術者に提供し、車をリフトに乗せる前に重要な情報を特定し、商業および中小企業の顧客に車両修理の最新情報を迅速に提供することができます。

ドライバーの音声コマンドとバグレポートから得られる洞察により、メーカーは車両の設計と操作ソフトウェアを改善することもできます。自動運転車がますます高度になるにつれて、音声AIはドライバーが車両を操作し、問題をトラブルシューティングし、支援を求め、メンテナンスをスケジュールする方法において重要な役割を果たすことが予想されます。

スマートスペースからエンターテイメントまでの音声AI

音声AIはほぼすべての業界に影響を与える可能性があります。

スマートシティでは、音声AIを使用して救急応答者に重要な情報を提供し、苦情電話を処理することができます。メキシコシティでは、国際連合薬物犯罪事務所が、ジェンダー暴力を防ぐために911通報を分析する音声AIプログラムを開発しています。AIは、苦情電話を分析することで、女性に対する家庭内暴力を防ぐ上でのキーワード、シグナル、パターンを特定することができます。音声AIはまた、公共の場での多言語サービスの提供や視覚障害を持つ人々の交通へのアクセスの改善にも使用することができます。

高等教育や研究では、音声AIを使用して講義や研究インタビューを自動的に転写することができます。これにより、学生に詳細なノートを提供し、研究者には質的データの編集にかかる時間を節約することができます。音声AIはまた、教育コンテンツをさまざまな言語に翻訳することを容易にし、そのアクセシビリティを向上させます。

LLMによって強化されたAI翻訳により、エンターテイメントやストリーミングコンテンツの多言語でのオンライン利用が容易になりました。例えば、NetflixはAIを使用して字幕を複数の言語に自動翻訳しています。一方、スタートアップのPapercupは、AIを使用してビデオコンテンツの吹き替えを自動化し、地域の言語でグローバルな観客に届けることができるようにしています。

音声AIによる製品とサービス提供の変革

現代の消費者の風景において、企業が便利で個別化された顧客体験を提供することは非常に重要です。企業はNLPと音声AIの翻訳機能を活用して、グローバルスケールでリアルタイムに運営し、顧客との対話を変革することができます。

あらゆる業界の企業は、音声AIを使用して迅速かつ多言語対応の顧客サービス応答、セルフサービス機能や情報、自動化ツールを提供し、従業員がより高い価値を持つ体験を提供できるようにしています。

音声、翻訳、対話型AIの利点を実現するために、NVIDIAはさまざまな技術を提供しています。

NVIDIA Rivaは、GPUを利用した多言語対応の音声・翻訳AIソフトウェア開発キットであり、自動音声認識、テキスト音声変換、ニューラル機械翻訳アプリケーションのための完全にカスタマイズ可能なリアルタイム対話型AIパイプラインを提供しています。

NVIDIA Tokkioは、NVIDIA Omniverse Avatar Cloud Engineをベースにしたクラウドネイティブサービスであり、AI顧客サービスエージェントとして機能する仮想アシスタントやデジタルヒューマンを作成することができます。

これらのツールにより、開発者は高精度なアプリケーションを迅速に展開し、優れた従業員および顧客体験に必要なリアルタイム応答速度を実現することができます。

9月20日に開催される無料の音声AIデーに参加して、世界的な音声・翻訳AIリーダーから画期的な研究、実世界での応用、オープンソース貢献についての話を聞いてみましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

見逃せない7つの機械学習アルゴリズム

機械学習アルゴリズムのリストは、データサイエンティストとしての旅を始めるのに最適な出発点です最も一般的なモデルを特定...

AI研究

このAI研究では、ドライブ可能な3Dガウスアバター(D3GA)を提案します:ガウススプラットでレンダリングされた人体のための最初の3Dコントローラブルモデルです

印象派は匿名の画家、彫刻家、版画家などからなる協会によって19世紀に創設された芸術運動であり、「かろうじて形を伝えるこ...

データサイエンス

常に学習中 AIがデータ漏洩を防ぐ方法

この記事では、データ侵害を防ぐために人工知能の利用について議論しています人工知能が悪意のある活動を検出し、データのパ...

データサイエンス

Rendered.aiは、合成データの生成にNVIDIA Omniverseを統合します

Rendered.aiは、プラットフォームとして提供される合成データ生成(SDG)により、開発者、データサイエンティスト、その他の...

人工知能

アーティストやクリエイターにとって最高のAIツール(2023年)

Otter.AI Otter.aiは、効率的なミーティングや会話の録音と記述を行うためのAIパワードプラットフォームです。自動音声認識を...