機械はジェンAIを使用してお互いに英語で対話すべきでしょうか?
‘美容とファッションの専門家が、機械の使用に関する意見を述べています’
「スタートレック:ネクストジェネレーション」の放送中、アンドロイドのData中佐は、英語で船のコンピュータと対話することがしばしばありました。
もちろん、作家たちは私たち視聴者にその会話を聞かせたいのでしょう。しかし、AIベースの2つのシステムが英語(または他の自然言語、つまり「人間」の言語)を通じて対話することは合理的でしょうか?
今や生成AIが急速に進化し、この問題はもはや科学小説の領域には属しません。
分散コンピューティングの黎明から、機械間(M2M)の対話には苦労してきました。英語で機械同士が会話することで、アプリケーションやデータの統合に関連する難解な課題が解決されるのでしょうか?
- 「音で見る:GPT-4V(イジョン)とテキスト読み上げ技術による視覚障がい者のサポート」
- 「Google Cloud Platformの探求:サービスと能力の包括的な概要」
- テキストデータの創造的で時折乱雑な世界’ (Tekisuto dēta no sōzōteki de tokiori ranzatsu na sekai)
APIから何を求めるのか?
アプリケーションプログラミングインターフェース(API)は、M2Mコミュニケーションの標準的なアプローチとなりました。両端が対話の文脈を明確に認識している場合、APIの作成と利用は簡単です。
他の状況では、意味の曖昧さ、不明確または変更される要件、バックエンドシステムの能力の変動などがAPIベースの対話に悩みを引き起こします。
これらの課題に対応するために、数々の技術とプロトコルが進化してきました。最近ではGraphQLというプロトコルが採用されつつありますが、情報の要求を指定することができ、提供者は要求を解釈し、応答することに努めます。
GraphQLは徐々に採用されつつありますが、情報提供者がGenAIを活用して要求を理解し、適切に応答する英語の要求を作成するような要求プログラムを利用することは、より良く、より速くなるでしょうか?
正確性を代えて顕著性を取得する
このアプローチの最も明白な問題は、GenAIの正確性の欠如です。一般的に、AIは正確ではありません。多くの場合、成功率95%を期待するのが精一杯です。
GenAIを活用したM2M対話は、この制約に悩まされることになります。さらに、対話の意図の解釈に関する追加の課題もあります。つまり、英語の話し言葉は、例えばRESTfulな対話やSQLクエリほど正確ではありません。
しかし、そのような対話が持つ正確性の欠如にもかかわらず、顕著性で補われるでしょう。
顕著性は、タスクにより目立つ情報に焦点を当てる人間の傾向のことです。あるクエリが多くのデータを生み出す場合、人間はそれを理解するのに苦労します – どのデータが重要で、どのデータがそうではないかを特定することです。言い換えれば、従来のデータクエリ手法は顕著性に苦労します。
もしクエリアプリケーションがGenAIを使用している場合、顕著性はその基盤となる大規模言語モデル(LLM)に組み込まれています。LLM自体の性質上、タスクにより適した言語パターンを選択し、大量のデータや曖昧なデータ、完璧ではないデータに対しても顕著な結果を提供できます。
GenAIに基づくM2M対話の利点
顕著性の向上に加え、GenAIを使用したM2M統合のいくつかの潜在的な利点があります:
クエリはユーザーの意図により適合しやすい。従来のクエリでは、対話するシステムは単に指示どおりに動作します。特定のクエリがユーザーの意図に合致しているかどうかは、対話には関係ありません。
対照的に、GenAIは英語のユーザープロンプトに合わせて振る舞います。その結果、結果は元のプロンプトの意図に合致しやすくなります。
暗黙的なバイアスはお互いに相殺されやすい。GenAIベースのM2M対話は、リクエスト元と提供元の2つの別々のAIが関与するため、1つのAIデータセットにおけるバイアスが別のバイアスを相殺(または少なくとも軽減)する場合があります。
たとえば、ソースデータにはバイアスのかかった採用情報(白人男性を好むなど)が含まれているが、クエリプロンプトで均等な人種と性別の履歴書を要求する場合、従来のクエリよりも元のバイアスが残存する可能性は低いでしょう。
対話は人間が読むことができるため説明可能。結果に満足している限り、ユーザーはM2M対話の中身には関心を持ちません。結果が悪い場合や、監査の一環としてそのような対話を調査する必要がある場合、M2M対話が英語であることがデバッグや説明可能な監査トレイルを提供するのに役立ちます。
ジョインは直感的で正確になります。データ統合の中で、複数のソースからデータを結合するのはおそらく最も困難な部分です – 特にデータソースに意味の違いがある場合。
GenAIは、このような違いをなくし、英語の言語プロンプトに基づくヒューマンインテントによりよく合致するクエリを作成することができます。
会話型のインタラクションはより直感的です。多くの場合、単一のクエリでは不十分です。必要なインタラクションには、エンドポイント間での複数のやり取りが必要であり、後続のクエリは前の結果に依存します。
GenAIを使用すると、そのようなインタラクションはただの会話です – 2つのAIが交互に応答を生成します。こうした会話は必要な情報をより多く明らかにし、従来のM2Mインタラクションよりも速くそれを行う可能性があります。
自律エージェントのサポートが向上します。典型的なM2Mインタラクションでは、人間がクエリを生成するアクションを起こすまで何も起こりません。自律エージェント – 前の人間の要求がないまま自分の裁量で動作するソフトウェアの一部 – は、このようなM2Mインタラクションの範囲外にあります。
対照的に、GenAIでは、AIがヒューマンクエリに応答するというスペクトルと、AI自体が行動するというスペクトルの間に進化する可能性があります。自律シナリオでさえ、まだ何らかの人間が最初の動きを起こします。AIがより洗練され(そして信頼が増す)につれて、より多くの状況で自律的に行動する可能性が高くなります。
ただし、これらのシナリオのいずれにおいても、AIが完全であることを期待していません – 特に技術がまだ成熟している今となっては。GenAIは顕著な結果を生み出すでしょうか?ヒューマンインテントに沿った行動をとりますか?おそらく、そうかもしれませんし、そうでないかもしれません。
The Intellyxの意見
私がGenAIについての記事を読んでいるなら、特に私がそれを馬鹿げていると指摘した記事では、私が懐疑的なことを知っているでしょう。しかし、この記事では、それが今日のほとんどの議論を超えた技術の潜在的な能力を探求しています。なぜでしょうか?
答えは、M2Mインタラクションは、人間がそれとやり取りする際にGenAIが直面する馬鹿げた問題をほとんど回避していることです。
人間は感じの良い意味づけを好む傾向があります。人々がGenAIとやり取りする際に、彼らは共感、知能、および他の人間の特徴をそれに与える傾向がありますが、それは単にGenAIには備わっていないものです。
M2Mインタラクションでは、これらの特性には関心がありません。私たちが関心を持つのは、AIがユーザーの意図をどれだけよく表現し、どれだけ適切な応答を提供するかです。
言い換えれば、M2Mインタラクションは、履歴書の作成やセラピーの提供など、人々がGenAIに適用すると思われる他の馬鹿げたアプリケーションよりも、GenAIのためのより良い使用例かもしれません。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles