人工知能の言語スキルを評価する:ChatGPTの言語形態スキルをさらに掘り下げて

「人工知能の言語スキルを評価する:ChatGPTの言語形態スキルをより詳しく解説」

研究者は、ChatGPTの形態能力を厳密に評価し、英語、ドイツ語、タミル語、トルコ語の4つの言語で比較します。ChatGPTは専門システムと比較して、特に英語では不十分な結果となりました。この分析は、ChatGPTの形態学的スキルの制約を明らかにし、人間のような言語能力の主張を挑戦しています。

大規模言語モデル(LLM)に関する最近の研究は、主に構文と意味に焦点を当てており、形態学を見落としています。既存のLLM文献は、より多くの言語現象に注目する必要があります。過去の研究では英語の過去形について探求されてきましたが、LLMの形態学的能力の包括的な分析が必要です。この手法では、Wugテストを使用してChatGPTの4つの言語での形態学的スキルを評価します。研究結果は、専門システムと比較してChatGPTの人間のような言語能力の主張に疑問を投げかけ、その制限を示しています。

GPT-4、LLaMA、PaLMなどの最近の大規模言語モデルは、言語能力において有望な成果を示していますが、それらの形態学的な能力(単語を体系的に生成するスキル)を評価する際には、注目すべきギャップがあります。過去の研究は主に構文と意味に焦点を当てており、形態学を見落としています。この手法は、Wugテストを使用してChatGPTの形態学的スキルを4つの言語で体系的に分析し、専門システムとのパフォーマンスを比較することで、この不足を解消します。

提案された手法では、ChatGPTの形態学的能力をWugテストを通じて評価し、正解ベースラインと人間の注釈との出力を精度として比較します。ChatGPTへの事前露出がないように、ノンス単語のユニークなデータセットが作成されます。ゼロショット、ワンショット、フューショットの3つの提示スタイルが使用され、各スタイルに対して複数回実行されます。評価は話者間の形態学的な変動を考慮し、パフォーマンス評価のために英語、ドイツ語、タミル語、トルコ語の4つの言語を対象にしています。

研究結果は、ChatGPTが形態学的な能力を持つ専門システムがさらに必要であり、特に英語においてその必要性が強調されました。言語ごとのパフォーマンスは異なり、ドイツ語は人間レベルのパフォーマンスを達成しました。k(トップランクの回答数)の値が影響を与え、kが増えるにつれてベースラインとChatGPTのギャップが広がりました。ChatGPTは非現実的な曲げを生成する傾向があり、実在の単語に対するバイアスの影響を受けている可能性があります。研究結果は、大規模言語モデルの形態学的な能力についてさらなる研究の必要性を強調し、人間のような言語能力の急速な主張に注意を喚起しています。

研究では単一のモデル(gpt-3.5-turbo-0613)を使用し、他のGPT-3バージョンやGPT-4以降への一般化可能性を制限しています。限られた言語セットに焦点を当てることは、異なる言語やデータセットへの結果の一般化可能性についての疑問を呈するものです。言語の比較は制御されていない変数のため、難しいです。タミル語の限られた注釈付けツールと低い注釈付け者間の合意は信頼性に影響を及ぼす可能性があります。言語ごとのChatGPTのパフォーマンスの変動は、一般化の制約を示唆しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

メタのボイスボックス:すべての言語を話すAI

Facebookの親会社であるMetaは画期的な開発を発表し、最新の生成型人工知能(AI)であるVoiceboxを公開しました。従来のテキ...

機械学習

AIを活用した空中監視:UCSBイニシアチブがNVIDIA RTXを使い、宇宙の脅威を撃退する目的で立ち上がる

数か月ごとに流星群が起こると、観察者は夜空に散らばる流れ星や光の筋が輝く見事な光景を見ることができます。 通常、流星は...

機械学習

プラグインを使ったチャットボットのためのカスタムスキルの作成

「生成型AIを活用するチャットボットは、外部ソースと連携するプラグインを使用してドメインの専門知識を提供し、個別の応答...

機械学習

API管理を使用してAIパワードJavaアプリを管理する

OpenAIのChatGPT APIをSpring Bootアプリケーションに統合し、オープンソースのAPIゲートウェイであるApache APISIXを使用し...

機械学習

「IoT企業のインテリジェントビデオアナリティクスプラットフォームを搭載したAIがベンガルール空港に到着」

毎年、約3200万人がベンガルール空港、またはBLRを通過し、世界で最も人口の多い国の中で最も忙しい空港の一つです。 このよ...

機械学習

「2023年の機械学習のアンラーニング:現在の状況と将来の方向性」

「夜中に目が覚めたまま、脳が何度も再生するほど恥ずかしい記憶の一部を忘れたいと思ったことはありますか?特定の記憶を心...