「xVal」というものに出会いましょう:科学応用のために数字を言語モデルにエンコードするための継続的な方法で、任意の数字を表すために単一のトークンだけを使用します

『xVal』というものに出会いましょう:科学応用のために数字を言語モデルにエンコードする、単一トークンで表される継続的な方法

大規模言語モデルの領域において、ひとつの迷惑な問題が浮かび上がっています。これらのモデルは多くの言語に基づくタスクをマスターすることができますが、大きな数字を含む数字の計算を行う場合にはしばしばつまづきます。具体的には、4桁の数字を二つ掛け合わせると、成功率はわずか90%足らずとなり、改善の余地があります。

この問題は、数字と他の形式の言語との固有の違いに由来しています。文字や単語とは異なり、数字は連続する値のスペクトルを包括し、厳格で複雑な規則に従います。この課題は、言語モデルと数値データの交差点についての疑問を提起し、解決策の探求を促しました。

この問題への既存の解決策はほとんどありませんし、完全なものでもありません。言語に関連するタスクで優れた性能を発揮するLLM(大規模言語モデル)が、数字の連続的かつ無限に変動する性質に対応するのに苦労しています。多くのアプローチでは、トークン化が行われ、数字が複数のトークンに分割されてモデルの複雑さやメモリ要件が増大します。

ポリマス(Polymathic)AIの研究者は、革命をもたらしうる可能性を秘めたゲームチェンジャー、xValエンコーディング戦略を導入します。この革新的なアプローチは、科学的なアプリケーションでLLM(大規模言語モデル)内の数字のエンコーディングにおいて新しい視点を提供します。xValは、任意の数値を表すために[NUM]という単一のトークンを使用します。

xVal戦略は、LLM内の数字を異なる方法で処理することにより、これを実現します。複数のトークンに頼るのではなく、各数字を事前処理し、別々のベクトルに保存します。テキストでは数値が[NUM]トークンに置き換えられます。デコード時には、トランスフォーマーアーキテクチャ内の専用のトークンヘッドが使用され、[NUM]トークンに関連付けられた値を予測するために平均二乗誤差(MSE)損失がガイドとして使用されます。

一連の実験において、xValの能力は厳密にテストされ、他の4つの数値エンコーディング戦略と比較されました。その結果は興味深いものでした。xValは多要素タスクで他の手法を凌駕し、大規模な多桁整数の乗算などの複雑な計算でも同等の結果を示しました。

ERA5のグローバル気候データセットからの気温データに適用した場合、xValの連続性バイアスにより、トレーニング時間を最小限に抑えつつ最良のパフォーマンスを発揮しました。

惑星シミュレーションでは、外部分布のデータの予測において、他のすべてのエンコーディング方式を上回るxValの優れた補間能力が示されました。

結論として、言語モデル内での数字のエンコーディングにおいて、xValの革新的なアプローチは未来を革命する可能性を秘めています。効率的かつ正確な方法で数値を表現するという課題に対処することは、科学的な領域における革新的なアプリケーションへの扉を開くことであり、複数の科学領域を結びつける基礎モデルの開発を促進し、将来の科学的研究の景観を再定義する可能性を秘めた画期的な解決策となるでしょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

ロボットが「グリップ」のアップグレードを取得:AO-Graspがロボットに物を落とさない技術を教えます!

近年、ロボットは製造業から医療まで、様々な産業でますます使用されています。しかし、彼らのタスクを遂行する効果は、環境...

AI研究

メタAI研究者がGenBenchを導入:自然言語処理の汎化を進める革命的なフレームワーク

モデルの一般化能力は、自然言語処理(NLP)の持続的な成功にとって重要です。重要な要素として一般的に受け入れられているも...

人工知能

「ゲームからAIへ:NvidiaのAI革命における重要な役割」

Nvidiaは現在、Facebook、Tesla、Netflixよりも価値が高くなっていますロイターによると、株価は過去8ヶ月で3倍に増加しまし...

機械学習

「オーディオソース分離のマスターキー:AudioSepを紹介して、あなたが説明するものを分離します」

Computational Auditory Scene Analysis(CASA)は、複雑な聴覚環境で個別の音源を分離し理解することに焦点を当てた音声信号...

AIニュース

OpenAIはGPT-4をターボチャージしています:高速かつ手頃な価格で生成型AIを革命化

ジェネレーティブAIの世界は、OpenAIが最新のブレイクスルー、GPT-4 Turboを発表すると大いに盛り上がっています。この革命的...

データサイエンス

「埋め込みモデルでコーパス内の意味関係を探索する」

最近、私はいくつかの仲間の学生や学者と話をしてきましたが、彼らは自由形式のテキストの分析に関心を持っていました残念な...