You.comは、複雑な数学や科学の質問に対してより正確な回答を提供するためのコード実行機能を備えたAIエージェント、YouAgentをリリースしました
You.comはAIエージェント、YouAgentをリリースし、複雑な数学や科学の質問に正確な回答を提供します
人工知能の急速に進化する風景の中で、長い言語モデル(LLM)は、インターネット上での学習と創造を変革したことは間違いありません。彼らは広範な対話的な回答を提供し、さまざまな質問に答えることができます。しかし、彼らはいくつかの制限を抱えています。彼らは最新の情報について追いつくのが難しく、しばしば誤った情報を生成し、数学、科学、論理などの複雑な主題についての推論にも課題があります。これらの欠点により、特にSTEM分野で正確かつ信頼性の高い情報を提供するためのギャップが生まれました。
これらの課題に対応するために、You.comは2022年に先駆者として登場し、LLMの機能を活用してインターネットにアクセスし、参照するためのコンシューマープロダクトを発売しました。これにより、回答が包括的で最新の情報で、引用文献も含まれるようになりました。この成功を基に、2023年の春には、You.comはマルチモーダルなチャット出力を導入し、プロット、チャート、アプリなどのインタラクティブな視覚的要素を提供することでユーザー体験を向上させ、特にリアルタイムのトピックにおいてテキストベースの応答に対する信頼性の高い代替手段を提供しました。
そして、You.comは画期的なYouAgentを紹介し、AIエージェントの概念を新たなレベルに引き上げました。従来のLLMとは異なり、YouAgentは情報を処理するだけでなく、自身の環境内でアクションを実行することもできます。これは、Pythonコードを実行するコンピューティング環境によって可能にされています。LLMはコードを記述し実行することができ、複雑なSTEM問題の解決の可能性を広げています。さらに、YouAgentのマルチステップの推論プロセスと組み合わされたこのコードインタプリタにより、YouAgentは無類の正確さで複雑なSTEMクエリに取り組むことができます。
YouAgentの使用は簡単です。ユーザーはAIチャットインターフェースで「@agent」または「/agent」とクエリを開始することができます。これにより、You.comがYouAgentとの対話を開始し、YouAgentが自身のコンピューティング環境でPythonコードを実行することができます。現在、ログインユーザーごとに1日最大5回までYouAgentのクエリを実行できます。YouProのサブスクリバーは、1日最大100回までの拡張制限を享受することができます。
STEMベンチマークでのYouAgentのパフォーマンスは非常に印象的です。強力なGPT-4と比較しても、YouAgentはさまざまなタスクで一貫して優れた正確さを示しています。特に、公式ACT数学セクションで正確さが27%も向上しています。これはC-の生徒とA+の生徒の違いに相当し、YouAgentの計算集中型評価における優れた能力を示しています。
YouAgentの特筆すべき機能の1つは、他の一般的なLLM製品に困惑を与えるSTEMの質問に対処できる能力です。コード実行環境へのアクセスとマルチステップの推論能力を備えたYouAgentは、複雑な数学的操作に関する質問に対して信頼性の高い回答を提供することができます。
成果にもかかわらず、YouAgentは自身の成長の余地を認識しています。ベンチマークでの100%の正確さを達成することは、継続的な研究と開発を必要とする持続的な追求です。さらに、チームはコードの実行を改善し、最適な問題解決のために適切に活用することを目指しています。
今後の展望として、YouAgentは能力を拡大するという野心的な計画を持っています。これには、ファイルのアップロードのサポート、プロットやグラフなどの画像出力の生成、コード実行でのウェブ検索の実行などが含まれます。さらに、より多くの数学的・科学的なライブラリの追加、数学的テキストの改善されたフォーマット、さまざまなSTEMベンチマークでの継続的なパフォーマンス向上も予定されています。
まとめると、YouAgentはAIエージェントの潜在能力を最大限に活用する大きな進歩を表しています。従来のLLMが直面する重要な制約に対処し、STEM分野で正確で信頼性の高い情報を提供します。Pythonコードを実行するためのコンピューティング環境を活用することで、YouAgentは複雑な問題解決において比類のない能力を示しています。将来に向けて、YouAgentはAIテクノロジーとのやり取り方法を革新し、STEM分野の学習と問題解決の新たな時代を切り拓くことになるでしょう。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles