バードは論理と推論力においてますます上達しています

Bird's logical and reasoning abilities are improving more and more.

2つのBardの改善が今日発表されました。まず、Bardは数学的なタスク、コーディングの質問、文字列操作においてより優れた性能を発揮するようになりました。そして、Google Sheetsへの新しいエクスポートアクションが追加されました。つまり、Bardが応答で表を生成する場合、例えば「私の動物保護区のボランティア登録のためのテーブルを作成してください」と依頼すると、それを直接Sheetsにエクスポートできるようになりました。

高度な推論と数学的なプロンプトに対する改善された応答

「暗黙のコード実行」と呼ばれる新しい技術により、Bardは計算プロンプトを検出し、バックグラウンドでコードを実行することができます。その結果、数学的なタスク、コーディングの質問、文字列操作プロンプトにより正確に応答できるようになりました。そのため、Bardは以下のようなプロンプトに対する回答が向上します。

  • 15683615の素因数は何ですか?
  • 私の貯蓄の成長率を計算してください
  • 「Lollipop」を逆にしてください

この新しい機能と、それがどのようにBardの応答を改善するのに役立つのかを詳しく見ていきましょう。

改善された論理と推論スキル

大規模言語モデル(LLM)は、プロンプトが与えられると、次に何の単語が出現する可能性が高いかを予測して応答を生成する予測エンジンのようなものです。その結果、言語やクリエイティブなタスクには非常に優れていますが、推論や数学のような分野では弱いです。高度な推論と論理的な能力を持つようにより複雑な問題を解決するためには、LLMの出力だけに頼るのは不十分です。

私たちの新しい方法により、Bardは推論と数学の能力を高めるためにコードを生成して実行することができます。このアプローチは、ダニエル・カーネマンの書籍「思考の整理学」で詳しく説明されている人間の知能のよく研究された二分法から着想を得ています。

  • システム1思考は、速く、直感的で努力を必要としません。ジャズミュージシャンが即興演奏したり、タッチタイピングで単語を考えて画面に表示されるのを見たりするときに、システム1思考を使っています。
  • 対照的に、システム2思考は遅く、緻密で努力が必要です。長い割り算を行ったり、楽器を演奏する方法を学んだりするときに、システム2思考を使っています。

この比喩では、LLMsは純粋にシステム1で動作すると考えることができます。つまり、テキストを速く生成することができますが、深い思考はできません。これにより、いくつかの驚くべき能力が発揮されますが、意外な方法で不十分な場合があります(システム1だけを使って数学の問題を解こうとすると想像してください:算術を止めて考えることができず、最初に思いついた答えを吐き出すしかありません)。従来の計算は、システム2思考に密接に沿っています。それは公式的で柔軟性がないですが、正しい手順のシーケンスで長い割り算の解決策など、印象的な結果を生み出すことができます。

この最新のアップデートにより、LLMs(システム1)と従来のコード(システム2)の機能を組み合わせて、Bardの応答の正確性を向上させることができます。暗黙的なコード実行を通じて、Bardは論理的なコードの恩恵を受ける可能性があるプロンプトを特定し、それを「ボンネットの下に書き込み」、実行し、その結果を使用してより正確な応答を生成します。これまでに、この方法により、内部チャレンジデータセットの計算ベースの単語や数学問題に対するBardの応答の正確性が約30%向上したという結果が出ています。

これらの改善があっても、Bardは常に正しいとは限りません。例えば、Bardはプロンプト応答を助けるためのコードを生成しない場合があります。また、生成されたコードが間違っていたり、実行されたコードが応答に含まれていない場合もあります。それでも、構造化された論理的な能力で応答する能力が向上したことは、Bardをさらに有用にするための重要な一歩です。今後の情報にご期待ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ディープAIの共同創業者兼CEO、ケビン・バラゴナ氏- インタビューシリーズ

ディープAIの創設者であるケビン・バラゴナは、10年以上の経験を持つプロのソフトウェアエンジニア兼製品開発者です彼の目標...

人工知能

ファイデムのチーフ・プロダクト・オフィサー、アルパー・テキン-インタビューシリーズ

アルパー・テキンは、FindemというAI人材の獲得と管理プラットフォームの最高製品責任者(CPO)ですFindemのTalent Data Clou...

人工知能

「クリス・サレンス氏、CentralReachのCEO - インタビューシリーズ」

クリス・サレンズはCentralReachの最高経営責任者であり、同社を率いて、自閉症や関連する障害を持つ人々のために優れたクラ...

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...

人工知能

「UVeyeの共同設立者兼CEO、アミール・ヘヴェルについてのインタビューシリーズ」

アミール・ヘヴァーは、UVeyeのCEO兼共同創設者であり、高速かつ正確な異常検出により、自動車およびセキュリティ産業に直面...