「ChatGPTの新たなライバル:Googleのジェミニ」

「チャットGPTに挑む新ライバル:Googleのジェミニ」

今しばらくの間、ChatGPTが注目されています。誰もがそれについて話しており、多くの人々がそれを使用していますが、何が間違ってしまう可能性があるのでしょうか?

Googleは常にAIを重視する企業であることを目指してきましたし、これまでうまくやってきました。しかし、昨年はChatGPTという点でOpenAIがリードを取ってきたことは明らかであり、Googleが再びリードを取るために参入するのは時間の問題でした。

CEOのSundar Pichaiは以下のように述べています。

最初からAIに興味を持った一つの理由は、私たちの使命を恒久的なものと考えてきたからです。

ここでご紹介するのは、GoogleのGeminiです。

もしまだトレーラーを見たことがない場合、こちらでご覧になることをおすすめします。

Geminiとは何ですか?

GeminiはGoogleの最大の言語モデルであり、CEOのPichai氏が最初に試験的に公開したもので、現在は公開されています。公開されているのはなぜでしょうか?それにしても、なぜChatGPTがびくびくしているのでしょうか?

Geminiは単なる単一のAIモデルではありません。さまざまなバリエーションがあり、さまざまな要求に対応しています。たとえば、Androidデバイスで実行可能な軽量版のGemini Nanoや、Googleの多くのAIサービスを駆動するためにBarbのバックボーンを使用したGemini Proなどがあります。

しかし、それだけではありません。Googleの最も高性能で最も強力なLLMであるGemini Ultraも存在します。Gemini Ultraは特にデータセンターやエンタープライズアプリケーション向けに設計されたようです。

簡単な概要です。

  • Gemini Ultra – 高度な複雑なタスクに最適な最大かつ最も高性能なモデル。
  • Gemini Pro – 幅広いタスクにスケーリングするための最適なモデル。
  • Gemini Nano – デバイス上でのタスクに最も効率的なモデル。

この3つの変種を持つ大規模言語モデルは、さまざまなタイプの情報を理解し操作するために構築されています。テキスト、コード、画像、音声、動画など、さまざまな情報を扱えます。最高のマルチモダリティです。

それでは、実際にどれくらい優れているのでしょうか?

Geminiの性能

Googleは、Geminiモデルを要件に適合するようにテストするために多くの努力をしてきました。現在のLLM研究で広く使用されている32のベンチマークのうち、GoogleのGemini Ultraは30のベンチマークで既存の最新技術を上回り、驚異的な90.0%のスコアを記録しました。

Gemini UltraはMMLU(大規模マルチタスク言語理解)で人間の専門家を上回る最初のモデルとなりました。MMLUは数学、歴史、法律、医学、物理学など57の科目を組み合わせて、世界の知識や問題解決能力をテストするものです。

これらのベンチマークを見てみると、Geminiの最大の利点は、動画やオーディオに理解し対話する能力を持っていることです。

OpenAIは、DALL-EWhisperの作成によってこれを達成しようとしてきました。しかし、Googleは最初から多感覚モデルを追求しました。また、Googleはコーディングの改善にも言及しており、AlphaCode 2という新しいコード生成システムを使用しており、他のコーディング競技参加者と比較して85%の向上を達成しているとされています。

これを言っておくと、ベンチマークは単なる基準です。Geminiの実力は、普段のユーザーがそれと対話することで完全に理解できるでしょう。

Geminiの機能についてもっと詳しく知りたい場合は、この動画をご覧ください。

 

Geminiへのアクセス方法

 

Pixel 8 Proのユーザーの場合、Recorderアプリの自動要約機能やGboardキーボードのSmart Reply機能など、Gemini Nanoのおかげでいくつかの新機能を既にご覧になっているかもしれません。

Gemini Proをすぐに試してみたい場合は、Bardを利用できます。また、開発者やエンタープライズのお客様は、12月13日からGoogle Generative AI StudioまたはGoogle CloudのVertex AIを介してGemini Proにアクセスできるようになります。

Gemini Nanoに興味がある場合は、来年まで少し待つ必要があります。

Geminiは現時点では英語のみ利用可能なことをご注意ください。Pichai CEOは、このモデルをGoogleの検索エンジン、広告製品、Chromeブラウザなどに統合することを目指していると述べており、より多くの言語が利用可能になる予定です。

 

まとめ

 

これはGoogleがAIイノベーションの最前線にいた理由を示す時であると思われます。次に何が現れるか、どう思いますか。

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)**** はデータサイエンティストであり、フリーランスの技術ライターです。特に、データサイエンスのキャリアアドバイスやチュートリアル、理論的なデータサイエンスに関する知識を提供することに興味を持っています。また、人間の寿命の長期化に人工知能がどのように役立つかを探求したいと考えています。テックの知識とライティングスキルを広げつつ、他の人々をガイドするのを助けることを目指しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

フォートペック族のメンバーとグーグラーが集まり、社会的な利益をもたらす技術について学び、祝福し、支援するために出会います

「責任あるイノベーションに重点を置くGoogleチームが、モンタナ州のフォートペック族を訪れ、関係構築と双方向の学びを行い...

AIニュース

OpenAIの需要急増により、ChatGPT Plusの申し込みを一時停止します

人工知能のパイオニアであるOpenAIは、需要の急増に苦しんでおり、そのためプレミアムChatGPT Plusサービスの新規申し込みを...

データサイエンス

Zipperを使用してサーバーレスアプリを高速に構築:TypeScriptで記述し、その他のすべてをオフロードする

「Ruby on Railsの良い思い出を振り返った後、私はZipperプラットフォームを発見し、どれだけ速く価値あるものを作れるかを試...

人工知能

AIによって設計されたカードゲーム、I/O FLIPをプレイしましょう

Google I/O 2023に間に合うように、生成AIで構築されたオンラインカードゲームI/O FLIPをお試しください

機械学習

新たなディープ強化学習(DRL)フレームワークは、シミュレートされた環境で攻撃者に対応し、サイバー攻撃がエスカレートする前に95%をブロックすることができます

サイバーセキュリティの防御者は、技術の発展とシステムの複雑さのレベルが上昇するにつれて、自分たちの技術と戦術を動的に...

データサイエンス

推論:可観測性のAI主導の未来?

この記事では、オペラビリティの後続としての推論、AIOpsからの教訓、その成功の不足、および推論ソリューションの新興原則に...