「ChatGPTの新たなライバル：Googleのジェミニ」

「チャットGPTに挑む新ライバル：Googleのジェミニ」

今しばらくの間、ChatGPTが注目されています。誰もがそれについて話しており、多くの人々がそれを使用していますが、何が間違ってしまう可能性があるのでしょうか？

Googleは常にAIを重視する企業であることを目指してきましたし、これまでうまくやってきました。しかし、昨年はChatGPTという点でOpenAIがリードを取ってきたことは明らかであり、Googleが再びリードを取るために参入するのは時間の問題でした。

CEOのSundar Pichaiは以下のように述べています。

最初からAIに興味を持った一つの理由は、私たちの使命を恒久的なものと考えてきたからです。

ここでご紹介するのは、GoogleのGeminiです。

もしまだトレーラーを見たことがない場合、こちらでご覧になることをおすすめします。

Geminiとは何ですか？

GeminiはGoogleの最大の言語モデルであり、CEOのPichai氏が最初に試験的に公開したもので、現在は公開されています。公開されているのはなぜでしょうか？それにしても、なぜChatGPTがびくびくしているのでしょうか？

Geminiは単なる単一のAIモデルではありません。さまざまなバリエーションがあり、さまざまな要求に対応しています。たとえば、Androidデバイスで実行可能な軽量版のGemini Nanoや、Googleの多くのAIサービスを駆動するためにBarbのバックボーンを使用したGemini Proなどがあります。

しかし、それだけではありません。Googleの最も高性能で最も強力なLLMであるGemini Ultraも存在します。Gemini Ultraは特にデータセンターやエンタープライズアプリケーション向けに設計されたようです。

簡単な概要です。

Gemini Ultra – 高度な複雑なタスクに最適な最大かつ最も高性能なモデル。
Gemini Pro – 幅広いタスクにスケーリングするための最適なモデル。
Gemini Nano – デバイス上でのタスクに最も効率的なモデル。

この3つの変種を持つ大規模言語モデルは、さまざまなタイプの情報を理解し操作するために構築されています。テキスト、コード、画像、音声、動画など、さまざまな情報を扱えます。最高のマルチモダリティです。

それでは、実際にどれくらい優れているのでしょうか？

Geminiの性能

Googleは、Geminiモデルを要件に適合するようにテストするために多くの努力をしてきました。現在のLLM研究で広く使用されている32のベンチマークのうち、GoogleのGemini Ultraは30のベンチマークで既存の最新技術を上回り、驚異的な90.0%のスコアを記録しました。

Gemini UltraはMMLU（大規模マルチタスク言語理解）で人間の専門家を上回る最初のモデルとなりました。MMLUは数学、歴史、法律、医学、物理学など57の科目を組み合わせて、世界の知識や問題解決能力をテストするものです。

これらのベンチマークを見てみると、Geminiの最大の利点は、動画やオーディオに理解し対話する能力を持っていることです。

OpenAIは、DALL-EやWhisperの作成によってこれを達成しようとしてきました。しかし、Googleは最初から多感覚モデルを追求しました。また、Googleはコーディングの改善にも言及しており、AlphaCode 2という新しいコード生成システムを使用しており、他のコーディング競技参加者と比較して85%の向上を達成しているとされています。

これを言っておくと、ベンチマークは単なる基準です。Geminiの実力は、普段のユーザーがそれと対話することで完全に理解できるでしょう。

Geminiの機能についてもっと詳しく知りたい場合は、この動画をご覧ください。

Geminiへのアクセス方法

Pixel 8 Proのユーザーの場合、Recorderアプリの自動要約機能やGboardキーボードのSmart Reply機能など、Gemini Nanoのおかげでいくつかの新機能を既にご覧になっているかもしれません。

Gemini Proをすぐに試してみたい場合は、Bardを利用できます。また、開発者やエンタープライズのお客様は、12月13日からGoogle Generative AI StudioまたはGoogle CloudのVertex AIを介してGemini Proにアクセスできるようになります。

Gemini Nanoに興味がある場合は、来年まで少し待つ必要があります。

Geminiは現時点では英語のみ利用可能なことをご注意ください。Pichai CEOは、このモデルをGoogleの検索エンジン、広告製品、Chromeブラウザなどに統合することを目指していると述べており、より多くの言語が利用可能になる予定です。

まとめ

これはGoogleがAIイノベーションの最前線にいた理由を示す時であると思われます。次に何が現れるか、どう思いますか。

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)**** はデータサイエンティストであり、フリーランスの技術ライターです。特に、データサイエンスのキャリアアドバイスやチュートリアル、理論的なデータサイエンスに関する知識を提供することに興味を持っています。また、人間の寿命の長期化に人工知能がどのように役立つかを探求したいと考えています。テックの知識とライティングスキルを広げつつ、他の人々をガイドするのを助けることを目指しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

language models

Was this article helpful?

93 out of 132 found this helpful

「ChatGPTの新たなライバル：Googleのジェミニ」

Geminiとは何ですか？

Geminiの性能

Geminiへのアクセス方法

まとめ

Was this article helpful?

新しいCMUとMetaによるAI研究、PyNeRFの導入：スケールに意識したグリッドベースのレンダリングにおけるニューラル輝度場の進化

「明日のニュースを、今日に！」ニュースGPTが新しいAI技術の「ニュース予報」を紹介

機械学習

倫理的なAIと責任あるデータサイエンス：開発者に何ができるか？

需要を駆動するための新しいAIパワード広告ソリューションの紹介

ChatGPTを使用してバイラルになる方法

「オープンソースモデルと商用AI/ML APIの違い」

Google Cloudがマッコーリー銀行のAIバンキング機能を強化するのを支援します

「機械学習におけるデータの重要性：AI革命の推進力」