「ChatGPTの新たなライバル:Googleのジェミニ」

「チャットGPTに挑む新ライバル:Googleのジェミニ」

今しばらくの間、ChatGPTが注目されています。誰もがそれについて話しており、多くの人々がそれを使用していますが、何が間違ってしまう可能性があるのでしょうか?

Googleは常にAIを重視する企業であることを目指してきましたし、これまでうまくやってきました。しかし、昨年はChatGPTという点でOpenAIがリードを取ってきたことは明らかであり、Googleが再びリードを取るために参入するのは時間の問題でした。

CEOのSundar Pichaiは以下のように述べています。

最初からAIに興味を持った一つの理由は、私たちの使命を恒久的なものと考えてきたからです。

ここでご紹介するのは、GoogleのGeminiです。

もしまだトレーラーを見たことがない場合、こちらでご覧になることをおすすめします。

Geminiとは何ですか?

GeminiはGoogleの最大の言語モデルであり、CEOのPichai氏が最初に試験的に公開したもので、現在は公開されています。公開されているのはなぜでしょうか?それにしても、なぜChatGPTがびくびくしているのでしょうか?

Geminiは単なる単一のAIモデルではありません。さまざまなバリエーションがあり、さまざまな要求に対応しています。たとえば、Androidデバイスで実行可能な軽量版のGemini Nanoや、Googleの多くのAIサービスを駆動するためにBarbのバックボーンを使用したGemini Proなどがあります。

しかし、それだけではありません。Googleの最も高性能で最も強力なLLMであるGemini Ultraも存在します。Gemini Ultraは特にデータセンターやエンタープライズアプリケーション向けに設計されたようです。

簡単な概要です。

  • Gemini Ultra – 高度な複雑なタスクに最適な最大かつ最も高性能なモデル。
  • Gemini Pro – 幅広いタスクにスケーリングするための最適なモデル。
  • Gemini Nano – デバイス上でのタスクに最も効率的なモデル。

この3つの変種を持つ大規模言語モデルは、さまざまなタイプの情報を理解し操作するために構築されています。テキスト、コード、画像、音声、動画など、さまざまな情報を扱えます。最高のマルチモダリティです。

それでは、実際にどれくらい優れているのでしょうか?

Geminiの性能

Googleは、Geminiモデルを要件に適合するようにテストするために多くの努力をしてきました。現在のLLM研究で広く使用されている32のベンチマークのうち、GoogleのGemini Ultraは30のベンチマークで既存の最新技術を上回り、驚異的な90.0%のスコアを記録しました。

Gemini UltraはMMLU(大規模マルチタスク言語理解)で人間の専門家を上回る最初のモデルとなりました。MMLUは数学、歴史、法律、医学、物理学など57の科目を組み合わせて、世界の知識や問題解決能力をテストするものです。

これらのベンチマークを見てみると、Geminiの最大の利点は、動画やオーディオに理解し対話する能力を持っていることです。

OpenAIは、DALL-EWhisperの作成によってこれを達成しようとしてきました。しかし、Googleは最初から多感覚モデルを追求しました。また、Googleはコーディングの改善にも言及しており、AlphaCode 2という新しいコード生成システムを使用しており、他のコーディング競技参加者と比較して85%の向上を達成しているとされています。

これを言っておくと、ベンチマークは単なる基準です。Geminiの実力は、普段のユーザーがそれと対話することで完全に理解できるでしょう。

Geminiの機能についてもっと詳しく知りたい場合は、この動画をご覧ください。

 

Geminiへのアクセス方法

 

Pixel 8 Proのユーザーの場合、Recorderアプリの自動要約機能やGboardキーボードのSmart Reply機能など、Gemini Nanoのおかげでいくつかの新機能を既にご覧になっているかもしれません。

Gemini Proをすぐに試してみたい場合は、Bardを利用できます。また、開発者やエンタープライズのお客様は、12月13日からGoogle Generative AI StudioまたはGoogle CloudのVertex AIを介してGemini Proにアクセスできるようになります。

Gemini Nanoに興味がある場合は、来年まで少し待つ必要があります。

Geminiは現時点では英語のみ利用可能なことをご注意ください。Pichai CEOは、このモデルをGoogleの検索エンジン、広告製品、Chromeブラウザなどに統合することを目指していると述べており、より多くの言語が利用可能になる予定です。

 

まとめ

 

これはGoogleがAIイノベーションの最前線にいた理由を示す時であると思われます。次に何が現れるか、どう思いますか。

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)**** はデータサイエンティストであり、フリーランスの技術ライターです。特に、データサイエンスのキャリアアドバイスやチュートリアル、理論的なデータサイエンスに関する知識を提供することに興味を持っています。また、人間の寿命の長期化に人工知能がどのように役立つかを探求したいと考えています。テックの知識とライティングスキルを広げつつ、他の人々をガイドするのを助けることを目指しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「AIオートメーションエージェンシーのリードを増やす方法(月間100件以上のミーティング)」

「顧客を見つけることは数のゲームであり、多くの時間を要しますAIにすべての困難な仕事を任せない限り」

データサイエンス

「インド、人工知能を利用し言語の壁を解消へと向かう」

インドは人工知能(AI)を活用し、言語の壁を乗り越え、多様な人口の包括的参加を確保しようとしています。南西部の州である...

機械学習

SalesForce AIはCodeChainを導入:代表的なサブモジュールによる自己改訂の連鎖を通じたモジュラーコード生成のための革新的な人工知能フレームワーク

“`html 人工知能の研究における重要な目標の一つは、困難な問題に対処するための有用なコンピュータプログラムを提供で...

機械学習

AWS Inferentiaでのディープラーニングトレーニング

この投稿のトピックは、AWSの自社開発AIチップ、AWS Inferentia、より具体的には第2世代のAWS Inferentia2ですこれは、昨年の...

コンピュータサイエンス

「アリババは、量子コンピューティングよりもこれを優先します」

中国のテック巨人であるアリババは最近、量子コンピューティング部門を廃止するという戦略的な重点の大幅な転換を発表しまし...

機械学習

AI医療診断はどのように動作しますか?

医療分野では、人工知能(AI)が診断や治療計画においてますます頻繁に使用されるようになっています。近年、AIと機械学習は...