「ChatGPTの新たなライバル:Googleのジェミニ」

「チャットGPTに挑む新ライバル:Googleのジェミニ」

今しばらくの間、ChatGPTが注目されています。誰もがそれについて話しており、多くの人々がそれを使用していますが、何が間違ってしまう可能性があるのでしょうか?

Googleは常にAIを重視する企業であることを目指してきましたし、これまでうまくやってきました。しかし、昨年はChatGPTという点でOpenAIがリードを取ってきたことは明らかであり、Googleが再びリードを取るために参入するのは時間の問題でした。

CEOのSundar Pichaiは以下のように述べています。

最初からAIに興味を持った一つの理由は、私たちの使命を恒久的なものと考えてきたからです。

ここでご紹介するのは、GoogleのGeminiです。

もしまだトレーラーを見たことがない場合、こちらでご覧になることをおすすめします。

Geminiとは何ですか?

GeminiはGoogleの最大の言語モデルであり、CEOのPichai氏が最初に試験的に公開したもので、現在は公開されています。公開されているのはなぜでしょうか?それにしても、なぜChatGPTがびくびくしているのでしょうか?

Geminiは単なる単一のAIモデルではありません。さまざまなバリエーションがあり、さまざまな要求に対応しています。たとえば、Androidデバイスで実行可能な軽量版のGemini Nanoや、Googleの多くのAIサービスを駆動するためにBarbのバックボーンを使用したGemini Proなどがあります。

しかし、それだけではありません。Googleの最も高性能で最も強力なLLMであるGemini Ultraも存在します。Gemini Ultraは特にデータセンターやエンタープライズアプリケーション向けに設計されたようです。

簡単な概要です。

  • Gemini Ultra – 高度な複雑なタスクに最適な最大かつ最も高性能なモデル。
  • Gemini Pro – 幅広いタスクにスケーリングするための最適なモデル。
  • Gemini Nano – デバイス上でのタスクに最も効率的なモデル。

この3つの変種を持つ大規模言語モデルは、さまざまなタイプの情報を理解し操作するために構築されています。テキスト、コード、画像、音声、動画など、さまざまな情報を扱えます。最高のマルチモダリティです。

それでは、実際にどれくらい優れているのでしょうか?

Geminiの性能

Googleは、Geminiモデルを要件に適合するようにテストするために多くの努力をしてきました。現在のLLM研究で広く使用されている32のベンチマークのうち、GoogleのGemini Ultraは30のベンチマークで既存の最新技術を上回り、驚異的な90.0%のスコアを記録しました。

Gemini UltraはMMLU(大規模マルチタスク言語理解)で人間の専門家を上回る最初のモデルとなりました。MMLUは数学、歴史、法律、医学、物理学など57の科目を組み合わせて、世界の知識や問題解決能力をテストするものです。

これらのベンチマークを見てみると、Geminiの最大の利点は、動画やオーディオに理解し対話する能力を持っていることです。

OpenAIは、DALL-EWhisperの作成によってこれを達成しようとしてきました。しかし、Googleは最初から多感覚モデルを追求しました。また、Googleはコーディングの改善にも言及しており、AlphaCode 2という新しいコード生成システムを使用しており、他のコーディング競技参加者と比較して85%の向上を達成しているとされています。

これを言っておくと、ベンチマークは単なる基準です。Geminiの実力は、普段のユーザーがそれと対話することで完全に理解できるでしょう。

Geminiの機能についてもっと詳しく知りたい場合は、この動画をご覧ください。

 

Geminiへのアクセス方法

 

Pixel 8 Proのユーザーの場合、Recorderアプリの自動要約機能やGboardキーボードのSmart Reply機能など、Gemini Nanoのおかげでいくつかの新機能を既にご覧になっているかもしれません。

Gemini Proをすぐに試してみたい場合は、Bardを利用できます。また、開発者やエンタープライズのお客様は、12月13日からGoogle Generative AI StudioまたはGoogle CloudのVertex AIを介してGemini Proにアクセスできるようになります。

Gemini Nanoに興味がある場合は、来年まで少し待つ必要があります。

Geminiは現時点では英語のみ利用可能なことをご注意ください。Pichai CEOは、このモデルをGoogleの検索エンジン、広告製品、Chromeブラウザなどに統合することを目指していると述べており、より多くの言語が利用可能になる予定です。

 

まとめ

 

これはGoogleがAIイノベーションの最前線にいた理由を示す時であると思われます。次に何が現れるか、どう思いますか。

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)**** はデータサイエンティストであり、フリーランスの技術ライターです。特に、データサイエンスのキャリアアドバイスやチュートリアル、理論的なデータサイエンスに関する知識を提供することに興味を持っています。また、人間の寿命の長期化に人工知能がどのように役立つかを探求したいと考えています。テックの知識とライティングスキルを広げつつ、他の人々をガイドするのを助けることを目指しています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「Stack Overflowは、OverflowAIによって開発者サポートを革新します」

Stack Overflowは、技術的な回答を求める開発者向けの有名なプラットフォームです。革新的なOverflowAIの提供により、生成型A...

AIニュース

「ビルドの学び方 — Towards AI コミュニティ ニュースレター第2号」

「最近の数日間、OpenAIのドラマを追っていないと見逃しているよ信じられないことが起こったんだ多くの従業員がOpenAIの理事...

人工知能

「AIとともに観測性の潜在能力を解き放つ」

オブザーブの統合観測性プラットフォームは、先進的なAIを活用して、メトリクス、トレース、ログを一つにまとめることで複雑...

データサイエンス

推論:可観測性のAI主導の未来?

この記事では、オペラビリティの後続としての推論、AIOpsからの教訓、その成功の不足、および推論ソリューションの新興原則に...

機械学習

プロンプトエンジニアリングへの紹介

イントロダクション 自然言語処理は、基盤となる技術や手法を使用した実装の豊かな領域であります。近年、特に2022年の始まり...

データサイエンス

リトリーバル・オーグメンテッド・ジェネレーションにおける関連性の課題にどのように対処するか

パート1では、非最適な埋め込みモデル、効率の悪いチャンキング戦略、およびメタデータフィルタリングの不足により、LLMから...