「ChatGPTの新たなライバル:Googleのジェミニ」
「チャットGPTに挑む新ライバル:Googleのジェミニ」
今しばらくの間、ChatGPTが注目されています。誰もがそれについて話しており、多くの人々がそれを使用していますが、何が間違ってしまう可能性があるのでしょうか?
Googleは常にAIを重視する企業であることを目指してきましたし、これまでうまくやってきました。しかし、昨年はChatGPTという点でOpenAIがリードを取ってきたことは明らかであり、Googleが再びリードを取るために参入するのは時間の問題でした。
CEOのSundar Pichaiは以下のように述べています。
- ビデオスワップに会おう:対話型意味ポイント対応でビデオの被写体交換をカスタマイズする人工知能フレームワーク
- エンドツーエンドの労働力管理を取得する: Amazon ForecastおよびAWS Step Functions
- 「つながる点 OpenAIの主張されたQ-Starモデルの解明」
最初からAIに興味を持った一つの理由は、私たちの使命を恒久的なものと考えてきたからです。
ここでご紹介するのは、GoogleのGeminiです。
もしまだトレーラーを見たことがない場合、こちらでご覧になることをおすすめします。
Geminiとは何ですか?
GeminiはGoogleの最大の言語モデルであり、CEOのPichai氏が最初に試験的に公開したもので、現在は公開されています。公開されているのはなぜでしょうか?それにしても、なぜChatGPTがびくびくしているのでしょうか?
Geminiは単なる単一のAIモデルではありません。さまざまなバリエーションがあり、さまざまな要求に対応しています。たとえば、Androidデバイスで実行可能な軽量版のGemini Nanoや、Googleの多くのAIサービスを駆動するためにBarbのバックボーンを使用したGemini Proなどがあります。
しかし、それだけではありません。Googleの最も高性能で最も強力なLLMであるGemini Ultraも存在します。Gemini Ultraは特にデータセンターやエンタープライズアプリケーション向けに設計されたようです。
簡単な概要です。
- Gemini Ultra – 高度な複雑なタスクに最適な最大かつ最も高性能なモデル。
- Gemini Pro – 幅広いタスクにスケーリングするための最適なモデル。
- Gemini Nano – デバイス上でのタスクに最も効率的なモデル。
この3つの変種を持つ大規模言語モデルは、さまざまなタイプの情報を理解し操作するために構築されています。テキスト、コード、画像、音声、動画など、さまざまな情報を扱えます。最高のマルチモダリティです。
それでは、実際にどれくらい優れているのでしょうか?
Geminiの性能
Googleは、Geminiモデルを要件に適合するようにテストするために多くの努力をしてきました。現在のLLM研究で広く使用されている32のベンチマークのうち、GoogleのGemini Ultraは30のベンチマークで既存の最新技術を上回り、驚異的な90.0%のスコアを記録しました。
Gemini UltraはMMLU(大規模マルチタスク言語理解)で人間の専門家を上回る最初のモデルとなりました。MMLUは数学、歴史、法律、医学、物理学など57の科目を組み合わせて、世界の知識や問題解決能力をテストするものです。
これらのベンチマークを見てみると、Geminiの最大の利点は、動画やオーディオに理解し対話する能力を持っていることです。
OpenAIは、DALL-EやWhisperの作成によってこれを達成しようとしてきました。しかし、Googleは最初から多感覚モデルを追求しました。また、Googleはコーディングの改善にも言及しており、AlphaCode 2という新しいコード生成システムを使用しており、他のコーディング競技参加者と比較して85%の向上を達成しているとされています。
これを言っておくと、ベンチマークは単なる基準です。Geminiの実力は、普段のユーザーがそれと対話することで完全に理解できるでしょう。
Geminiの機能についてもっと詳しく知りたい場合は、この動画をご覧ください。
Geminiへのアクセス方法
Pixel 8 Proのユーザーの場合、Recorderアプリの自動要約機能やGboardキーボードのSmart Reply機能など、Gemini Nanoのおかげでいくつかの新機能を既にご覧になっているかもしれません。
Gemini Proをすぐに試してみたい場合は、Bardを利用できます。また、開発者やエンタープライズのお客様は、12月13日からGoogle Generative AI StudioまたはGoogle CloudのVertex AIを介してGemini Proにアクセスできるようになります。
Gemini Nanoに興味がある場合は、来年まで少し待つ必要があります。
Geminiは現時点では英語のみ利用可能なことをご注意ください。Pichai CEOは、このモデルをGoogleの検索エンジン、広告製品、Chromeブラウザなどに統合することを目指していると述べており、より多くの言語が利用可能になる予定です。
まとめ
これはGoogleがAIイノベーションの最前線にいた理由を示す時であると思われます。次に何が現れるか、どう思いますか。
****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)**** はデータサイエンティストであり、フリーランスの技術ライターです。特に、データサイエンスのキャリアアドバイスやチュートリアル、理論的なデータサイエンスに関する知識を提供することに興味を持っています。また、人間の寿命の長期化に人工知能がどのように役立つかを探求したいと考えています。テックの知識とライティングスキルを広げつつ、他の人々をガイドするのを助けることを目指しています。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- このAI論文は、高品質な3Dセグメンテーションを実現するために、与えられたシーン内の任意のオブジェクトのためのセグメントエニシングのための高品質(SANeRF-HQ)フレームワークを紹介しています
- 「大規模言語モデルをより効率的に最適化できるのか?LLMの効率性に関するアルゴリズムの進化についての包括的な調査をご覧ください」
- 一緒にAIを学ぶ – Towards AI コミュニティニュースレター第4号
- 「大規模言語モデルの微調整方法:ステップバイステップガイド」
- 「GPS ガウシアンと出会う:リアルタイムにキャラクターの新しい視点を合成するための新たな人工知能アプローチ」
- 「Vchitectを紹介します:テキストからビデオ(T2V)およびイメージからビデオ(I2V)アプリケーションに適したオープンソースの大規模一般istビデオ作成システム」
- ジェミニに会ってください:Googleの画期的なマルチモーダルAIモデルが人工知能の未来を再定義する