開発者と企業は、Gemini Proで構築する時です

ジェミナイプロで創造力を発揮する開発者と企業の融合の時がきた' (Jeminaipuro de souzouryoku wo hakki suru kaihatsusha to kigyō no yūgō no toki ga kita)

先週、私たちはGeminiを発表しました。これは私たちの最大で最も能力のあるAIモデルであり、AIをより多くの人々に役立つものにするための次のステップです。それはUltra、Pro、Nanoの3つのサイズで提供されています。私たちはGeminiを既に製品に展開しています。Gemini NanoはAndroidで利用でき、Pixel 8 Proをはじめとする他の製品にも採用されています。また、Gemini Proの特別なバージョンもBardに搭載されています。

本日、Gemini Proを開発者や企業が利用できるようにし、皆さんのフィードバックからの学びを通じて今後数週間や数ヶ月間にわたり洗練を重ねていく予定です。

Gemini Proは今日から利用可能です

Gemini Proの最初のバージョンはGemini APIを介してアクセスできます。以下に詳細情報をご紹介します:

  • Gemini Proは研究ベンチマークで他の同様のサイズのモデルよりも優れた性能を発揮します。
  • 今日のバージョンではテキストの32Kコンテキストウィンドウが提供されますが、将来のバージョンではより大きなコンテキストウィンドウが搭載される予定です。
  • 現在は一部の利用に制限がありますが、無償で利用できます。価格設定は競争力を持たせる予定です。
  • 以下の機能が提供されます: 関数呼び出し、エンベッディング、意味的関連性の検索、カスタムナレッジグラウンディング、チャット機能。
  • 180以上の国や地域で38の言語をサポートしています。
  • 本日のリリースでは、Gemini Proはテキストを入力として受け取り、テキストを出力として生成します。また、Gemini Pro Visionのマルチモーダルエンドポイントも利用できます。これはテキストと画像を入力として受け取り、テキストを出力として生成するものです。
  • Gemini ProのSDKは、どこでも動作するアプリを開発するのに役立ちます。Python、Android(Kotlin)、Node.js、Swift、JavaScriptがすべてサポートされています。
SDKs supporting Geminiを示すコードスニペットのスクリーンショット

Gemini Proには、どこでも動作するアプリを開発するためのSDKが用意されています。

Google AI Studio: Geminiでの開発の最速方法

Google AI Studioは、無料のウェブベースの開発者ツールであり、素早くプロンプトを作成し、その後アプリ開発で使用するAPIキーを取得することができます。GoogleアカウントでGoogle AI Studioにサインインし、無料クオータを利用することができます。この無料クオータは他の無料オファーよりも1分間に60リクエストまで利用できます。準備ができたら、単に「コードを取得」をクリックして、作業を選択したIDEに転送するか、Android StudioColabProject IDXで利用できるクイックスタートテンプレートのいずれかを使用します。製品品質の向上に役立つため、無料クオータを使用する際には、APIおよびGoogle AI Studioの入力と出力がトレーニングされたレビュワーにアクセス可能である場合があります。このデータはGoogleアカウントとAPIキーから匿名化されています。

ビデオ形式はサポートされていません

Google AI Studioは、無料のWebベースの開発者ツールで、素早くプロンプトを開発し、その後APIキーを取得してアプリ開発で使用できるようにすることができます。

Google Cloud上でVertex AIを使用して作成

完全管理型のAIプラットフォームが必要な場合は、Google AI StudioからVertex AIに簡単に移行することができます。これにより、Geminiのカスタマイズが可能になり、エンタープライズセキュリティ、安全性、プライバシー、データガバナンスおよびコンプライアンスに関する追加のGoogle Cloudの機能の恩恵を受けることができます。

Vertex AIを使用すると、同じGeminiモデルにアクセスでき、次のようなことができます:

  • 自社のデータを使用してGeminiを調整および抽出し、最新の情報を含む基礎付けを使用してリアルワールドのアクションを実行することができます。
  • リトリーバル拡張生成(RAG)、ブレンド検索、埋め込み、会話プレイブックなどを含む、ローコード/ノーコード環境でGemini駆動の検索および会話エージェントを構築することができます。
  • 安心して展開できます。弊社のモデルは、Google Cloudのお客様の入力または出力で学習することはありません。お客様のデータと知的財産は常にお客様のものです。

新しいVertex AIの機能については、Google Cloudブログをご覧ください。

Gemini Proの価格

現在、開発者はGoogle AI Studioを介して無料でGemini ProおよびGemini Pro Visionにアクセスできます。リクエストは1分あたり最大60回で、ほとんどのアプリ開発ニーズに適しています。また、Vertex AIの開発者は同じモデルを同じレート制限で無償で使用できます。来年初めの一般提供以降、Google AI StudioおよびVertex AIの各1,000文字または1枚の画像あたりに料金が発生します。

Gemini Proの入力および出力価格のスクリーンショット。

大きな影響、小さな価格:TPUへの投資により、Gemini Proの効率的な提供が可能になります。

展望

Geminiが開発者や企業向けに利用可能になったことを喜んでいます。さらなる微調整やフィードバックにより改善し、Geminiで構築できるものを期待しています。

もっと学び、Geminiの構築をはじめるには、ai.google.devをご覧いただくか、Vertex AIの強力な機能を使って独自のデータをエンタープライズグレードの制御で利用することができます。

来年初めには、Gemini Ultraと呼ばれる、非常に複雑なタスクに最適な最大かつ最も能力のあるモデルをさらに微調整、安全テスト、パートナーからの貴重なフィードバックを受けた後にローンチします。また、GeminiをChromeやFirebaseなどの開発者プラットフォームにも拡大します。

Geminiで何を構築するか、楽しみにしています。

コレクション

コレクション

Geminiについてさらに詳しく

Geminiについての詳細をご覧いただくには、当コレクションをご覧ください。これは、これまでに構築された最も能力のあるモデルです。

もっと見る

メールアドレス

お客様の情報は、Googleのプライバシーポリシーに従って利用されます。

完了しました。もう一歩進めましょう。

サブスクリプションを確認するために、受信トレイをご確認ください。

既にニュースレターの購読者です。

また、 . でも購読できます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

大規模言語モデルの評価:包括的かつ客観的なテストのためのタスクベースAIフレームワーク、AgentSimsに会いましょう

LLMは、言語処理(NLP)の考え方を変えましたが、評価の問題は解決されていません。古い基準はやがて無意味になります。なぜ...

AI研究

メタ AI 研究者たちは、非侵襲的な脳記録から音声知覚のデコーディングを探求するための機械学習モデルを紹介します

脳活動からの音声の解読は、医療や神経科学の分野で長い間の目標であり、侵襲的な装置を用いた研究によって最近進展していま...

機械学習

一緒にAIを学びましょう−Towards AIコミュニティニュースレター#5

おはようございます、AI愛好家の皆さん!今週のポッドキャストのエピソードは必聴で、これまでの24エピソードの中でも一番優...

データサイエンス

このAI論文は『プライバシー保護MAE-Alignと呼ばれる新しい事前トレーニング戦略を提案し、合成データと人間除去された実データを効果的に組み合わせる』というものです

アクション認識は、ビデオシーケンスから人間の動作を識別・分類するタスクであり、コンピュータビジョンの中で非常に重要な...

AIニュース

「AR技術が非口述型自閉症の人々に声を与える手助けをする」

新しいHoloBoardシステムは、MicrosoftのHoloLens 2拡張現実デバイスとペアリングすることで、非言語の自閉症の人々が運動能...

機械学習

このAI論文では、「MotionDirector」という人工知能アプローチを提案しています:ビデオの動きと外観をカスタマイズするための手法

テキストからビデオへの拡散モデルは、最近大きな進展を遂げています。テキストの説明を提供するだけで、ユーザーは現実的ま...