報告書:OpenAIがGPT-VisionというマルチモーダルLLMをリリースするための取り組みを加速中

報告書:OpenAIがGPT-Visionのリリースを加速中

The Informationによるレポートによれば、OpenAIはライバルのGoogleに先駆けて高度なマルチモーダルLLMをリリースするため、GPT-Vision(コードネーム:Gobi)のリリースを加速させると報じられています。これはGoogleのマルチモーダルLLMであるGeminiが、テストのために一部の企業にリリースされたのから1週間後のことです。

では、マルチモーダルLLMとは具体的には何でしょうか?レポートによれば、これらの大規模言語モデルはテキストと画像を処理する能力を持つとされています。つまり、これらのLLMはテキストと画像を組み合わせたコンテンツを理解し、生成することができるため、拡張された機能を提供することができます。

GPT-4のリリースに関しても見てきたように、このようなリリースはOpenAIの市場リードを維持するだけでなく、一般のLLM市場での市場占有率を維持するのに役立つでしょう。しかし、まだ準備ができていません。同じレポートによれば、GPT-Visionは安全性のレビューで詰まっているとのことです。

しかし、今のところ、OpenAIのエンジニアたちは「法的懸念を満たすのに近づいているようです」とされています。最近数ヶ月間、OpenAIは著作権侵害やThe New York Timesからのトレーニングデータに関する訴訟の脅威に直面してきました。

先に述べたように、OpenAIがGoogleよりもGobiをリリースすることができれば、AIスタートアップには競合他社に対する重要な優位性が生まれます。競合他社はOpenAIに追いつくために創作AIに大きな投資をしており、それを逃すことは避けたいと考えています。

レースが始まりました。OpenAIはGeminiをリリースする前にGobiを立ち上げることを目指しています。これはもちろん、ChatGPTの大成功によるものです。市場で最初に登場したことで、OpenAIは新しいユーザーへの初めての露出を楽しみ、それをマルチモーダルLLMでも再現したいと明らかにしています。

そのため、GobiがGPT-4にもたらす可能性には興味深いものがあります。Gobiは、OpenAIが以前にプレビューしたよりも高度な視覚的およびマルチモーダルな機能をGPT-4に追加する可能性があります。

マルチモーダルの競争は激化しており、どの企業が先にリリースするかによって、市場の将来に大きな影響を与えるでしょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

中間旅程のタトゥープロンプト

次のタトゥーのインスピレーションを探している場合は、Midjourneyを使用してみてください

データサイエンス

エンジニアリングリーダーは何を気にしているのか?

私たちのエンジニアリングリーダーズフォーラム ラウンドテーブルのまとめと、VPたちがAI、ChatGPT、リモートワーク、DORAメ...

人工知能

「顔認識システムにおけるバイアスの解消 新しいアプローチ」

この記事では、顔認識システムにおけるバイアスに関する問題を探求し、開発者がこの問題を軽減するために採用できる潜在的な...

AIニュース

ChatGPTでお金を稼ぐ5つの方法

もしChatGPTでお金を稼げるとは信じていないなら、この記事の終わりまでには信じるようになるでしょう

データサイエンス

「Pythonクライアントを使用してMyScaleを始める」

「マイスケールの基本から、テーブルの作成やインデックスの定義などを学び、上級のSQLベクトル検索までを探求してくださいな...

人工知能

AIが私たちのコーディング方法を変えていく方法

簡単に言うと、この記事では、AIと仕事に関する私の最新の研究の要約(AIが生産性に与える影響を探りながら、長期的な影響に...