「OpenAIのDevDay 2023がAIの発展とカスタマイズの新時代を公開」
「OpenAIのDevDay 2023:AIの進化とカスタマイズによる新時代が幕を開ける」
OpenAIのDevDay 2023イベントで、人工知能の未来が魅力的な展開を見せるという画期的な発表シリーズが行われました。OpenAIは、AIのアクセシビリティとパワーを向上させる開発者向け製品や新しいモデルを紹介しています。新しい機能に加えて、「GPTs」と呼ばれるChatGPTをカスタマイズする新しい方法もあります。これらの「GPTs」は、ユーザーが特定の目的に合わせてChatGPTのバージョンを作成できるようにします。それだけでなく、他のユーザーと共有することもできます。これらの革新的な進展のハイライトを見ていきましょう。
GPTの作成 – コーディング不要
GPTの最も注目すべき側面の1つは、誰でも簡単に自分自身のGPTを作成できるということです。何よりも重要なのは、コーディングの専門知識は必要ありません。企業内での個人使用や他の人と共有するために、プロセスはシンプルです。たとえば、会話を始め、指示を提供し、ウェブ検索やデータ分析などの機能を指定することができます。こちらで自分自身で試すこともできます。OpenAIは、ChatGPT PlusおよびEnterpriseユーザー向けに、OpenAI DevDay 2023で共有されたExample GPTをすでに利用できるようにしています。
- 広告主向けのAIパワードイメージ生成ツールを試験的に導入中のAmazon
- 「Googleの「この画像について」機能:AI生成の誤情報への解決策」
- ChatGPTがロボットの世界に足を踏み入れる:ボストン・ダイナミクスの最新メカニカルマーベルが今度は会話する
コミュニティ主導のGPT
OpenAIは、最も素晴らしいGPTがコミュニティから生まれると考えています。コーチや便利なツールを作成する情熱を持つ人々が、GPTエコシステムに貢献することができます。今月後半にも開始予定のGPTストアは、確認済みのビルダーが自分の作品を紹介するハブとなります。GPTは検索可能になり、リーダーボードも存在します。OpenAIは、生産性、教育、純粋なエンターテイメントなどのカテゴリで最も役立つGPTを紹介する予定です。さらに、ユーザーは自分のGPTを利用する人数に応じて報酬を受け取る機会があります。
詳細はこちらをご覧ください:ChatGPTのトレーニング方法は?
GPT-4 Turbo:AIの可能性を広げる
OpenAIは、次世代のAIモデルであるGPT-4 Turboの時代を迎えています。128Kのコンテキストウィンドウを備え、このモデルは単一のプロンプトで300ページ以上のテキストを処理できます。特筆すべきは、2023年4月までの世界の出来事に精通していることであり、前任者であるGPT-4と比べて性能が向上し、低コストで提供されることです。開発者は既にAPIを介してGPT-4 Turboのプレビューバージョンにアクセスできますし、安定した製品版のモデルも近い将来にリリースされる予定です。
関数呼び出しの更新:スマートで効率的な操作
関数呼び出しは、1つのメッセージで複数の関数を呼び出すことができるため、1つのインタラクションで複雑な操作が可能になります。さらに、GPT-4 Turboは、正確な命令の追跡と適切な関数パラメータの返却において、理解力と精度が向上しています。
命令の追跡とJSONモードの改善
GPT-4 Turboは、正確な命令の追跡が必要なタスクに優れ、JSON形式での応答を提供できます。新しいJSONモードでは、応答が有効なJSONであることが保証され、他のシステムとの接続が簡素化されます。開発者は、『response_format』APIパラメータを使用して構文的に正しいJSONオブジェクトを生成することに対して細かい制御が可能です。
更新されたGPT-3.5 Turbo:パフォーマンスの向上
2023年のOpenAI DevDayで発表された通り、会社は新しいバージョンのGPT-3.5 Turboをリリースします。デフォルトでは16Kのコンテキストウィンドウを提供し、JSON、XML、YAMLなどを生成するタスクにおいて38%の改善をもたらします。古いGPT-3.5 Turboモデルを使用している既存のアプリケーションは、12月11日に自動的に新バージョンにアップグレードされます。
アシスタントAPI、検索、およびコードインタプリター
アシスタントAPIは、アプリケーションでエージェントのような体験を可能にします。アシスタントは特定の命令、追加の知識、およびタスクのためのモデルやツールの呼び出し能力を持つ特殊なAIエンティティです。このAPIにはコードインタプリターと検索が含まれており、簡素化されたメッセージ管理のためのパーシステントで無限長のスレッドを持つ高品質なAIアプリケーションの作成を容易にします。
コードインタプリター:現実世界の問題解決
コードインタプリターは、アシスタントがサンドボックス環境でPythonコードを記述および実行できる画期的な機能です。グラフの生成、ファイルの処理、複雑なコードや数学の問題の反復的な解決などのタスクを処理できます。
詳しくはこちらをご覧ください:自然言語理解のためのGPT
APIの新しい形態:ビジョン、DALL·E 3、およびテキスト音声
GPT-4 Turboは、画像を入力としてサポートし、AIが画像キャプションの生成、画像の分析、および図版を含むドキュメントからの情報抽出を行うことができます。イメージAPIを介して利用できるDALL·E 3では、テキストの記述から画像を生成することができます。OpenAIのテキスト音声APIは、テキストから人間の品質の音声を生成します。
モデルのカスタマイズ:GPT-4の微調整とカスタムモデル
OpenAIは、GPT-4の微調整のための実験的なアクセスプログラムを開始します。最初の段階では、カスタムモデルプログラムでは、組織が特定の領域に合わせて調整されたGPT-4モデルのトレーニングをOpenAIと共同で行うことができます。これにより、独自のデータのプライバシーが最大限に確保されます。
Whisper v3およびConsistency Decoder:音声認識の改善
Whisper large-v3は、自然言語処理モデルの高度なバージョンで、さまざまな言語でのパフォーマンスを向上させます。オープンソースのConsistency Decoderは、テキスト、顔、直線などで特に画像品質を向上させます。
プライバシーと安全性は最重要です
OpenAIは、GPTに対して強力なプライバシーと安全性対策を講じています。GPTとの会話は作成者と共有されることはありません。GPTがサードパーティのAPIとやり取りする場合、データがそれらのAPIと共有されるかどうかの制御は完全にあなたにあります。ビルダーがアクションや知識でGPTをカスタマイズする際には、ユーザーとのチャットがモデルの改善とトレーニングに貢献するかどうかを自分で決めることができます。OpenAIは、ユーザーが堅牢なプライバシーコントロールを持つことを確保するために努力しています。モデルのトレーニングから完全にオプトアウトするオプションも提供しています。
私たちの意見
OpenAIの最初の開発者会議は、GPTとのインタラクション方法においてユーザーにより多くの制御と柔軟性を提供するという面で、AIの世界で重要な一歩です。カスタマイズ、コミュニティ主導のイニシアチブ、そしてプライバシーと安全性対策の向上により、GPTは私たちの日常生活でAIの力を活用する方法を革新することになります。OpenAIの革新的な取り組みにより、AIの未来はより個人化され、アクセス可能になっています。AIの分野でのさらなるエキサイティングなアップデートと進歩にご期待ください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles