「OpenAI Dev Day 2023 創設者サム・オルトマンの基調講演からの4つの重要発表、見逃せません!」
「OpenAI Dev Day 2023 創設者サム・オルトマンの基調講演からの4つの重要発表、見逃せない!」
アップデートからChatGPTへ、GPT-4 Turbo、カスタムGPT、GPTストア、アシスタントAPI、モデルの価格改定、改善された関数呼び出し、組み込みの検索など。
OpenAIによる初めての開発者向けカンファレンスは、驚くべき製品発表で溢れていました。さらに興味深いのは???
これらの発表によって、多くのAIスタートアップが完全に陳腐化するでしょう。クリケットでは、「クリーンボウルド」と呼びます。
1時間の基調講演で多くのAIスタートアップと彼らの価値提供が一掃されました。それは夢!それとも悪夢と言わざるを得ません!
- このAI論文では、マルチビューの冗長性を超えるための新しいマルチモーダル表現学習手法であるFACTORCLを提案しています
- アマゾンセージメーカースタジオを使用して、素早い実験結果のためにLlama 2、LangChain、およびPineconeを使用してRAG型の質問応答ソリューションを構築しましょう
- 「Amazon SageMakerを使用してビジョントランスフォーマーモデルのトレーニング時間を短縮するKTの取り組み」
製品発表と私の🌶️🌶️🌶️なコメントについて詳しく知りたい方はぜひ参加してください!
1. GPT-4 Turbo
コンテキストウィンドウの拡大
- 128kの拡大コンテキストウィンドウ、2023年4月の最新の知識のカットオフ、およびWebのブラウジング機能を備えているため、標準的なテキストブックの300ページを1つのプロンプトに収めることができます。比較のために、GPT-4は8kのコンテキストウィンドウに対応していました。8kから128k、これは大きな進歩です!
モデルのレスポンスにおけるJSONモード
- JSONモードを有効にすることで、モデルにJSONレスポンスを返すように依頼し、外部アプリケーションAPIを簡単に呼び出すことができます。JSONスニペットを返すようにモデルを工夫したり、他の単語を試したりする必要はありません。
- 1つのプロンプトから複数の関数を呼び出すことができます。
- シードパラメーターを設定することで再現可能なモデルの出力にアクセスできます。
- APIからレスポンスのすべてのトークンのログ確率を確認することもできます。
マルチモーダルの機能
- DALL-E 3はプログラムで画像を生成することができます
- GPT-4 Turbo with VisionはAPIを介して画像を入力できます
- 6つの内蔵の音声を備えたTTSオーディオAPIは、テキストから音声へのコンバーターです。非常に自然な音声です。
- Whisper V3は、オープンソースの自動音声認識モデルで、近々APIで利用できるようになる予定です。
モデルの微調整
- Foundationモデルの微調整は芸術と科学の一環です。あるいは魔術と呼ぶべきでしょうか?
- OpenAIチームは、特定のドメインとデータセットに対してGPTモデルを微調整するために企業と協力します。
- GPT-4の微調整への実験的アクセスも公開されています。興味があればサインアップしてください。
著作権の保護とレート制限
- OpenAIは、すべてのGPT-4ユーザーのトークン数を1分あたりに倍増しました。
- 著作権シールドは、GPTモデルの使用による著作権問題に遭遇した場合、GPT-4の顧客を法的に保護するためのものです。AIのおかげで芸術家の創造的な自由と著作権法は見直される必要がありますが、興味深いアプローチです。この分野が成熟するにつれ、どのように進展するか見てみましょう。
価格設定
- おそらくGPT-4 Turboは平均して2.75倍安くなり、ユーザーに前のモデルとは異なるモデルを使用するように促しています。
2. chatGPTの更新
- chatGPTは現在、GPT-4 Turboを使用しています。
- Bingを通じてウェブを閲覧することができます。
- チャット中、ドロップダウンを使用してモデルを選択する必要はありません。入力プロンプトに基づいて、chatGPTはどのモデルを呼び出すか、いつ呼び出すかを知っています。
3. GPTとGPTストア
- GPTは、異なるドメインやユースケースに合わせたchatGPTのカスタムバージョンです。
- これらはchatGPTプラグインの進化です。指示、拡張された知識の検索やアクションを持つchatGPTのカスタムバージョンを作成することができます。
- OpenAIチームは目を覚まし、暴力を選びました。いや、文字通りではありません。もしかしたら本当かもしれませんね。今日どれだけのスタートアップが廃業したのでしょうか?数え続けるべきでしょうか?
- プロンプトエンジニアリング、検索強化生成、およびLangChainなどのライブラリを使用して異なるAPI呼び出しをチェーン化することによるAIアプリケーションの作成が、最も人気のあるアプローチでした。
拡張された知識の検索、改善された関数呼び出し、およびOpenAIのAssistants APIによると、いくつものツールがその価値を失いました。業界の移り変わりの速さ、想像もできないほどです!超怖くて同じくらいワクワクします!!
- GPT Builderを使用すると、自然言語で入力プロンプトを書き、カスタムGPTを生成することができます。もうプロンプトエンジニアリングや埋め込み、ベクトルデータベースの取り扱い、チャットボットのような体験を作成するためのコードの記述は不要です。
- 1つのAIエージェントが複数のAIエージェントを作成します。まあまあ、AI工場を建てる途中ですね(笑)。
- TutorGPT、WriterGPT、ResumeGPT、ThisGPT、ThatGPTなど、GPTをラップする他のツールも自然言語で作成できるようになりました。驚きですね!
GPTストア
- カスタムGPTを作成した後、GPTストアで公開することができます。それは異なるアプリケーションのオンラインマーケットプレイスであり、AIの専門家を持たない企業にとってカスタムソリューションを構築するための素晴らしいリソースとなるでしょう。
- これにより、AIの採用が非常に簡単になります。AIの専門家不足による不利な状況にある企業の長尾も、大きな利益を得ることができます。
- GPTの作成者との収益共有により、一人のAI会社が大金を稼ぐことができるかもしれません。一人のAIテックユニコーンが誕生するのでしょうか?それともOpenAIの収益共有計画にあまりにも依存しすぎているのでしょうか?待ちましょう、そして見守りましょう!!
- ちょっと待って!ストアに公開されるGPTの安全性はどうなるのでしょうか? Altman氏によると、これらのGPTをストアに公開するために厳格な審査プロセスが行われます。
- しかし、ChaosGPTなどの既存のGPTの安全性はどうなるのでしょうか?
4. Assistants API
- Assistants APIを使用すると、チャットボットやエージェントのような体験を簡単に構築することができます。埋め込み、ベクトルデータベース、別のツールを使用してさまざまなAPI呼び出しをチェーン化したり、「RAG(Retrieval Augmented Generation)」アーキテクチャに依存したりする必要はありません。
- LLMモデルの最大のユースケースの1つは、異なるドメインのチャットボットを作成することです。
- Assistants APIは永続スレッドをサポートしており、さらなる状態管理、プロンプトおよびコンテキスト管理の手間が省けます。
組み込みの検索機能により、外部の知識リポジトリでモデルを拡張することができます。ナレッジベース文書の埋め込みを計算する必要はありませんし、ベクトルデータベースに格納する必要もなく、スマートなチャンキングアルゴリズムを実装する必要もありません。どんなにクールでしょう!もうRAGなんて必要ありません。
- 過去数ヶ月間、あなたが知っているあらゆるテック企業が独自のLLMアシスタントをリリースし、それらをファンシーな二音節の英語名で呼んでいます。ただし、Microsoftの場合はchatGPTがどのように名前の付けられたチャットボットになるか知っています 😂😂😂
Python インタープリター
- chatGPT-mania の初期の日々を思い出してください。私たちの中には chatGPT 内部に Linux VM があるのではないかと考えた人々もいました。なぜなら、入力プロンプトでいくつかの Linux コマンドを実行すると、それらのコマンドに対して信じられないほど正確な結果が生成されたからです。唯一の可能な説明は、chatGPT が VM 上でコマンドを実行し、結果を返しているということでした。他にどのように大規模な言語モデルが Linux コマンドに対して完璧な結果を返すことができるのでしょうか?!!!
さて、OpenAI チームは私たちの気まぐれに追いつき、Python コードをサンドボックス化された実行環境で実行できるコードインタープリターを組み込むことにしました。それはチャートを作成したり、データ分析を行ったり、数学や推論の問題を解決するためのPythonコードを生成したりすることができます。
- これはとてもクールですが、「ああ、chatGPTは実際に推論ができるのか」という方向にさらなる質問や研究を促すでしょう。
- 基調講演のデモでは、chatGPTが友人との出費を分割したり、為替レートを変換したり、パリへの旅行の総費用を計算したりするために簡単な数学を行うことができたことが示されています。しかし、Blocks worldを解くことができるのでしょうか?それは私の問題ではなく、あなたの問題です(Symbolic AI の研究者の方々、あなたを見ています!! 😅)
まとめ
Assistants API は組織にとって画期的なものであり、GPT ストアはビルダーにとって画期的なものです。さあ、一緒に開発しましょう!
また、基調講演のフルバージョンもご覧いただけます。
読んでいただき、ありがとうございます!
私の仕事が気に入った場合、サポートいただけますと嬉しいです…
- 私をサポートするもっとも良い方法は、私を VoAGI でフォローすることです。
- データエンジニアリングのベストプラクティスや初心者向けのPythonのヒントについては、LinkedIn でフォローしてください。
- この投稿がいかに役に立ったかを知るために、拍手をいただければ幸いです。
Stackademic
最後までお読みいただき、ありがとうございます。お帰りになる前に:
- ライターを 拍手し、フォローしていただけると幸いです! 👏
- Twitter(X)、LinkedIn、YouTubeで私たちにフォローしてください。
- 世界中で自由なプログラミング教育を民主化していることについて、Stackademic.com を訪れて詳細をご了承ください。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles