このAIニュースレターはあなたが必要なすべてです #72
美容とファッションの全てが詰まった、必読のAIニュースレター #72
ルイによる今週のAIニュース
今週のAIニュースは、OpenAIのDevdayと多数の新しいモデルと機能のリリースによって支配されました。これによって、エロン・マスクが先駆けてLLMレースに参入したxAIのGrok GPT-3クラスモデルは埋没しました。OpenAIのDevdayでは、新しいより優れた、より速く、より安価なGPT-4 Turboモデル、APIを介したビジョン機能、統合検索エンジン、さらには他のいくつかのモデル(Dalle-3、新しいWhisper音声-to-テキスト、新しいテキスト-to-音声モデル)とのAPI統合のリリースが行われました。しかし、イベントのサプライズは、「GPTs」というノーコードの解決策と将来の「GPTストア」アプリストアのリリースでした。これにより、人々はChatGPTを介して独自のカスタムGPTエージェントを作成し、収益化することができます。
Open AIからのこの最新のリリースは、GPT-4クラスモデルの「ChatGPT」の瞬間である可能性があります。初期のChatGPTのリリースでは、GPT-3クラスモデルの逐次的な改善とUIの大幅な改良により、GPT-3のチャットボットアプリケーションへの広範な採用が可能になりました。今回のリリースには同様の雰囲気がありますが、今回はGPT-4クラスモデルに対してLLM RAGおよびエージェントアプリケーションの採用を指しており、より使いやすいエージェント構築UIやより高速かつ手頃なモデルにより、LLMは新たな可能性を迎えることができます。
イベントの後、私たちは以下の2点に焦点を当てた議論が行われたことに注目しました。1) OpenAIの攻撃的な価格設定と機能の追加により、他のAIスタートアップや「GPTラッパー」に脅威を与えるか?2) OpenAIは、新しいGPT製品で新しいAppStoreエコシステムを作成するのか?第一のポイントについては、両方の側面に対して共感のある主張があります。例えば、OpenAIはAnthropicのClaude 2と先行して異なる長いコンテキスト長に追いつき(僅かに低い価格で)、Eleven Labsよりもはるかに安価なテキスト-to-スピーチAPIをリリースし、LangchainなどのDocument processing and Retrieval Augmented Generation(RAG)エコシステムプレイヤーの領域にも進出しています。しかし、同時に、より強力なLLMとRAG製品を構築するための非常に強力なツールキットをリリースし、APIを介した多くの新しいモデルとともにOpenAIモデルの上に構築することをはるかに簡単にし、自分自身のプロジェクトを構築したい人々の参入障壁を大幅に下げました。
– ルイ・ピーターズ — Towards AI 共同創設者兼CEO
最新ニュース
OpenAIのDevdayでは、新しいより優れた、より速く、より安価なGPT-4 Turboモデル、APIを介したビジョン機能、統合検索エンジン、および他のいくつかのモデルとのAPI統合のリリースが行われました。しかし、イベントのサプライズは、「GPTs」というノーコードの解決策と将来の「GPTストア」アプリストアのリリースでした。
2. RedPajama-Data-v2:30兆トークンを含むオープンデータセットでLLMのトレーニングに用いる
RedPajama-Data-V2は、言語モデルの研究用の最大の公開トレーニングデータセットであり、5つの主要言語で84のCommonCrawlダンプから300兆トークンから構成されています。フィルタリングおよび重み付けのための事前計算された品質注釈を含み、研究および商業利用が可能です。
3. エロン・マスクの最初のAI製品は「Grok」というチャットボット
エロン・マスクのAIスタートアップxAIは、最初のチャットボット「Grok」をリリースしました。これはXプレミアム+サブスクリプションのユーザーに利用可能です。Grokチームには、DeepMind、OpenAI、Google、Microsoft、TeslaのAI専門家が参加しています。マスクは、GrokがXプラットフォーム上でリアルタイムの情報にアクセスできる能力により、他のチャットボットよりも優位性を持っていると強調しています。
4. 45年ぶりに新しいビートルズの曲がリリースされる – AIの助けを借りて
人工知能の助けを借りて、ジョン・レノンが書き始めてから45年後に、完全なFab Fourをフィーチャーした新しいビートルズの曲がリリースされました。これにより、古いレコーディングを復活させたり、新しい音楽を作ったりする可能性が開けましたが、同時に同意と芸術の操作に関する倫理的な問題も提起されています。
AlphaFoldは、タンパク質データバンク内の分子を正確に予測する進んだAIモデルであり、バイオ分子の理解を向上させ、複雑なタンパク質構造の研究をサポートしています。これには、がん治療薬の開発、ワクチンの開発、そして公害削減への潜在的な応用があります。
学習を続けるための5つの5分間の読み物/動画
Hugging Faceは、言語モデルのトレーニングにおける整合性ガイドのセットをAlignment Handbookでリリースしました。これらのガイドでは、教師あり微調整、報酬モデリング、拒否サンプリング、および直接的な嗜好最適化(DPO)などの技術について説明しており、言語モデルの性能向上に役立ちます。
一般的なAIディテクターの誤検知率が非常に高いため、フリーランスライターのMichael Berbenに壊滅的な影響を与えました。彼は不正行為の罪で偽告され、仕事を失いました。この記事では、一般的な誤検知とAIディテクターへの挑戦のための効果的なメカニズムの欠如について明らかにしています。
AIとAPIの融合がテクノロジー界を革新しています。これらのツールを活用するスタートアップは、確立された巨大企業に挑戦し、デジタル経済の権力関係を再構築することができます。このエッセイでは、AIとAPIの交差点にある機会について、12人の専門家の考えと意見を紹介しています。
4. 500以上のLoRAsの作成後、ここに秘訣あり
このブログでは、品質の高いデータセットとパラメーターの最適化の重要性について強調しています。効率を最大化するために、明確なデータセットの重要性を強調し、33Bモデルの使用を推奨しています。また、勾配蓄積による品質への潜在的な影響にも注意が必要です。
このガイドでは、マルチモーダル人工知能(AI)の概念とさまざまな分野への変革的な影響について説明しています。マルチモーダルAIの実践的な応用、融合技術の説明、およびこの分野の主要な用語の簡潔な用語集も提供されています。
論文&リポジトリ
Hugging Faceが開発したZephyr 7Bは、さまざまなベンチマークでChat Llama 70Bを上回る印象的な結果を達成しました。トレーニングのアプローチには、データセット構築、微調整、AIフィードバックの収集、および嗜好最適化が含まれています。
Distil-Whisperは、Whisperと比較してより高速な推論速度とサイズの削減を提供する印象的なAIモデルです。効果的にノイズのある環境で動作し、単語の繰り返しや挿入エラーが少ないです。このモデルは、大規模で多様なデータセットで訓練された革新的な蒸留プロセスを利用しており、さまざまなドメインでの堅牢性を確保しています。
3. LLMが情報アクセスを支配する可能性:ニューラルリトリーバーはLLM生成テキストに偏りがある
この研究では、人間が書いたテキストとLLMが生成したテキストを用いた異なるIRモデルの定量的評価が行われています。検索エンジンは人間が書いたテキストよりもLLMが生成したテキストを好む傾向があります。これにより、情報源のバイアスについて懸念が生じ、LLMの時代におけるさらなる探索と評価が求められています。
4. 検索においてChatGPTは優れていますか?情報検索における大規模言語モデルの再順位付けエージェントとしての調査
この論文は、ChatGPTやGPT-4などの生成型のLLMを情報検索のための関連性ランキングについて調査しています。効果的なガイドによるLLMの結果は、最先端の教師あり方法に比べて情報検索のベンチマークでより良い結果を示しています。
5. 大規模言語モデルは感情刺激を理解し、向上させることができます
この論文は、LLMが感情刺激を理解する能力を探るための第一歩を踏み出しました。GPT-4 AIモデルに特定のフレーズを提供することにより、その性能が向上することが分かりました。”EmotionPrompts”を使用することで、応用導入時には8%の改善、高いリスクを伴う作業においては115%の改善をもたらします。
これらの論文やニュースの要約をお楽しみいただけましたか?メールで毎日のまとめを受け取りましょう!
AIを一緒に学ぶコミュニティセクション!
週次AIポッドキャスト
今週のWhat’s AIのエピソードでは、Louis BouchardがAIの博士号を取ることをやめることを決意した経験について語ります。このエピソードは、AIの博士号取得、応用AIでの勤務、または高速なスタートアップへの参加の選択肢を検討している人々に特に関連します。Louisは、博士号取得の適切性、このような決定をする際に考慮すべき要素などについて洞察を提供します。興味があればYouTubeで聴くか、フル記事を読んで、あなたの旅のための貴重な指針を見つけましょう。
今週のミーム!
rucha8062が共有したミーム
Discordからの注目のコミュニティ投稿
Henryがベータテスト用にDearFlowを開始しました!これは、チャットボットやワークフローのAI利用事例を作成または発見するためのオールインワンプラットフォームです。FlowGPTのパワーをNotionと組み合わせたものです。ChatGPTなどのチャットインターフェースでは対応できない複雑なワークフローを実行できるようになります。ぜひこちらをチェックし、コミュニティメンバーを支援しましょう!思考やフィードバックをこのスレッドで共有してください。
今週のAIアンケート
生産性を高めたり、現在の仕事に活用したりするための方法について教えてください!ディスコードでディスカッションに参加しましょう。
TAIカリキュレーションセクション
今週の記事
10/23から10/29の週の重要なLLM論文 by Youssef Hosni
近年、大規模言語モデル(LLM)は急速に進化しています。新世代のモデルが開発される中で、研究者やエンジニアが最新の進歩について情報を得ることが不可欠です。この記事では、10月の第4週に発表されたいくつかの重要なLLM論文をまとめて紹介します。
おすすめの記事
シミュレーション仮説を証明することは可能ですか? by リー・ヴォーン
タイムシリーズ解析による回帰モデルの信頼性の向上 — Part 1 by ミルザ・アナンディタ
YouTube動画の要約のためのAIアシスタント作成完全ガイド — Part 2 by アミン・カマリ
もしTowards AIでの投稿に興味がある場合は、ガイドラインを確認し、サインアップしてください。弊社の編集ポリシーと基準を満たす場合は、お仕事をネットワーク上で公開します。
求人情報
ロボティクスソフトウェアインターン 2024 @ ラピュータロボティクス(日本)
モバイルエンジニア、フルスタック(LLM / GenAI)@ メルカリ株式会社(リモート)
データアナリティクスマネージャー @ ヒューマンフォース(シドニー、オーストラリア)
Pythonインターン(ムンバイ)@ Docsumo(ムンバイ、インド)
ここで求人情報を共有したい場合は、[email protected]までお問い合わせください。
次の機械学習の面接の準備をしている場合は、ぜひ当社のリーディングな面接対策ウェブサイトconfettiをご覧ください!
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- OpenAIはGPT-4 Turboを搭載した次世代AIの先駆けとなります
- 『チャットボットは実際に認識されるよりも頻繁に「幻覚」を見るかもしれない』
- ティーンエイジャーのころ、彼女はビデオゲームが大好きだった今では彼女は人工知能を使ってマラリアを撃退しようとしている
- 「OpenAIのDevDay 2023がAIの発展とカスタマイズの新時代を公開」
- 広告主向けのAIパワードイメージ生成ツールを試験的に導入中のAmazon
- 「Googleの「この画像について」機能:AI生成の誤情報への解決策」
- ChatGPTがロボットの世界に足を踏み入れる:ボストン・ダイナミクスの最新メカニカルマーベルが今度は会話する