このAIニュースレターはあなたが必要なすべてです #72

美容とファッションの全てが詰まった、必読のAIニュースレター #72

ルイによる今週のAIニュース

今週のAIニュースは、OpenAIのDevdayと多数の新しいモデルと機能のリリースによって支配されました。これによって、エロン・マスクが先駆けてLLMレースに参入したxAIのGrok GPT-3クラスモデルは埋没しました。OpenAIのDevdayでは、新しいより優れた、より速く、より安価なGPT-4 Turboモデル、APIを介したビジョン機能、統合検索エンジン、さらには他のいくつかのモデル（Dalle-3、新しいWhisper音声-to-テキスト、新しいテキスト-to-音声モデル）とのAPI統合のリリースが行われました。しかし、イベントのサプライズは、「GPTs」というノーコードの解決策と将来の「GPTストア」アプリストアのリリースでした。これにより、人々はChatGPTを介して独自のカスタムGPTエージェントを作成し、収益化することができます。

Open AIからのこの最新のリリースは、GPT-4クラスモデルの「ChatGPT」の瞬間である可能性があります。初期のChatGPTのリリースでは、GPT-3クラスモデルの逐次的な改善とUIの大幅な改良により、GPT-3のチャットボットアプリケーションへの広範な採用が可能になりました。今回のリリースには同様の雰囲気がありますが、今回はGPT-4クラスモデルに対してLLM RAGおよびエージェントアプリケーションの採用を指しており、より使いやすいエージェント構築UIやより高速かつ手頃なモデルにより、LLMは新たな可能性を迎えることができます。

イベントの後、私たちは以下の2点に焦点を当てた議論が行われたことに注目しました。1) OpenAIの攻撃的な価格設定と機能の追加により、他のAIスタートアップや「GPTラッパー」に脅威を与えるか？2) OpenAIは、新しいGPT製品で新しいAppStoreエコシステムを作成するのか？第一のポイントについては、両方の側面に対して共感のある主張があります。例えば、OpenAIはAnthropicのClaude 2と先行して異なる長いコンテキスト長に追いつき（僅かに低い価格で）、Eleven Labsよりもはるかに安価なテキスト-to-スピーチAPIをリリースし、LangchainなどのDocument processing and Retrieval Augmented Generation（RAG）エコシステムプレイヤーの領域にも進出しています。しかし、同時に、より強力なLLMとRAG製品を構築するための非常に強力なツールキットをリリースし、APIを介した多くの新しいモデルとともにOpenAIモデルの上に構築することをはるかに簡単にし、自分自身のプロジェクトを構築したい人々の参入障壁を大幅に下げました。

– ルイ・ピーターズ — Towards AI 共同創設者兼CEO

学習を続けるための5つの5分間の読み物/動画

huggingface/alignment-handbook: ヒューマンとAIの嗜好に対する言語モデルの整合性のための堅牢なレシピ

Hugging Faceは、言語モデルのトレーニングにおける整合性ガイドのセットをAlignment Handbookでリリースしました。これらのガイドでは、教師あり微調整、報酬モデリング、拒否サンプリング、および直接的な嗜好最適化（DPO）などの技術について説明しており、言語モデルの性能向上に役立ちます。

2. AIディテクターが無実の作家の生活を破壊する方法

一般的なAIディテクターの誤検知率が非常に高いため、フリーランスライターのMichael Berbenに壊滅的な影響を与えました。彼は不正行為の罪で偽告され、仕事を失いました。この記事では、一般的な誤検知とAIディテクターへの挑戦のための効果的なメカニズムの欠如について明らかにしています。

3. AI + API – 12人の専門家が未来を予想する

AIとAPIの融合がテクノロジー界を革新しています。これらのツールを活用するスタートアップは、確立された巨大企業に挑戦し、デジタル経済の権力関係を再構築することができます。このエッセイでは、AIとAPIの交差点にある機会について、12人の専門家の考えと意見を紹介しています。

4. 500以上のLoRAsの作成後、ここに秘訣あり

このブログでは、品質の高いデータセットとパラメーターの最適化の重要性について強調しています。効率を最大化するために、明確なデータセットの重要性を強調し、33Bモデルの使用を推奨しています。また、勾配蓄積による品質への潜在的な影響にも注意が必要です。

5. マルチモーダル人工知能（AI）とは何ですか？

このガイドでは、マルチモーダル人工知能（AI）の概念とさまざまな分野への変革的な影響について説明しています。マルチモーダルAIの実践的な応用、融合技術の説明、およびこの分野の主要な用語の簡潔な用語集も提供されています。

論文＆リポジトリ

Zephyr: LMアライメントの直接蒸留

Hugging Faceが開発したZephyr 7Bは、さまざまなベンチマークでChat Llama 70Bを上回る印象的な結果を達成しました。トレーニングのアプローチには、データセット構築、微調整、AIフィードバックの収集、および嗜好最適化が含まれています。

2. huggingface/distil-whisper

Distil-Whisperは、Whisperと比較してより高速な推論速度とサイズの削減を提供する印象的なAIモデルです。効果的にノイズのある環境で動作し、単語の繰り返しや挿入エラーが少ないです。このモデルは、大規模で多様なデータセットで訓練された革新的な蒸留プロセスを利用しており、さまざまなドメインでの堅牢性を確保しています。

3. LLMが情報アクセスを支配する可能性：ニューラルリトリーバーはLLM生成テキストに偏りがある

この研究では、人間が書いたテキストとLLMが生成したテキストを用いた異なるIRモデルの定量的評価が行われています。検索エンジンは人間が書いたテキストよりもLLMが生成したテキストを好む傾向があります。これにより、情報源のバイアスについて懸念が生じ、LLMの時代におけるさらなる探索と評価が求められています。

4. 検索においてChatGPTは優れていますか？情報検索における大規模言語モデルの再順位付けエージェントとしての調査

この論文は、ChatGPTやGPT-4などの生成型のLLMを情報検索のための関連性ランキングについて調査しています。効果的なガイドによるLLMの結果は、最先端の教師あり方法に比べて情報検索のベンチマークでより良い結果を示しています。

5. 大規模言語モデルは感情刺激を理解し、向上させることができます

この論文は、LLMが感情刺激を理解する能力を探るための第一歩を踏み出しました。GPT-4 AIモデルに特定のフレーズを提供することにより、その性能が向上することが分かりました。”EmotionPrompts”を使用することで、応用導入時には8%の改善、高いリスクを伴う作業においては115%の改善をもたらします。

これらの論文やニュースの要約をお楽しみいただけましたか？メールで毎日のまとめを受け取りましょう！

AIを一緒に学ぶコミュニティセクション！

週次AIポッドキャスト

今週のWhat’s AIのエピソードでは、Louis BouchardがAIの博士号を取ることをやめることを決意した経験について語ります。このエピソードは、AIの博士号取得、応用AIでの勤務、または高速なスタートアップへの参加の選択肢を検討している人々に特に関連します。Louisは、博士号取得の適切性、このような決定をする際に考慮すべき要素などについて洞察を提供します。興味があればYouTubeで聴くか、フル記事を読んで、あなたの旅のための貴重な指針を見つけましょう。

今週のミーム！

rucha8062が共有したミーム

Discordからの注目のコミュニティ投稿

Henryがベータテスト用にDearFlowを開始しました！これは、チャットボットやワークフローのAI利用事例を作成または発見するためのオールインワンプラットフォームです。FlowGPTのパワーをNotionと組み合わせたものです。ChatGPTなどのチャットインターフェースでは対応できない複雑なワークフローを実行できるようになります。ぜひこちらをチェックし、コミュニティメンバーを支援しましょう！思考やフィードバックをこのスレッドで共有してください。