このAIニュースレターは、あなたが必要とするすべてです#74

『AIビューティーファッションニュースレター #74』

ルイによる今週のAIニュース

今週は、OpenAIでの一連の出来事に注目が集まりました。残念ながら、これによっていくつかの興味深い新しいモデルのリリースが overshadowedされました。おそらく、あなたはそのドラマの変遷を追ってきたので、ここでは詳細に触れる必要はありませんが、要約すると、OpenAIの取締役会は金曜日にCEOのサム・アルトマンを予告なしに解任しました。取締役会は、サムが「取締役会とのコミュニケーションについて一貫して正直ではなかった」と行動を正当化しました。それでも、彼らは今日に至るまで、OpenAIの従業員、幹部、またはMicrosoftに明確な理由を示していません。現時点では、770人中747人のOpenAIスタッフが、取締役会が辞任し、サムとグレッグ・ブロックマンに従ってMicrosoftの新しいAIチームに参加しない限り、辞任する可能性を示す共同の手紙に署名しました。この手紙は、共同創設者のイリヤ・スツケヴェルも署名し、彼は今では取締役会の行動に参加したことを後悔しています。

全ての中でも最も奇妙なのは、OpenAIの取締役会の沈黙と行動の説明不足であり、彼らの動機が非常に不明瞭であることです。さらに驚くべきことに、取締役会は明らかに「会社を破壊することはミッションに合致する」とOpenAIの幹部に述べたとされています。

もし取締役会の初期の決定がAIの安全上の懸念、収益化プロジェクトと投資家の利益分配への緊張、そしてサムの指導力と取締役会とのコミュニケーションによって導かれた場合、彼らにとってOpenAIを崩壊させ続けることは、現状維持しOpenAIを生き残らせることほど彼らの目的には貢献していないことは明確であると思います。もしOpenAIスタッフが一斉にMicrosoftに移籍するなら(Microsoftには同じAGIの安全保護がない場合も含みます)、それはまたOpenAIの将来の利益(OpenAIの慈善団体に蓄積される利益上限を超える利益)をMicrosoftの企業に移すことを意味します。サムはまたチームを指揮し、まったくOpenAIの取締役会とコミュニケーションを取ることはできなくなります!OpenAIの成長を遅らせることは、GoogleやMetaなどの他の競合他社や中国などの他の国々が追いつくチャンスを与えます。OpenAIの取締役会にはAIの未来を制御する力が少なくなります。

なぜ気にする必要があるのか?

これらの出来事の重要性は、些細なシリコンバレーの政治からAIの進展における6〜18ヶ月の setback そしてさらには地球の未来における転換点まで様々です。これは以下の観点に依存します;

  • LLMの進行方向で出くわす壁は何であり、LLM技術は実際にどれほど世界的な影響力を持つのでしょうか?
  • AGIは本当にリスクなのでしょうか?そして、この段階でそのための安全対策の構築は優先すべきでしょうか?
  • Microsoft内でOpenAIのGPT4.5/5モデルパイプラインを再構築するにはどれくらいの時間がかかるでしょうか?それには1) ChatGPTの週間アクティブユーザー1億人からのRLHFデータセットおよび進行中のパイプライン、2) Pre-trainingデータセット、および3) トレーニングソフトウェアインフラストラクチャーが含まれます。
  • GoogleやAnthropic、Meta、xAiなどがGPT-4.5/5レベルのモデルをリリースするにはどれほど遅れていたのでしょうか?
  • これによって中国が米国から先導権を取り、地政学に影響を及ぼす可能性はあるでしょうか?
  • AIは、先に到達した者がすべてを制するほとんどの市場で勝者となるでしょうか?
  • OpenAIの慈善団体の地位とAGIの安全保護は、Microsoftのような公開企業よりも、人類の利益と富の再分配において真にメリットがあるのでしょうか(数千億ドルの利益上限を超えた後)?

AIリーダーの指導方向、組織構造、文化、および所在地は、世界的に重要な意味を持つ可能性がありますが、結果を見守るしかありません!

– ルイ・ピーターズ — Towards AI 共同創設者兼CEO

最新のニュース

  1. Sam AltmanのOpenAIでの解任とその余波のタイムライン

サム・アルトマンがOpenAIのCEOを辞任したことにより、同社の社長兼共同創設者のグレッグ・ブロックマンと3人のシニアOpenAI研究者も辞任しました。この状況は急速に進展しており、この記事では出来事の展開を追うのに役立つタイムラインを提供しています。

2. キュータイは330億ドルの予算を持つフランスのAI研究所で、すべてをオープンソースにする

パリに拠点を置くAI研究所キュータイは、人工汎用知能の開発を進めるために3億3000万ドルの資金を確保しました。これらの資源を活用して、キュータイは博士課程の学生、ポスドク、研究者による包括的な研究を行います。また、研究所は自社のモデル、ソースコード、データを公開することでAIの透明性を重視しています。

3. ディープマインドが音楽生成のためのモデル「リリア」を紹介

Googleのディープマインドが開発したAI音楽モデル「リリア」は、カスタマイズ可能なボーカルを持つ卓越した音楽を生み出すことで音楽制作のプロセスを変革しています。「Dream Track」というYouTube上の実験では、アーティストがAI生成の声と音楽を通じてファンとつながることができ、音楽業界のプロフェッショナルにとってはAIツールが創造的な作業をサポートします。

4. グラフキャスト: より迅速かつ正確なグローバル天気予報のためのAIモデル

DeepMindは、グラフニューラルネットワークを使用して10日間先までグローバルな天気を正確かつ素早く予測する高度なAIシステム「グラフキャスト」を開発しました。これは業界標準のHRESシステムを上回り、サイクロンや大気の川を追跡し、極端な気温を特定することができます。

5. Nvidiaが最新の高性能AIモデルトレーニングチップ「H200」を発表

Nvidiaは、141GBの高帯域幅メモリを搭載したH200 GPUを発表しました。このアップグレードにより、大規模なAIモデルの推論プロセスが改善されます。2024年第2四半期にリリース予定のH200は、AMDのMI300X GPUと競合し、モデルの処理に必要なメモリ容量を増やします。

OpenAIにとって、Sam Altmanを解任することは正しいと思いますか? 以下のコメント欄でご意見をお聞かせください!

5分間の読書/動画で学び続けるための5つの選択

  1. OpenAIのRAG戦略の適用

OpenAIのRAGモデルは、コサイン類似度、マルチクエリ、後戻りプロンプティング、Rewrite-Retrieve-Read、効率的なルーティングなど、さまざまなリトリーバルストラテジーを組み込んでいます。この記事では、OpenAIの一連のRAG実験で使用される各手法について詳しく説明し、実装方法を示しています。

2. LoRA(低ランク適応)を使用したLLMの効果的な調整のヒント

この記事では、言語モデル(LLM)のLow-Rank Adaptation(LoRA)の効果的な調整手順を探求し、洞察と推奨事項を提供します。実験結果によると、LoRAはメモリ使用量を節約する一方でランタイムを増やします。すべてのレイヤーでLoRAを使用し、ランクとαを調整することでモデルの性能を向上させることができます。

3. 2023年にLLMのスキルを始めて向上させる方法

これは、フィールドでの高度なバックグラウンドを持たない人々が2023年にLLMのスキルを始めて向上させるための完全なガイドです。最新のニュースや最先端の技術に常にアップデートされるための方法も説明しています。プログラミングと機械学習の基礎がある方々を対象としています。

4. DeepMindによるAGI達成への進捗状況

Google DeepMindの科学者チームが、AGIシステムとその前身の能力と振る舞いを分類するための新しい枠組みを提案しました。この記事では、人工知能を測定するための基準、パフォーマンスと一般性を測定するためのマトリックス、およびリスクと自律性を測定するための別のマトリックスを含む、その枠組みについて探求します。

5. OpenAIのアイデンティティ危機とAIの未来の戦い

これはOpen AIで起こっている最近の一連の出来事についての緻密な論評です。著者によれば、AIの安全性と市場の勢いのバランスの問題が、Sam Altmanを排除する決定に影響を与えました。

リポジトリとツール

  1. explodinggradients/ragas

Ragasは、検索増強生成(RAG)パイプラインを評価するのに役立つフレームワークです。RAGは、外部データを使用してLLM(Large Language Model)の文脈を補完するLLMアプリケーションのクラスを表します。

2. abi / screenshot-to-code

このアプリは、スクリーンショットをHTML/Tailwind CSSに変換します。GPT-4 Visionを使用してコードを生成し、DALL-E 3を使用して似たようなイメージを生成します。

3. Netmind Power

Netmind Powerは、分散型の機械学習とAIプラットフォームです。このプラットフォーム上で独自のモデルをトレーニングすることができ、ネットワークからコンピュートを見つけ、コードを配布してくれます。

4. BuilderIO / gpt-crawler

GPT Crawlerは、サイトのURLを提供すると、そのサイトをクロールし、GPTのためのナレッジベースとして使用します。このGPTを共有したり、サイトやアプリにカスタムのアシスタントとして統合したりすることができます。

今週のトップ論文

  1. 人間、GPT-4、GPT-4Vによる抽象化と推論タスクの比較

この研究は、ConceptARCベンチマークを使用して、GPT-4とその多モーダルバージョンであるGPT-4Vを人間と比較し、抽象化と推論タスクにおける能力を評価しています。結果は、詳細なワンショットプロンプトと簡単な画像タスクがあっても、どちらのGPT-4バージョンも人間のレベルの抽象的な推論には及びません。

2. GPT-4V in Wonderland:大規模な多モーダルモデルを用いたゼロショットスマートフォンGUIナビゲーション

この論文では、大規模な多モーダルモデルを使用してスマートフォン上でのゼロショットGUIナビゲーションを成功させるGPT-4Vベースのエージェント、MM-Navigatorを紹介しています。iOSの画面指示を理解し、実行する際の高い精度を示しています。

3. コードのための言語モデルに関する調査

この包括的な調査では、言語モデルを使用したコード処理の進化と進歩について探ります。50以上のモデル、30の評価タスク、500の関連研究をカバーし、一般的な言語とコード上でトレーニングされた専門モデルに焦点を当てています。この調査は、GitHubリポジトリで公開されており、更新されています。

4. ノートの連鎖:検索増強言語モデルにおける堅牢性の向上

Retrieval-augmented language models (RALMs)は、検索された情報の信頼性の低さにより、誤った応答を生成することがあります。新しいアプローチであるChain-of-Noting(CoN)は、文書の関連性を評価し、RALMの応答を改善するために順次のリーディングノートを生成します。

  1. MetaがEmu VideoとEmu Editを発表しました、これらは最新のAI画像編集とビデオ生成のブレイクスルーです。EMUは9月に発表され、現在はプロダクションで使用されており、Meta AIのImagine機能などのエクスペリエンスを提供しています。
  2. NVIDIAは、先進的なメモリを備えたNVIDIA H200 Tensor Core GPUを搭載したNVIDIA HGX™ H200を導入することにより、世界をリードするAIコンピューティングプラットフォームをさらに強化したことを発表しました。
  3. IBMは、脆弱なコミュニティのための緑色とテクノロジースキルの無料トレーニングや新しい持続可能なプロジェクトを通じて、気候行動への取り組みを進めています。

AI分野で求人探し

シニアバックエンドソフトウェアエンジニア(課金エンジニア)@Philo(リモート)

デシジョンサイエンティスト–データ&アナリティクス@Salesforce(リモート)

シニアソフトウェアエンジニア–DGXクラウドメッセージングプラットフォーム@NVIDIA(米国/リモート)

AI&MLエンジニア(Python、PyTorch、Tensorflow)@CodeLink(ホーチミン市、ベトナム)

AI/MLエンジニア@Intersog(リモート)

テクニカルプロダクトマネージャー@CodeHunter(リモート)

データサイエンスアソシエイト @Black Swan Data, Inc.(リモート)

ここに求人情報を共有することに興味がありますか?お問い合わせはまでどうぞ。

次の機械学習のインタビューの準備をしている場合は、ぜひ当社のインタビュー準備ウェブサイトconfettiをチェックしてください!

https://www.confetti.ai/

友達も楽しめると思いませんか? ニュースレターを共有して、参加しましょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

機械学習信頼性の向上:異常性がモデルのパフォーマンスと不確実性の定量化を向上させる方法

オブジェクトがそのカテゴリーの他のアイテムに似ている場合、それは典型的と見なされます。例えば、ペンギンは普通でない鳥...

機械学習

「2Dから3Dへ:アラインドジオメトリックプライオリティを用いたテキストから3D生成の一貫性向上」

2D画像を3Dオブジェクトに変換することは、テキストから3D生成のために困難なタスクです。これは、2D拡散モデルがビューに関...

機械学習

「BLIVAと出会ってください:テキスト豊かなビジュアル質問をより良く扱うためのマルチモーダルな大規模言語モデル」

最近、大規模言語モデル(LLMs)は、自然言語理解の分野で重要な役割を果たしており、ゼロショットやフューショットのシナリ...

機械学習

『見て学ぶ小さなロボット:このAIアプローチは、人間のビデオデモンストレーションを使用して、ロボットに汎用的な操作方法を教える』

ロボットは常にテックの世界で注目の的となってきました。彼らは常にSF映画、子供向け番組、書籍、ディストピアの小説などで...

AI研究

オープンAIのCEOであるサム・アルトマン氏が解任されました

驚きの展開となり、AI研究のリーディングカンパニーであるOpenAIは、共同創設者兼CEOのサム・オールトマン氏の解任を発表しま...

AI研究

このAI研究によって、写真-SLAMが発表されました:ポータブルデバイスでのリアルタイム写真写実的マッピングを向上させる

コンピュータビジョンとロボット工学において、カメラによる同時位置推定と地図作成(SLAM)は、自律システムが自ら環境をナ...