このAIニュースレターは、あなたが必要な全てです #55

AIニュースレター #55は必要な全てです

ルイによる今週のAIの出来事

今週、私たちはついにOpen AIのコードインタプリターをテストする機会を得ました。これはChatGPT内のGPT-4の新機能です。OpenAIは他の発表も行いました。その中には、次の4年間でスーパーアラインメントを達成するために専任チームを設立する計画も含まれています。

初期のアルファ版リリースの後、コードインタプリター機能は、コーディングやデータの可視化機能を備えたものとして、すべてのChatGPT Plusユーザー向けにベータモードで利用可能です。コードインタプリターは、データ分析、グラフ作成、ファイルのアップロードと編集、数学演算、コードの実行など、さまざまな機能を持つChatGPTを強化します。

コードインタプリターの使用は、ほとんどのユースケースにおいて比較的簡単です。特にアナリストとしてアプローチする場合は、初期のプロンプトは最小限にすることができます。AIは文脈からデータの意味と構造を理解する能力に優れています。アップロードされたデータは、プラスボタンをクリックするだけで簡単に行うことができます。AIはデータのマージや洗練されたデータのクリーニングなど、タスクを自動的に処理します。Ethan Mollickは、Code Interpreterの多くの興味深いユースケースを彼のTwitterとこのブログで文書化しています。特に強力なのは、間違い（コードの実行に失敗したため）を認識し、モデルがそれを修正するために反復する能力です。

この機能は、データ分析や可視化、トレンドの特定、トピックの分析、エンゲージメントパターンの調査、SEOの最適化、KPIの分析、ビデオの作成、さらには機械学習のデータセットやモデルの構築など、さまざまなユニークなアプリケーションに使用することができます。Code Interpreterへのアクセスが拡大するにつれて、可能性も広がっています。ChatGPTへの関心が減退している兆候が最近見られました（ウェブサイトの訪問者数の減少などの報告がありますが、GPT-TurboとGPT-4はAPIを介して他の地域でより広く展開されています）。そのため、この新機能はOpenAIにとって良い時期に登場しました。

私たちは、Code InterpreterがLLM（Large Language Models）からさらに多くの機能を引き出し、基本的なデータ分析のコストと進入障壁を大幅に削減する可能性があると考えています。ただし、依然として人間の監督と人間の想像力が必要です。適切な質問をすることや洞察を得るための。LLMがより強力なツールを使うことで、この方向性でさらなる進展が期待されます。

他のAIのニュースでは、昨年10月に紹介した教育スタートアップのKinnuが650万ドルの資金調達を成功させました。Kinnuは主に成人の愛好家学習者を対象にしており、AIを活用して各個人の学習コンテンツを最適化しています。「私たちは常にオンライン教育のほとんどが伝統的な学校教育の最悪の側面を拡大させていることが不思議でした」とKinnuの共同創設者兼CEOであるクリストファー・カーラーは述べています。「私たちは、人間の学習のペースを加速することに焦点を当てたAIによる学習に大きな機会があると考えています。」Kinnuの進歩には大いに期待しており、AIが教育の向上に貢献する可能性に同意しています。

– ルイ・ピーターズ — Towards AIの共同創設者兼CEO

学び続けるための5つの5分間の読み物/動画

スケールでの量子化の興味深い特性

最近の研究によると、大規模な言語モデルの事後トレーニング量子化（PTQ）の品質は、事前トレーニングのハイパーパラメータに強く影響を受けます。この研究では、重み減衰、勾配クリッピング、データ型の選択などの最適化の選択がPTQのパフォーマンスに大きな影響を与えることを示しており、float16とbfloat16が顕著な影響を示しています。この研究は、ロバストな言語モデルの開発における最適化の選択の重要性を強調しています。

2. 機械学習に最適なGPU

この記事では、機械学習でのGPUの利用の増加と、AIアプリケーションに最適なGPUの選び方について紹介しています。互換性やメモリ容量などの重要な要素を考慮し、Titan RTXやTesla V100などのNVIDIAのトップGPUオプション、EVGA GeForce GTX 1080やAMD Radeon GPUなどのコスト効果の高い代替オプションを紹介しています。

3. AIの重みは「オープンなソース」ではありません

この記事では、AIモデルの重みとそのオープンソースでの利用可能性について掘り下げています。AIモデルのソースコードはオープンであるかもしれませんが、実際の学習済み知識である重みは、知的財産、プライバシー、商業的な利益などのさまざまな理由から一般に共有されていません。

4. 人工知能用語集：知っておくべき60以上の用語

AIは指数関数的に成長しており、それに関する意識のレベルも異なっています。この用語集は、AIに初めて触れる人やリファレンスや語彙の復習を探している人のためのリソースとして役立つことを目指しています。

5. ChatGPTでCode Interpreterを使い始める

この記事では、Ethan Mollick氏がTwitterでCode Interpreterの興味深い使用例を記録しました。また、その特徴や使用方法などについても紹介しています。

論文とリポジトリ

大規模言語モデルの評価に関する調査

この記事では、言語モデルの評価方法について包括的なレビューを提供しています。推論、倫理、アプリケーションなどのさまざまな側面を評価する方法、一般的なベンチマークと特定のベンチマークの場所、人間の評価と自動評価を含む評価方法に焦点を当てています。

2. DreamDiffusion：脳のEEG信号から高品質の画像を生成する

この論文では、思考をテキストに変換する必要なく、脳の脳波（EEG）信号から直接高品質の画像を生成するための新しい手法であるDreamDiffusionを紹介しています。事前学習されたモデルと高度な信号モデリング技術を活用することで、限られた情報やノイズといった課題を克服しています。

3. LongNet：1,000,000,000トークンにスケーリングするTransformer

この研究では、シーケンスの長さを10億トークン以上にスケーリングできるTransformerのバリアントであるLongNetを紹介しています。長いシーケンスを効率的に処理するために、拡張された注意を使用し、短いシーケンスのパフォーマンスを維持します。この手法を使用することの主な利点の1つは、既存の最適化手法との互換性です。既に使用されている他の方法とシームレスに統合し、最適化の選択肢を広げることができます。

4. 再帰の呪い：生成データでモデルを訓練するとモデルが忘れる

研究者は「モデルの崩壊」という現象について探究し、他のモデルからのコンテンツを使用してモデルを訓練するとオリジナルのコンテンツ分布が消失することを明らかにしました。この現象はLLM、変分オートエンコーダー、ガウス混合モデルに影響を与え、ウェブ収集データの利点を維持するために真の人間のインタラクションからのデータを理解し、保持する必要性を強調しています。

5. ChatLaw：統合外部知識ベースを持つオープンソースの法律大規模言語モデル

ChatLawは、中国の法的領域に特化したオープンソースの法的言語モデルです。ベクトルとキーワードの検索技術の組み合わせを使用して、データ検索中のモデル幻覚に対処し、より正確な応答を実現しています。セルフアテンションは、参照データの正確性と信頼性を向上させるために使用されています。

これらの論文とニュースの要約を楽しんでいますか？毎日の要約をメールで受け取る！

一緒にAIを学ぶコミュニティのセクション！

週刊AIポッドキャスト

「What’s AI」ポッドキャストの今週のエピソードでは、ルイス・ブシャールがDeepMindの研究科学者であり、ケンブリッジ大学の客員講師でもあるペタル・ヴェリチコヴィッチ氏にインタビューしています。ペタルは博士号の価値についての洞察を共有し、研究へのゲートウェイとしての役割や、つながりを築くための機会を強調しています。また、多様なバックグラウンドと貢献の重要性を強調し、AI研究の進化する風景にも触れています。このインタビューでは、学界と産業界の比較、研究科学者の役割、DeepMindでの仕事、教育、そして影響力のある研究を推進する好奇心の重要性について、貴重な視点を提供しています。AI研究に興味がある場合は、YouTube、Spotify、またはApple Podcastsでチェックしてみてください！

今週のミーム！

mrobinoさんがシェアしたミームです。

Discordからの注目コミュニティ投稿

weaver159#1651さんが最近、MetisFLという新しいプロジェクトを紹介しました。これは、開発者が機械学習ワークフローを容易に連邦化し、分散データのデータシロにわたってモデルをトレーニングするためのフェデレーテッドラーニングフレームワークです。このフレームワークのコアはC++で書かれており、スケーラビリティ、スピード、耐障害性を重視しています。現在、プロジェクトはプライベートな実験版からパブリックベータフェーズに移行しています。GitHubでチェックし、コミュニティメンバーをサポートしてください。このプロジェクトについての考えをスレッドで共有してください。

今週のAI投票！

ディスカッションに参加するためには、Discordでチェックしてください。

TAIキュレーションセクション

今週の記事

SQLクエリのためのGPT-4より優れたNSQL（完全オープンソース） by Dr. Mandar Karhade, MD. PhD.

SQLはまだ最も一般的に使用されている言語です。大規模な言語モデルに質問することでSQLクエリを書くことができれば、作業の大部分を節約し、ほぼすべての必要な人に洞察力を民主化することができるでしょう。この記事では、SQL生成タスクに特化した新しいオープンソースの大規模基盤モデル（FM）であるNSQLについて著者が語っています。

求人情報

Data Architect @ShyftLabs（カナダ、トロント）

Machine Learning Specialist — Legal Systems @Uni Systems（ベルギー、ブリュッセル）

Graphics AI Research Developer @Plain Concepts（リモート）

Data Engineer @Tomorrow（フリーランス/ルーマニア）

Growth Manager, Data & Analytics @WillowTree（リモート）

Client Platform Engineer @Chainalysis（リモート）

Intern — Software Engineering Interns — ACST @Activate Interactive Pte Ltd（シンガポール）

ここで求人情報を共有したい場合は、[email protected]にお問い合わせください。

次の機械学習インタビューの準備をしている場合は、ぜひ当社のリーディングなインタビュー準備ウェブサイト、confettiをチェックしてください！

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Artificial IntelligenceMachine learningOpenAITechnologyTowards Ai

Was this article helpful?

93 out of 132 found this helpful

このAIニュースレターは、あなたが必要な全てです #55

ルイによる今週のAIの出来事

最新ニュース

学び続けるための5つの5分間の読み物/動画

論文とリポジトリ

一緒にAIを学ぶコミュニティのセクション！

週刊AIポッドキャスト

今週のミーム！

Discordからの注目コミュニティ投稿

今週のAI投票！

TAIキュレーションセクション

今週の記事

おすすめの記事

求人情報

Was this article helpful?

5分であなたのStreamlitウェブアプリをデプロイしましょう

このAIニュースレターは、あなたが必要とするすべてです #55

機械学習

「変革を受け入れる：AWSとNVIDIAが創発的なAIとクラウドイノベーションを進める」

「仕事を守るために自動化を避ける」

悪質なコンテンツ検出のためのLLM：利点と欠点

Google AIは、アクティブノイズキャンセリング（ANC）ヘッドフォンのための人工知能搭載の革新的な心臓モニタリングモダリティである音響脈波計（APG）を導入します

テキストブック品質の合成データを使用して言語モデルをトレーニングする

日本からの新しいAI研究は、人間の表情の機械的特性を調査し、アンドロイドが感情をより効果的に認識する方法を理解することを目指しています