このAIニュースレターは、あなたが必要な全てです #55
AIニュースレター #55は必要な全てです
ルイによる今週のAIの出来事
今週、私たちはついにOpen AIのコードインタプリターをテストする機会を得ました。これはChatGPT内のGPT-4の新機能です。OpenAIは他の発表も行いました。その中には、次の4年間でスーパーアラインメントを達成するために専任チームを設立する計画も含まれています。
初期のアルファ版リリースの後、コードインタプリター機能は、コーディングやデータの可視化機能を備えたものとして、すべてのChatGPT Plusユーザー向けにベータモードで利用可能です。コードインタプリターは、データ分析、グラフ作成、ファイルのアップロードと編集、数学演算、コードの実行など、さまざまな機能を持つChatGPTを強化します。
コードインタプリターの使用は、ほとんどのユースケースにおいて比較的簡単です。特にアナリストとしてアプローチする場合は、初期のプロンプトは最小限にすることができます。AIは文脈からデータの意味と構造を理解する能力に優れています。アップロードされたデータは、プラスボタンをクリックするだけで簡単に行うことができます。AIはデータのマージや洗練されたデータのクリーニングなど、タスクを自動的に処理します。Ethan Mollickは、Code Interpreterの多くの興味深いユースケースを彼のTwitterとこのブログで文書化しています。特に強力なのは、間違い(コードの実行に失敗したため)を認識し、モデルがそれを修正するために反復する能力です。
この機能は、データ分析や可視化、トレンドの特定、トピックの分析、エンゲージメントパターンの調査、SEOの最適化、KPIの分析、ビデオの作成、さらには機械学習のデータセットやモデルの構築など、さまざまなユニークなアプリケーションに使用することができます。Code Interpreterへのアクセスが拡大するにつれて、可能性も広がっています。ChatGPTへの関心が減退している兆候が最近見られました(ウェブサイトの訪問者数の減少などの報告がありますが、GPT-TurboとGPT-4はAPIを介して他の地域でより広く展開されています)。そのため、この新機能はOpenAIにとって良い時期に登場しました。
私たちは、Code InterpreterがLLM(Large Language Models)からさらに多くの機能を引き出し、基本的なデータ分析のコストと進入障壁を大幅に削減する可能性があると考えています。ただし、依然として人間の監督と人間の想像力が必要です。適切な質問をすることや洞察を得るための。LLMがより強力なツールを使うことで、この方向性でさらなる進展が期待されます。
他のAIのニュースでは、昨年10月に紹介した教育スタートアップのKinnuが650万ドルの資金調達を成功させました。Kinnuは主に成人の愛好家学習者を対象にしており、AIを活用して各個人の学習コンテンツを最適化しています。「私たちは常にオンライン教育のほとんどが伝統的な学校教育の最悪の側面を拡大させていることが不思議でした」とKinnuの共同創設者兼CEOであるクリストファー・カーラーは述べています。「私たちは、人間の学習のペースを加速することに焦点を当てたAIによる学習に大きな機会があると考えています。」Kinnuの進歩には大いに期待しており、AIが教育の向上に貢献する可能性に同意しています。
– ルイ・ピーターズ — Towards AIの共同創設者兼CEO
最新ニュース
- スーパーアラインメントの導入
OpenAIはスーパーアラインメントの概念を導入し、高度に知能化したAIシステムが人間の意図と一致するために科学的および技術的なブレイクスルーの必要性を強調しています。組織は画期的なガバナンス機関の確立と、このアラインメントを達成するための新しいアプローチの探求の重要性を強調しています。
2. Miner(マイニング会社)が38,000台のGPUを暗号通貨からAIに切り替える
クリプトマイニング会社のHive Blockchainは、EthereumのマイニングからAIのワークロードに焦点を移しています。彼らは38,000台のGPUを利用して収益を生み出す意図ですが、一部のGPUパワーを暗号通貨のマイニングに利用し続ける予定です。ただし、AIコンピューティングへの移行には課題があります。古いETHマイニングGPUはこの市場での価値が限定されています。
3. AWSが1億ドルのジェネレーティブAIイノベーションセンターを立ち上げ
AWSはジェネレーティブAIの進展に大きな投資を発表しました。1億ドルの投資を約束した新設されたAWSジェネレーティブAIイノベーションセンターは、世界中の顧客やパートナーがジェネレーティブAIの潜在能力を引き出すのを支援することを目指しています。イノベーションセンターは既にHighspot、Lonely Planet、Ryanair、Twilioなどの企業とジェネレーティブAIソリューションについて協力しています。
4. Googleの医療AIチャットボットがすでに病院でテストされています
GoogleのMed-PaLM 2は、医療情報に関する回答を提供するために開発されたAIツールで、Mayo Clinicの研究病院でテストされました。PaLM 2のバリアントであるMed-PaLM 2は、推論、コンセンサスに基づいた回答の提供、理解力などの面で有望な結果を示していますが、一部の精度の問題が残っています。
5. Alibabaはテキストから画像を生成するためのAIツールを発表
中国のテクノロジージャイアントであるAlibabaは、Tongyi Wanxiangという人工知能ツールを発表しました。このツールは、ユーザーが提示を入力することを可能にし、マンダリンと英語の両方でプロンプトを生成します。2Dイラスト、スケッチ、3Dアニメーションなど、さまざまなスタイルの画像を生成することができます。
学び続けるための5つの5分間の読み物/動画
- スケールでの量子化の興味深い特性
最近の研究によると、大規模な言語モデルの事後トレーニング量子化(PTQ)の品質は、事前トレーニングのハイパーパラメータに強く影響を受けます。この研究では、重み減衰、勾配クリッピング、データ型の選択などの最適化の選択がPTQのパフォーマンスに大きな影響を与えることを示しており、float16とbfloat16が顕著な影響を示しています。この研究は、ロバストな言語モデルの開発における最適化の選択の重要性を強調しています。
2. 機械学習に最適なGPU
この記事では、機械学習でのGPUの利用の増加と、AIアプリケーションに最適なGPUの選び方について紹介しています。互換性やメモリ容量などの重要な要素を考慮し、Titan RTXやTesla V100などのNVIDIAのトップGPUオプション、EVGA GeForce GTX 1080やAMD Radeon GPUなどのコスト効果の高い代替オプションを紹介しています。
3. AIの重みは「オープンなソース」ではありません
この記事では、AIモデルの重みとそのオープンソースでの利用可能性について掘り下げています。AIモデルのソースコードはオープンであるかもしれませんが、実際の学習済み知識である重みは、知的財産、プライバシー、商業的な利益などのさまざまな理由から一般に共有されていません。
4. 人工知能用語集:知っておくべき60以上の用語
AIは指数関数的に成長しており、それに関する意識のレベルも異なっています。この用語集は、AIに初めて触れる人やリファレンスや語彙の復習を探している人のためのリソースとして役立つことを目指しています。
5. ChatGPTでCode Interpreterを使い始める
この記事では、Ethan Mollick氏がTwitterでCode Interpreterの興味深い使用例を記録しました。また、その特徴や使用方法などについても紹介しています。
論文とリポジトリ
- 大規模言語モデルの評価に関する調査
この記事では、言語モデルの評価方法について包括的なレビューを提供しています。推論、倫理、アプリケーションなどのさまざまな側面を評価する方法、一般的なベンチマークと特定のベンチマークの場所、人間の評価と自動評価を含む評価方法に焦点を当てています。
2. DreamDiffusion:脳のEEG信号から高品質の画像を生成する
この論文では、思考をテキストに変換する必要なく、脳の脳波(EEG)信号から直接高品質の画像を生成するための新しい手法であるDreamDiffusionを紹介しています。事前学習されたモデルと高度な信号モデリング技術を活用することで、限られた情報やノイズといった課題を克服しています。
3. LongNet:1,000,000,000トークンにスケーリングするTransformer
この研究では、シーケンスの長さを10億トークン以上にスケーリングできるTransformerのバリアントであるLongNetを紹介しています。長いシーケンスを効率的に処理するために、拡張された注意を使用し、短いシーケンスのパフォーマンスを維持します。この手法を使用することの主な利点の1つは、既存の最適化手法との互換性です。既に使用されている他の方法とシームレスに統合し、最適化の選択肢を広げることができます。
4. 再帰の呪い:生成データでモデルを訓練するとモデルが忘れる
研究者は「モデルの崩壊」という現象について探究し、他のモデルからのコンテンツを使用してモデルを訓練するとオリジナルのコンテンツ分布が消失することを明らかにしました。この現象はLLM、変分オートエンコーダー、ガウス混合モデルに影響を与え、ウェブ収集データの利点を維持するために真の人間のインタラクションからのデータを理解し、保持する必要性を強調しています。
5. ChatLaw:統合外部知識ベースを持つオープンソースの法律大規模言語モデル
ChatLawは、中国の法的領域に特化したオープンソースの法的言語モデルです。ベクトルとキーワードの検索技術の組み合わせを使用して、データ検索中のモデル幻覚に対処し、より正確な応答を実現しています。セルフアテンションは、参照データの正確性と信頼性を向上させるために使用されています。
これらの論文とニュースの要約を楽しんでいますか?毎日の要約をメールで受け取る!
一緒にAIを学ぶコミュニティのセクション!
週刊AIポッドキャスト
「What’s AI」ポッドキャストの今週のエピソードでは、ルイス・ブシャールがDeepMindの研究科学者であり、ケンブリッジ大学の客員講師でもあるペタル・ヴェリチコヴィッチ氏にインタビューしています。ペタルは博士号の価値についての洞察を共有し、研究へのゲートウェイとしての役割や、つながりを築くための機会を強調しています。また、多様なバックグラウンドと貢献の重要性を強調し、AI研究の進化する風景にも触れています。このインタビューでは、学界と産業界の比較、研究科学者の役割、DeepMindでの仕事、教育、そして影響力のある研究を推進する好奇心の重要性について、貴重な視点を提供しています。AI研究に興味がある場合は、YouTube、Spotify、またはApple Podcastsでチェックしてみてください!
今週のミーム!
mrobinoさんがシェアしたミームです。
Discordからの注目コミュニティ投稿
weaver159#1651さんが最近、MetisFLという新しいプロジェクトを紹介しました。これは、開発者が機械学習ワークフローを容易に連邦化し、分散データのデータシロにわたってモデルをトレーニングするためのフェデレーテッドラーニングフレームワークです。このフレームワークのコアはC++で書かれており、スケーラビリティ、スピード、耐障害性を重視しています。現在、プロジェクトはプライベートな実験版からパブリックベータフェーズに移行しています。GitHubでチェックし、コミュニティメンバーをサポートしてください。このプロジェクトについての考えをスレッドで共有してください。
今週のAI投票!
ディスカッションに参加するためには、Discordでチェックしてください。
TAIキュレーションセクション
今週の記事
SQLクエリのためのGPT-4より優れたNSQL(完全オープンソース) by Dr. Mandar Karhade, MD. PhD.
SQLはまだ最も一般的に使用されている言語です。大規模な言語モデルに質問することでSQLクエリを書くことができれば、作業の大部分を節約し、ほぼすべての必要な人に洞察力を民主化することができるでしょう。この記事では、SQL生成タスクに特化した新しいオープンソースの大規模基盤モデル(FM)であるNSQLについて著者が語っています。
おすすめの記事
分類メトリクスを明確に説明! by Jose D. Hernandez-Betancur
データインサイトを解き放つ:強力な分析のためのAIのマスタリング by Amit Kumar
Salesforce XGen-7Bによる完全オープンソースの基盤モデルに会いましょう by Dr. Mandar Karhade, MD. PhD.
Towards AIでの公開を希望する場合は、ガイドラインをご確認の上、サインアップしてください。編集方針と基準を満たす場合、当社のネットワークにあなたの作品を公開します。
求人情報
Data Architect @ShyftLabs(カナダ、トロント)
Machine Learning Specialist — Legal Systems @Uni Systems(ベルギー、ブリュッセル)
Graphics AI Research Developer @Plain Concepts(リモート)
Data Engineer @Tomorrow(フリーランス/ルーマニア)
Growth Manager, Data & Analytics @WillowTree(リモート)
Client Platform Engineer @Chainalysis(リモート)
Intern — Software Engineering Interns — ACST @Activate Interactive Pte Ltd(シンガポール)
ここで求人情報を共有したい場合は、[email protected]にお問い合わせください。
次の機械学習インタビューの準備をしている場合は、ぜひ当社のリーディングなインタビュー準備ウェブサイト、confettiをチェックしてください!
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles