このAIニュースレターは、あなたが必要なすべてです#63

AIニュースレター#63、必要なすべて

ルイによる今週のAI動向

今週のAI動向では、西洋市場での大規模言語モデル(LLM)の採用による収益成長のさらなる証拠を強調し、中国での新しいAIモデルの導入も紹介しています。

OpenAIは、2022年に記録された2800万ドルから大幅かつ急速な増加を示す、年間売上高の予測が10億ドルに達したと報告されています。また、注目すべきはNvidiaの新しいH100 GPUチップで、売上高の予測は数百億ドルに上ると報じられています。LLMはもはやニッチな研究分野にとどまらず、ChatGPTはLLM製品やインフラへの需要の大幅な変化を引き起こし、相当な収益を生み出しています。この関心の高まりはAIセクターへのベンチャーキャピタル投資の大幅な増加も引き起こしています。ただし、AI APIやインフラへのこの投資の波がどれだけ早く持続的な採用を伴う消費者製品に翻訳されるかは、まだわかりません。

中国のテック企業や大学も近年、AIに大きな投資を行い、機械学習への重要な貢献をしています。ただし、他の国々とは異なり、中国は企業がセキュリティ評価を受け、AIモデルの承認を取得することを義務付けています。この政策は以前、中国でのLLMチャットボットの公開を遅らせていました。しかし、今週、中国は11社の新しいモデルの公開を承認した重要な進展がありました。これらの製品が中国での採用をどのように進めるか、そして西洋の競合他社のモデルとの比較でどのように成果を上げるか、私たちは注目しています。

中国のAIの進展は有望ですが、アメリカ政府は中国への主要AIチップ供給への制裁を強化しました。これにより、進展への潜在的な影響についての疑問が生じています。これらの制限がどれほど広範囲に及ぶか、そして中国のAIプロジェクトが効率の低いチップ、社内設計のチップ、または中国のチップ製造でどのように補完できるかはまだ不明ですが、将来的には最も計算集約型のモデルのトレーニングに対してますます難しい課題になると予想されます。

– ルイ・ピーターズ — Towards AIの共同創設者兼CEO

この記事はinvideo AIのご提供によるものです:

AIツールでアイデアをビデオに変えましょう

あなたがビデオを作成するための共同パイロットを持っていると想像してください。それがinvideo AIです。

テキストコマンドでAIに指示を与え、スクリプト、ストックメディア、ボイスオーバー、キャプションを含む使用可能なビデオを即座に取得します。

シンプルなテキストプロンプトで編集や調整を行います。コンテンツクリエイターやYouTuber、マーケターにとって、創造力が100倍簡単になりました。

今すぐ無料でお試しください!

最新ニュース

  1. Xのプライバシーポリシーが公開データをAIモデルのトレーニングに利用することを確認

Xの最近のプライバシーポリシーの更新により、ユーザーの生体情報データや職歴、学歴などのデータを収集し、AIや機械学習モデルのトレーニングに活用することが明示されました。一部の報道では、イーロン・マスクが新しいAI企業のためにTwitterを一部買収した可能性があり、その際に独自のトレーニングデータを利用することができると推測されています。

2. GoogleがAIクラウドに全力投球

Googleは最近、グローバルなシステムインテグレーターや小規模なクラウドサービスプロバイダーを含む拡大したエコシステムを披露し、Googleの提供を世界中で広範に採用することを促進しています。Googleはインフラストラクチャサービス/プラットフォームサービスの競争では遠く3位ですが、Googleは長期的な戦略を採用し、クラウドコンピューティングの未来の主要な推進要素としてAIに大きく投資しています。

3. WeatherBench 2: 次世代のデータ駆動型天気モデルのためのベンチマーク

GoogleはAIによる気象予測分野で注目を集めているWeatherBench 2データセットを公開しました。機械学習手法は物理モデルと同じくらい効果的でありながら、手頃な価格のハードウェアを使用してより迅速な予測を行う利点があります。WeatherBench 2データセットは気象予測のML研究を向上させることを目指しています。

4. Ideogramが印象的なタイポグラフィを持つAIイメージジェネレータをリリース

Ideogramは、強力なタイポグラフィ機能を持つAIツールの一つです。このツールは画像内にテキストを生成するというユニークな機能を提供し、一般的なAIイメージジェネレータが直面する一般的な課題に効果的に対処します。

5. AIがウェブで自己の排気物に窒息する可能性がある

専門家は、AIによる生成コンテンツが近い将来ウェブを支配すると予測していますが、情報過多や劣化などのリスクが伴います。特筆すべき懸念は、「モデル崩壊」であり、AIモデルが予測可能な単語選択に過度に依存し、魅力的で洗練されたコンテンツを生成する能力を失う可能性があることです。

5分間の読み物/動画で学び続けるための5つの選択肢

  1. トランスフォーマーがAIを革新しました。それに代わるものは何ですか?

現代の人工知能が創設文書を持つとすれば、それはGoogleの2017年の研究論文「Attention Is All You Need」でしょう。この記事では、トランスフォーマーの概念について掘り下げ、その制約事項について説明し、これらの短所を克服するための潜在的な代替手段について議論します。妥当な論理に基づいた説得力のある代替手段が提示されています。

2. ChatGPT用語集:誰もが知っておくべきAIの41用語

AIの発展のペースは速く、最新の専門用語について追いつくのは難しいかもしれません。この用語集は、AIに初めて触れる人や参照や単語の復習を求める人のためのリソースとして役立ちます。

3. AIプロジェクトに適したGPU戦略の選択

このガイドでは、AIプロジェクトに対してGPUをレンタルするか購入するかの決定について掘り下げます。GPUを所有することは安定性を提供しますが、レンタルは適応性を提供します。フリーランサーは短期のプロジェクトにおいてレンタルが有益であり、長期の研究者は所有がより費用効果が高いことがわかるかもしれません。

4. 生成AIにおける幻覚解決のオプション

この記事では、生成モデルにおけるAIの幻覚の問題に取り組み、Retrieval Augmented Generation(RAG)という解決策を紹介しています。RAGはデータ生成中に関連する文脈を取得することで幻覚を効果的に軽減し、AI企業にとって選択肢となります。

5. Vertex AI LLM:人間のフィードバックからの強化学習

この記事では、Google Cloudを利用してVertex AIを使用して人間のフィードバックによる強化学習(RLHF)を実装するための包括的なガイドを提供しています。

論文とリポジトリ

  1. RLAIF:AIフィードバックによる強化学習のスケーリング

Googleの新たな調査結果によれば、AIフィードバックによる強化学習(RLAIF)は、高品質な人間の好みのラベル(RLHF)に代わる可能性のある手法となることが示唆されています。RLAIFは、オフシェルフの言語モデルを使用して好みのラベルを付けることで、LLMの拡張性の制限を解消し、効率を向上させる可能性を持っています。

2. YaRN:大規模言語モデルの効率的なコンテキストウィンドウ拡張

この論文では、そのようなモデルのコンテキストウィンドウを効率的に拡張する方法であるYaRNを紹介しています。従来の方法と比べて、トークン数は10倍少なく、トレーニングステップは2.5倍少なくなります。これは、64kと128kのコンテキストウィンドウを持つLLaMa 2 7Bおよび13Bモデルのファインチューニングに成功しています。

3. Qwen-VL:多機能な能力を持つフロンティアの大規模ビジョン言語モデル

アリババクラウドは、チャットアプリケーション向けに設計された強力なビジョン言語モデルであるQwen-VLを紹介しています。Qwen-VLは、画像とテキストの入力を組み合わせて正確なテキストと境界ボックスの出力を生成し、画像キャプション、質問応答、位置特定、テキスト-画像理解などのタスクを向上させます。

4. MedAlign:電子医療記録の指示文に基づいたクリニシャン生成データセット

MedAlignは、電子健康記録(EHR)データの分析のための983の指示文を含む貴重なデータセットです。研究者はこのデータセットを使用して、六つの一般的なドメイン言語モデルの性能を評価しました。GPT-4は35%のエラー率を示し、MPT-7B-Instructは68%のエラー率を示しました。

5. OpenBMB / ChatDev

ChatDevは、さまざまな役割(CEO、CTO、プログラマー、テスターなど)を持つ複数のインテリジェントエージェントを通じて運営される仮想ソフトウェア会社です。ChatDev内のこれらのエージェントは、設計、コーディング、テスト、ドキュメンテーションなどの専門機能セミナーに参加することで協力します。

これらの論文とニュースの要約を楽しんでいただけましたか?毎日のまとめをメールで受け取りましょう!

Learn AI Togetherコミュニティセクション!

今週のミーム!

neuralinkが共有したミーム

Discordからの注目されるコミュニティ投稿

Well.jobは、オープンソースまたはOpenAIを使用したセマンティック検索機能を提供するマルチリンガルセマンティック検索を導入しました。このソリューションは、どの言語でも機能し、さまざまな言語でFAISSライブラリを利用したセマンティック検索の類似性を効率的に実行するための簡単で効率的な手段を提供します。GitHubでチェックして、コミュニティメンバーを応援しましょう。このスレッドで質問やフィードバックを共有してください。

今週のAIポール!

ディスコードでディスカッションに参加しましょう。

TAIキュレーションセクション

今週の記事

埋め込みを使った10のクールなこと! [パート1] by Zubia Mansoor

クラシカルな機械学習(ML)から一歩踏み出し、埋め込みはほとんどのディープラーニング(DL)のユースケースの中心にあります。この概念を理解することで、特徴空間で柔軟なタスクを実行し、コンピュータビジョンや自然言語処理の高次元データを含むML/DLの問題を異なる形で捉えることができます。

おすすめの記事

スクラッチから遺伝的アルゴリズムの理解とコーディング — パート1 by Francis Adrian Viernes

強化学習: 動的計画法とモンテカルロ法 — パート2 by Tan Pengshi Alvin

スケールにおける機械学習: モデル対データ並列化 by Shubham Saboo

Pythonにおける最急降下法とニュートン法、スクラッチからの比較 by Nicolo Cosimo Albanese

Towards AIでの公開に興味がある場合は、ガイドラインをご確認の上、サインアップしてください。編集方針と基準を満たす場合、当社のネットワークであなたの作品を公開します。

求人情報

ソフトウェアエンジニアリングチームリーダー @Persado(リモート)

QAソフトウェアテストコンサルタント — USA @ReVisionz(リモート)

主任ソフトウェアエンジニア — Vue.JS @Creative Chaos(リモート)

データエンジニア @Mercari(リモート)

データリサーチインターン @Clarity AI(マドリッド、スペイン)

データエンジニア @Decathlon(シンガポール)

ソフトウェア開発者インターンシップ — 2023/24年夏 @Phocas Software(クライストチャーチ、ニュージーランド)

求人情報を共有したい場合は、[email protected] までお問い合わせください。

次の機械学習の面接の準備をしている場合は、当社のリーディングな面接対策ウェブサイト、confettiをぜひご覧ください!

https://www.confetti.ai/

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「生成AIを使って、あらゆる感情に対応するWhatsAppステッカーを作成する」

未来に向けて大きな進歩を遂げる中、WhatsAppの親会社であるMetaは、人工知能(AI)の世界に飛び込んでいます。最新の話題に...

人工知能

「ゲームからAIへ:NvidiaのAI革命における重要な役割」

Nvidiaは現在、Facebook、Tesla、Netflixよりも価値が高くなっていますロイターによると、株価は過去8ヶ月で3倍に増加しまし...

データサイエンス

データから真実を解読する:大きな言語モデルが真実をモデル化するためにパーソナを使用する方法

大型言語モデル(LLM)の導入により、人工知能のサブフィールドである自然言語処理(NLP)は大幅に進化し改善されています。...

人工知能

プロジェクトゲームフェイスをご紹介します:ハンズフリーで、AIにより動くゲーミングマウス

新しいオープンソースのハンズフリーゲーミングマウス、プロジェクトゲームフェイスは、ゲームをよりアクセスしやすくする可...

AIニュース

「生成AIにおける高度なエンコーダとデコーダの力」

はじめに 人工知能のダイナミックな領域では、技術と創造性の融合が人間の想像力の限界を押し上げる革新的なツールを生み出し...