Search Results Meta

機械学習を革新する：たった7行のコードでAutoGluonを使ってKaggleのトップ4％を達成

Slalom _buildで新しいデータエンジニアリングの役割を始めてから、数年前のMLの経験を最新化する必要があることに気付きましたデータエンジニアリング/データの経験を積んでから数年が経ちましたが...

このAIニュースレターはあなたが必要とするものです＃76

今週、私たちはトランスフォーマーや大規模な言語モデル（LLM）の領域を超えた重要なAIの進展に焦点を当てました最近の新しいビデオ生成拡散ベースのモデルの勢いについて…

オリジナリティの試金石：AIが創造的所有権に挑む

「もしも誰かがあなたにとって本当に貴重なものを盗んで、さらにひどいことにそれを自分のものだと偽って売りさばいたら、あなたはどう感じるでしょうか？彼らの犯罪から利益を得ています一部のクリエイターやアーティストは、このような感情を抱いています...」

「MMMUと出会おう：専門家レベルのマルチモーダルなチャレンジに向けたAIベンチマークで人工知能の一般的な発展への道筋をつける」

マルチモーダルプリトレーニングの進歩は、LXMERT、UNITER、VinVL、Oscar、VilBert、VLPなどのモデルに示されるように、さまざまなタスクに対応しています。 FLAN-T5、Vicuna、LLaVAなどのモデルは、指示に従う能力を向上させます。 Flamingo、OpenFlamingo、Otter、MetaVLのような他のモデルは、文脈を持った学習を探求します。 VQAのようなベンチマークは認識に焦点を当てますが、MMMは大学レベルの問題における専門家レベルの知識と緻密な推論を要求することで際立っています。包括的な知識カバレッジ、さまざまな画像形式、および既存のベンチマークとは異なる主題特化の推論に対する独自の強調点といった特徴があります。 MMMベンチマークは、IN.AI Research、ウォータールー大学、オハイオ州立大学、インディペンデント、カーネギーメロン大学、ビクトリア大学、プリンストン大学などの様々な組織の研究者によって提案され、さまざまな学問をカバーする大学レベルの問題が含まれています。専門家レベルの認識と推論を重視したこのベンチマークは、現行のモデルにとって大きな課題を提示します。この研究では、人間の能力を超えるExpert AGIに向けた進歩を評価するためのベンチマークの必要性が強調されています。MMLUやAGIEvalなどの現行の基準はテキストに焦点を当てており、より多様なモーダルな課題が必要です。大規模なマルチモーダルモデル（LMMs）は有望でありますが、既存のベンチマークには専門家レベルのドメイン知識が必要です。MMMベンチマークはこのギャップを埋めるために導入され、複雑な大学レベルの問題に多様な画像形式と交差するテキストを特徴としています。これはLMMsにとって高度なAI能力を目指す難しい評価を要求し、専門家レベルの認識と推論を提供します。 Expert AGI評価のために設計されたMMMベンチマークは、6つの学問と30の科目にわたる11.5Kの大学レベルの問題で構成されています。データ収集は、視覚入力に基づいてトピックを選択し、学生のアノテータを参加させてマルチモーダルな質問を収集し、品質管理を実施することによって行われます。LLMsやLMMsを含む複数のモデルは、MMMベンチマークでゼロショットの設定で評価され、微調整やフューショットデモなしで正確な回答を生成する能力がテストされます。 MMMベンチマークは、GPT-4Vが55.7％の精度しか達成できないため、モデルにとって困難です。専門家レベルの認識と推論の要求により、LLMsやLMMsにとって厳しい評価となります。エラー分析により、視覚的な認識、知識表現、推論、およびマルチモーダル理解の課題が明らかになり、さらなる研究の領域が示唆されます。30種類の多様な画像形式で大学レベルの知識をカバーするMMMベンチマークは、基礎モデルの精度と専門分野での適用性を高めるためにドメイン固有の知識をトレーニングデータセットに豊かにすることの重要性を強調しています。まとめると、MMMベンチマークの作成はExpert AGIの評価においてLMMsの重要な進展を表しています。このベンチマークは、現行のモデルに基本的な感覚スキルと複雑な推論を評価する機会を提供し、Expert AGI開発の進歩を理解するのに役立ちます。専門家レベルのパフォーマンスと推論能力を重視し、視覚的な認識、知識表現、推論、およびマルチモーダル理解におけるさらなる研究の領域をハイライトします。専門分野の精度と適用可能性を向上させるために、トレーニングデータセットにドメイン固有の知識を豊かにすることが推奨されます。

6つのGenAIポッドキャスト、聴くべきです

はじめに急速に進化する人工知能（AI）の世界において、生成AI（GenAI）の領域は魅力的でダイナミックな分野として注目されています。技術の進歩に伴い、この分野の微妙なニュアンスを理解することは重要ですが、最新情報を把握することは難しいかもしれません。GenAIは新しいコンテンツやデータを作成する能力で知られていますが、まだ比較的新しい分野ですので、最新の動向については多くの人が興味を持ちながらも情報を得ていません。この知識のギャップを埋めるために、GenAIの専門家がホストするポッドキャストは貴重な情報源となります。これらのポッドキャストは、最先端のテクノロジーの領域を探求したい学習者にとって、第一級の信頼できる情報を提供してくれます。以下に、生成AIの愛好家が聞くべきおすすめのポッドキャスト6つを紹介します。聴くべきトップ6のGenAIポッドキャスト 1. Leading With Data by Analytics Vidhya Analytics VidhyaはデータサイエンスとAIコミュニティで有名なプラットフォームであり、彼らのポッドキャスト「Leading With Data」ではデータサイエンス、機械学習、そしてなんと言っても生成AIについてさまざまな側面を探求しています。業界のリーダーや専門家、実践者との洞察に満ちた議論を期待してください。彼らは自らの経験、課題、そしてGenAIの未来へのビジョンを共有しています。コンテンツ形式：Leading With Dataでは業界リーダーや専門家、実践者との議論を取り上げ、GenAI、データサイエンス、機械学習などさまざまなトピックをカバーしています。対象読者：データサイエンス愛好者、専門家、生成AIの応用に関する洞察を得たい人々。このGenAIポッドキャストはSpotify、Apple Podcasts、Google Podcasts、YouTube、および彼らのコミュニティプラットフォームでご覧いただけます。 2. The…

「2024年に注目すべきトップ5のWeb3企業」

「Web3において革新を牽引しているトップ企業を発見しましょう彼らの特徴的な能力について学び、彼らがブロックチェーン、暗号通貨、ソーシャルプラットフォーム、ゲーム、そして分散型インターネットを再定義している方法を探求しましょう」(Web3においてかくしんをひっぱっているトップきぎょうをはっけんしましょうかれらのとくちょうてきなのうりょくについてまなび、かれらがぶろっくちぇーん、あんごうつうか、そーしゃるぷらっとふぉーむ、げーむ、そしてぶんさんがたいんたーねっとをさいていぎているほうほうをたんきゅうしましょう)

ジュリアでのメタルプログラミングについての翻訳結果です

昨年、私たちはMetal.jlフレームワークというAppleハードウェアのGPUバックエンドについて紹介されましたこれは、macOSの全ポテンシャルを最大限に活用したいJuliaプラクティショナーにとって、とても興奮するニュースです...

小さいが強力：大型言語モデルの時代における小型言語モデルの飛躍

「小さな言語モデルの革命を探求し、効率的で費用対効果の高いAIの代替手段として、主要な大きな言語モデルに対抗するものを挑戦してください」

メタAIがSeamlessを導入：リアルタイムで表現豊かな言語間コミュニケーションを可能にするパブリックで利用可能なAIシステム

自動音声翻訳の新機能と改善により、より多くのことが可能になり、より多くの言語をカバーし、さまざまな入力形式と連携して作業することができるようになりました。しかし、人間同士の会話と比較して、機械を介したコミュニケーションが自然に感じられる重要な機能は、現在の大規模な自動音声翻訳システムに欠けています。新しいMeta AIの研究では、表現豊かで多言語対応の翻訳を始めから終わりまでストリーミングできる一連のモデルを提案しています。研究者は、SeamlessM4T v2を発表しました。これはSeamlessM4Tモデルのアップグレード版であり、マルチモーダルでほぼすべての言語に対応しています。この改良されたモデルは、より新しいバージョンのUnitY2フレームワークを使用しており、リソースが少ない言語データで訓練されています。SeamlessAlignの拡張により、76言語分のデータ（114,800時間分）が自動的に整列されました。SeamlessExpressiveとSeamlessStreamingという最新の2つのモデルは、SeamlessM4T v2に基づいています。SeamlessExpressiveでは、ユーザーは声の抑揚やスタイルを維持しながら翻訳できます。 Metaの研究は、スピーチの速度や休止などのプロソディのあまり探求されていない特徴に対応しながら、声のスタイルを保持することを目指しています。SeamlessStreamingに関しては、提案されたモデルはソースの発話が終了するのを待たずに低遅延のターゲット翻訳を生成します。このモデルでは、効率的な単調多重注意（EMMA）技術が使用されています。SeamlessStreamingでは、多くのソース言語とターゲット言語が同時に音声からテキストへの翻訳が行われます。チームは、これらのモデルのプロソディ、遅延、頑健性を、新しいバージョンと更新済みの既存の自動評価尺度の組み合わせに基づいて評価しました。さらに、意味の保持、真正性、表現力にとって最も重要な品質を測定するために、既存のプロトコルを修正して人間による評価を実施しました。彼らはジェンダーバイアスの包括的な評価、マルチモーダル機械翻訳に対する既知の最初のレッドチーミング試行、深刻な有害性の検出と軽減に対する既知の最初のシステム、およびディープフェイクの影響を緩和するための聞き取りにくいローカライズされた透かし技術を実施し、彼らのモデルが責任を持って安全に使用されることを保証しました。 Seamlessは、表現豊かな言語間リアルタイムコミュニケーションを可能にする最初の公開システムです。SeamlessExpressiveとSeamlessStreamingを統合したSeamlessは、主要なコンポーネントを組み合わせています。全体的に、Seamlessはユニバーサルスピーチトランスレーターを科学小説のアイデアから現実に変えるために必要な基盤技術を提供しています。研究者は、モデルの正確性は性別、人種、アクセントによって異なる場合があると指摘していますが、公平性の軸に沿ってアーティファクトを徹底的にテストし、可能な場合には保護策を含めています。さらなる研究は、言語カバレッジの向上とリソースの少ない言語とリソースの豊富な言語間の性能格差の縮小を目指すべきです。これにより、ユニバーサルスピーチトランスレーターを実現することができます。

「ADHDを持つ思春期の若者において、この深層学習研究はMRIスキャンの分析において独特な脳の変化を明らかにする：MRIスキャン分析の飛躍的な進歩」

画期的な開発により、研究者は人工知能（AI）の力を活用して、思春期の注意欠陥多動性障害（ADHD）の診断に内在する課題に取り組んでいます。主観的な自己報告調査に依存する従来の診断環境は、客観性の欠如により長い間批判を浴びてきました。今や、研究チームは革新的なディープラーニングモデルを導入し、Adolescent Brain Cognitive Development（ABCD）研究からの脳イメージングデータを活用してADHDの診断を革新しようとしています。現在のADHDの診断方法は、主観的な性質と行動調査への依存から欠陥があります。これに対して、研究チームは1万1千人以上の思春期の脳イメージングデータを探るAIベースのディープラーニングモデルを考案しました。この手法は、拡散強調画像から導かれる重要な指標である分率異方性（FA）の測定を使用してモデルを訓練することを包括しています。このアプローチは、ADHDに関連する特異的な脳パターンを明らかにし、より客観的かつ定量的な診断フレームワークを提供します。提案されたディープラーニングモデルは、FA値の統計的に有意な差を認識するよう設計されており、ADHDの思春期におけるエグゼクティブ機能、注意、および音声理解に関連する9つの白質索において測定値が上昇していることを明らかにしました。これらの研究結果は、Radiological Society of North Americaの年次会議で発表され、重要な進歩を示しています： ADHD患者のFA値は、非ADHDの個人と比較して、30つの白質索のうち9つで有意に上昇していました。予測されたFA値と実際のFA値の間の平均絶対誤差（MAE）は0.041であり、ADHDの有無で有意に異なりました（0.042 vs 0.038、p=0.041）。これらの定量的な結果は、ディープラーニングモデルの効果を裏付けると同時に、FA測定がADHDの診断の客観的なマーカーとしての潜在能力を強調しています。研究チームの手法は、現在の主観的な診断の制約に取り組み、より客観的かつ信頼性の高い診断手法の開発に向けた途上にあります。白質索の特異的な差異は、ADHD診断におけるパラダイムシフトへの有望な一歩を示しています。研究者がより広範な研究からの追加データで調査結果をさらに充実させるなか、数年以内にAIがADHD診断に革命をもたらす可能性はますます高まっています。結論として、この先駆的な研究はADHDの診断における常識に挑戦するだけでなく、客観的な評価にAIを活用する新たな可能性を開拓しています。神経科学と技術の交差点は、思春期のこの普及している障害に関する包括的な理解を提供する脳イメージングの微細な部分に根ざした、より正確なADHD診断の未来に希望をもたらします。投稿：This Deep Learning Research Unveils Distinct Brain…

Learn more about Search Results Meta - Page 10