Learn more about Search Results A - Page 86

「Google AIがAltUpを紹介」

「トランスフォーマー型ニューラルネットワークは、自然言語処理やコンピュータビジョン、ロボット工学、自律運転などの新興アプリケーションにおいて、驚くべき効果を示し、焦点となっていますしかし、これらのモデルの規模が増大することにより、コンピューティングにかかるコストや推論の待ち時間に関する課題が生じていますこれが...」

オートフォーマリゼーションは、非公式と公式の言語のギャップを埋めることができるのでしょうか?MMAと出会ってください:フィールドを革新している多言語および多ドメインのデータセット

コンピュータが自動的にチェック可能な形式で記述された数学的内容は、標準的な数学として言及されます。数学者は、HOL Light、Isabelle、Coq、およびLeanなどの証明ツールを組み込んだ形式言語を使用します。自然言語の情報を検証可能な形式化に変換することは、オート形式化として知られています。最適なオート形式化エンジンを使用すると、現在の数学的な結論の検証がより低コストで行われる可能性があります。これにより、自然言語で書かれた数学の大量の情報を利用できる形式言語に依存する自動定理証明などの自動推論研究領域にアクセスできます。非形式的な数学を形式的に証明可能な素材に自動的に変換するという野心は、標準的な数学自体と同じくらい古いものです。 自然言語と対象言語の両方で同じ意味を伝えるシーケンスのペアで構成される大きな並列データセットは、通常、NMT技術に必要です。形式言語と自然言語の両方でパラレルなデータセットを構築することは、機械学習手法で大量のデータを必要とするため、困難な側面です。また、自然言語のコンポーネントが数学の書き方に近いことが求められます。これは、非形式的な数学の知識を形式的な言語に手作業で変換するために高価で高度なコンピュータサイエンスと数学の専門家が必要だからです。 この研究の著者は、最新の大規模言語モデルであるGPT-4を使用して、IsabelleのArchive of Formal ProofsとLean4のmathlib4という2つの最大の形式コーパスを自然言語に変換することで、パラレルデータセットの不足に対応しました。非形式化は形式化よりもはるかに簡単であるという2つの重要な洞察と、強力な大規模言語モデルによってさまざまな自然言語の出力が得られることが、このプロセスを促進しました。ケンブリッジ大学とエディンバラ大学の研究者は同時に、MMAデータセットと呼ばれる332Kの非形式-形式データセットを作成しました。彼らによると、これは最初の複数の形式言語を含むパラレルデータセットです。最大の利用可能なデータセットよりも4倍のデータ点を持っています。 彼らは、MMAに最適化されたオープンソースで非常に効果的な大規模言語モデルであるLLaMA-33Bを使用して、非形式のフレーズに対応する形式的なフレーズを提供しました。それから、miniF2FとProofNetという2つのオート形式化のベンチマークを使用して訓練済みモデルを評価しました。モデルが微調整された後、各ベンチマークから50の出力の手動レビューによると、修正の必要がないか最小限の修正の必要があるベンチマーク上の16 ‐ 18%の形式文が生成されました。生のモデルの場合は0%でした。さらに、彼らはMMAのLean4およびIsabelleコンポーネントに対して同じステップ数で2つの類似モデルを独立に調整しました。これらの自動形式化のパフォーマンスは、異なる形式言語を含むパラレルデータでのオート形式化トレーニングの重要性を示しています。 研究貢献: • mathlib4およびArchive of Formal Proofsのすべての形式的な主張を非形式化して、非形式-形式のペアを含むMMAコレクションを作成しました。 •零ショット設定で複数の言語に自動形式化できる最初の言語モデルを訓練し、2つの自動形式化のベンチマークで手動評価しました。これは、最大の既存のデータセットよりも4倍大きな複数の形式言語を含む自動形式化データセットです。 • MMAで訓練された言語モデルが頑健な自動形式化機能を持ち、MMAの単一言語のパーティションで訓練された言語モデルよりも同じ計算予算で自動形式化で優れていることを確認しました。 •最適化されたモデルを推論で使用できるようにしました。さらに、他のドメインや言語での自動形式化モデルの訓練と豊かな化にMMAデータセットを利用できるようにしました。

このAI論文は、機械学習パイプライン内のさまざまなタイプの漏えいについて包括的な概要と議論を提供しています

機械学習(ML)は、予測モデリング、意思決定支援、洞察的なデータ解釈を実現することにより、医学、物理学、気象学、気候解析などの分野を大きく変革しました。学習アルゴリズムやデータ操作ツールが豊富に備わったユーザーフレンドリーなソフトウェアライブラリの普及により、MLを基盤としたソフトウェアの成長が促進され、学習の障壁が大幅に低下しました。これらのツールは使いやすさを提供しますが、データ、前処理、特徴エンジニアリング、パラメータ最適化、モデル選択における特定の要件のためのカスタマイズが必要となるため、カスタムのMLベースのデータ分析パイプラインの構築は依然として課題です。 見た目には簡単なMLパイプラインでも、誤って構築または解釈されると致命的な結果につながる可能性があります。したがって、MLパイプラインにおける再現性が正確な推論を保証するものではないということを強調することが重要です。これらの問題に取り組むことは、アプリケーションの向上とML手法の社会的な受け入れを促進する上で重要です。 この議論は特に教師あり学習に焦点を当てており、ユーザーは特徴-ターゲットのペアとして提示されたデータを扱います。多くのテクニックやAutoMLにより、高品質なモデルの構築が民主化されましたが、この作業の範囲の限界を把握することが重要です。MLにおける包括的な課題であるデータの漏洩は、モデルの信頼性に大きな影響を与えます。漏洩の検出と防止は、モデルの正確性と信頼性を確保するために重要です。テキストでは、包括的な例、データ漏洩の事例の詳細な説明、および同定に関するガイダンスが提供されます。 集合的な研究では、ほとんどの漏洩の事例に基づいていくつかの重要なポイントが提示されています。この研究は、Institute of Neuroscience and Medicine、Institute of Systems Neuroscience、Heinrich-Heine-University Düsseldorf、Max Planck School of Cognition、University Hospital Ulm、University Ulm、Principal Global Services(India)、University College London、London、The Alan…

「Llama2とAmazon SageMakerを使用したLoRAのファインチューニングモデルのモデル管理」

ビッグデータとAIの時代において、企業は競争上の優位性を得るためにこれらの技術を利用する方法を常に探求しています現在、AIの中でも最も注目されている分野の一つが生成AIですそしてその理由は十分にあると言えます生成AIは創造性や可能性の限界を押し上げる強力な解決策を提供してくれます

自己RAGが産業用LLMを革命化する方法

大規模な言語モデル(LLMs)は、さまざまな産業に革命をもたらす準備が整っています金融部門の例を挙げてみましょうここでは、大量の文書を詳細に分析し、トレンドを見つけるためにLLMsが利用される可能性があります...

「SAS認定マシンラーニングエンジニアになるために必要なすべて」

「SAS認定機械学習エンジニアになるために必要なすべてを知るために読み続けてください」

「Amazon SageMaker JumpStartでMistral 7Bを調整して展開する」

今日は、Amazon SageMaker JumpStartを使用してMistral 7Bモデルを微調整する機能を発表できることをお知らせいたしますAmazon SageMaker StudioのUIを使用して、数回のクリックでSageMaker JumpStartでMistralテキスト生成モデルを微調整して展開することができますまたは、SageMaker Python SDKを使用することもできます基盤となるモデルは生成タスクのパフォーマンスが非常に良いです、[…]

チャレンジを受け入れました:アニメーターのワード・ナイシュタット氏が、今週の「NVIDIA Studio」でロボット革命を驚異的なスピードでリード

編集者注:この投稿は私たちの週間In the NVIDIA Studioシリーズの一環であり、特集されたアーティストを称え、クリエイティブなヒントやトリックを提供し、NVIDIA Studioテクノロジーがクリエイティブなワークフローを向上させる方法を示しています。また、新しいGeForce RTX 40シリーズGPUの機能、技術、リソースについて詳しく紹介し、コンテンツの制作を劇的に加速させる方法についても深く掘り下げています。 キャラクターアニメーターのSir Wade Neistadtは、ビデオチュートリアルや業界のトレーニングを通じて、アニメーションと3D教育をよりアクセスしやすくしようとしています。 このYouTubeクリエーターであるSir Wadeは、また、チャレンジも好きです。最近、電子機器会社のRazerから、新しいRazer Blade 18ラップトップとGeForce RTX 4090グラフィックスを使用してユニークで創造的なものを作成するよう依頼されましたが、Sir Wadeは快く引き受けました。 「クリエイティブなリスクを取ってまだ達成方法を知らないものを作りたいと思ったからです」と、アーティストは語りました。 アイ、ロボット Sir Wadeは、プロジェクトを進める上で最も困難な部分の1つは、要求に応じて創造的である必要があると述べています。Razerのプロジェクトでは、アニメーターは自分自身に2つの質問を投げかけて始めました。「何にインスピレーションを受けるか?」、「何で作業できるか?」 Sir Wadeは、ゲーム、テクノロジー、映画、人々の観察、会話にインスピレーションを見出しています。テクノロジー好きであり、ProRigsライブラリのキャラクターに長い間注目していた彼は、短編アニメーションにロボットを登場させることにしました。 アニメーションのコンセプトを作成する際、Sir…

「AIとニューロモーフィックコンピューティングのギャップを埋める」

人工知能の進化が急速に進む中で、成長する計算要求に対応できるハードウェアを求める取り組みは絶え間なく行われていますこの取り組みにおける重要な進展は、パデュー大学、カリフォルニア大学サンディエゴ校(UCSD)、エコール・スペリウール・ド・フィジック・エ・ド・[…]を中心とした共同研究によって達成されました

マイクロソフトのデータサイエンスとAIの学習パスを強調する

私たちはみな、MicrosoftとMicrosoft Azureに精通していますが、無料で利用できる学習コースの幅広さについて探求したことはありますか?以下にいくつか挙げてみましょうMLOps エンドツーエンドのマシンラーニングオペレーション(MLOps)Azure Machine Learningでの実装方法を学びます...

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us