Learn more about Search Results A - Page 545

「LLMを評価するためのより良い方法」

この記事は、NLPタスクによってカテゴリ分けされたリアルワールドのユーザープロンプトに対するLLMの応答を比較し、人間の洞察を活用したLLM評価の新しいアプローチを紹介していますこれは、LLM評価基準の向上に向けた有望な解決策を提供しています

ディープマインドのグラフキャストに会いましょう:機械学習による天気予報の飛躍

天気予報技術の重要な進展として、Google DeepMindは画期的な機械学習モデルである「GraphCast」を紹介しました。このAIツールは、従来の数値天気予報(NWP)モデルの支配に挑戦し、より正確かつ迅速な予測を提供するという大幅な飛躍を示しています。 天気予報の革新 GraphCastはデスクトップコンピュータで効率的に動作し、エネルギーとコストがかかる大型コンピュータに依存するNWPモデルとは対照的です。このAIモデルは、科学誌「Science」で11月14日に説明されたもので、過去と現在の天気データを利用して将来の天気予測を迅速に行います。 この革新は、気候変動や極端な気象イベントによる世界的な課題が生じている現在、正確な天気予測がますます重要になっているタイミングで登場しました。従来のNWPモデルは正確ですが、大気中の熱、空気、水蒸気の移動をマッピングするために広範な計算リソースを必要とします。 GraphCastの伝統的なモデルに対する優位性 DeepMindのロンドンの研究所で開発されたGraphCastは、1979年から2017年までの過去の世界の気象データを使用してトレーニングされました。気温、湿度、気圧、風などのさまざまな天気要素の間の相関関係を理解するために、この広範なデータセットを利用します。GraphCastの予測能力は最大で10日先までで、RESolution予測システム(HRES)のようなECMWFのNWPでは数時間かかるプロセスを1分未満で提供します。 特に、地球の表面に最も近い大気層である対流圏では、12,000の測定のうち99%以上でGraphCastはHRESを上回っています。また、地球の近くの5つの気象変数やより高い高度での6つの大気変数の予測にも精度があります。これには、熱帯低気圧や極端な温度変動を含む激しい天候現象の予測も含まれます。 比較的な優位性 GraphCastの優越性は、従来のモデルに対するだけでなく、他のAI駆動アプローチに対しても目立ちます。以前のHuaweiの研究によると、HuaweiのPangu-weatherモデルと比較した結果、GraphCastは天気予測の99%でより優れたパフォーマンスを示しました。ただし、異なるメトリックスを使用した将来の評価によっては、異なる結果が得られる可能性があることに注意してください。 結論 GraphCastは、計算要件を削減しながら迅速で正確な予測を提供し、天気に依存する活動に関連する気象研究と現実世界の意思決定に大きな支援を約束する、天気予報での変革的な進展を示しています。技術が進化し、現在の制約を克服するにつれて、GraphCastは実用的な応用への統合までに2〜5年かかると予想され、伝統的な手法とAIの革新的な能力を組み合わせた天気予測の新たな時代を切り拓くことになるでしょう。

「最初の原則から旅行セールスマン問題をモデリングする」

この記事はスプリント1の記事から続きますここでやることを理解するためにそれを読む必要はありませんが、簡単な要約をお伝えします(お好きなセクションにスキップしていただいて構いません)

「大型言語モデルを使用して開発するために知っておくべきすべて」

この記事の目的は、簡単な言葉でLLMベースのアプリケーション開発に必要な主要なテクノロジーを説明することですさらなる学習のために多くの有用なリンクも提供されていますそれは行く...

最も困難な部分:分類の目標を定義すること

ターゲット変数は、教師あり機械学習モデルで予測しようとしている変数またはメトリックですこれは、依存変数、応答変数、'y'変数ともよく呼ばれます...

ロコムジョコに会おう:厳格な評価と比較のために設計された新しい機械学習ベンチマーク

Intelligent Autonomous Systems Group、Locomotion Laboratory、German Research Center for AI、Centre for Cognitive Science、およびHessian.AIの研究者によって、疑似学習(IL)の研究を進めるためのベンチマークが紹介されました。このベンチマークは、既存の単純なタスクに重点を置いている限定的な評価手法の制限に対処しており、クワッドラペッド、バイペッド、および筋骨格ヒューマンモデルを含む多様な環境と包括的なデータセットで構成されています。実際のノイズのあるモーションキャプチャデータ、専門家の正確なデータ、およびサブオプティマルなデータを組み込んでおり、さまざまな難易度レベルで評価が可能です。 既存のベンチマークの制限に取り組むため、LocoMuJoCoはクワッドラペッド、バイペッド、および筋骨格ヒューマンモデルなど、多様な環境を提供しています。実際のモーションキャプチャデータ、専門家の正確なデータ、およびサブオプティマルなデータを伴っており、ベンチマークは難易度レベルにわたるILアルゴリズムの包括的な評価を可能にします。本研究では、確率分布と生体力学的原理に基づく指標が必要であることを強調し、効果的な行動品質評価のために求められるものです。 LocoMuJoCoは、所望のIL用にカスタマイズされたPythonベースのベンチマークであり、既存の基準における標準化の問題に取り組むことを目指しています。LocoMuJoCoはGymnasiumとMushroom-RLライブラリと互換性があり、ヒューマノイドとクワッドラペッドのロコモーション、および筋骨格ヒューマンモデル向けの多様なタスクとデータセットを提供します。この指標は、エンボディメントの不一致、専門家の行動を伴う学習、サブオプティマルな専門家の状態や行動の扱いなど、さまざまなILパラダイムをカバーしています。Mushroom-RLを使用して、クラシカルなIRLおよび対抗的なILアプローチ(GAIL、VAIL、GAIfO、IQ-Learn、LS-IQ、SQIL)のベースラインを提供します。 LocoMuJoCoは、包括的なデータセットを伴うクワッドラペッド、バイペッド、および筋骨格ヒューマンモデルなど、多様な環境を特徴とするベンチマークです。さまざまなエンボディメントに対するトレーニングのための動的ランダム化のためのスムーズなインターフェース、手作りの指標、最新のベースラインアルゴリズム、およびさまざまなILパラダイムのサポートが含まれています。このモデルは一般的なRLライブラリとのユーザーフレンドリーなインターフェースで簡単に拡張可能です。 LocoMuJoCoは、多様な環境と包括的なデータセットを提供することで、ロコモーションタスクの模倣学習のための包括的なベンチマークです。手作りの指標、最新のベースラインアルゴリズム、およびさまざまなILパラダイムのサポートにより、ILアルゴリズムの評価と比較が容易になります。この標準はクワッドラペッド、バイペッド、および筋骨格ヒューマンモデルをカバーし、異なるエンボディメントに対する一部観測可能なタスクを提供します。LocoMuJoCoは、難易度レベルにわたる評価を確実に行います。 LocoMuJoCoは、既存の基準の制限に取り組むとともに、ILアルゴリズムの徹底的な評価を容易にすることを目指しています。クワッドラペッド、バイペッド、および筋骨格ヒューマンモデルなど、多様な環境を含んでおり、難易度レベルの異なる包括的なデータセットを提供しています。この標準は簡単に拡張可能で一般的なRLライブラリと互換性があり、確率分布と生体力学的原理に基づく指標の開発に関するさらなる研究の必要性を認識しています。 本研究では、模倣学習のベンチマークにおける課題を特定し、クローンされた行動の品質を効果的に測定することの難しさを強調しています。確率分布と生体力学的原理の間の差異に基づく指標の開発に関するさらなる研究を提唱しており、特にサブオプティマルなデモンストレーションの場合には優先順位付けされた専門家のデータセットの探索の重要性が強調されています。さらに多くの環境とタスクを含むようにベンチマークを拡張し、多様なILアルゴリズムを使用して、汎用的なLocoMuJoCo指標を探索することが奨励されています。

「表形式データのためのグラフデータサイエンス」

グラフデータサイエンスの手法は通常、いくつかの固有のグラフの性質を持つデータに適用されます例えば、分子構造データ、輸送ネットワークデータなどですしかし、グラフ手法は他にも有用な場合があります...

エントロピーとジニ指数入門

エントロピーとジニ指数は、特に決定木アルゴリズムにおいて分割の品質を決定するのに役立つ重要な機械学習の概念ですこれらの指標はそれぞれ異なる方法で計算されます...

「画像のためのモダンなセマンティック検索」

「数年前の「あの一枚の写真」を見つけたいんですね場面に関するいくつかの具体的な情報を覚えているんですが、Apple Photosでは意味検索ができず、Google Photosでも制限がありますので…」

「シーケンシャルデータのディープラーニング入門」

「タイムシリーズや自然言語などの順次データは、順序と文脈を捉えることができるモデルが必要ですタイムシリーズ分析は、時間的パターンに基づいた予測に焦点を当てていますが、自然言語は...」

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us