Learn more about Search Results A - Page 89

新しいMicrosoft AI研究では、HMD-NeMoを提案していますこの新しい手法では、手が部分的にしか見えていない場合でも、信憑性のある正確な全身運動生成に取り組んでいます

ミックスリアリティシナリオにおける没入型体験の領域では、正確かつ信憑性のある全身アバターの動きを生成することが持続的な課題となっています。既存の解決策は、ヘッドマウントデバイス(HMD)に依存しており、通常はヘッドと手の6自由度(DOF)など、限られた入力信号を利用します。最近の進歩によって、ヘッドと手の信号から全身の動きを生成することで印象的なパフォーマンスが示されましたが、それらは全て共通の制限を共有しています – 手の完全な可視性を前提とするという点です。この前提は、モーションコントローラが関与するシナリオでは妥当ですが、HMDの視野が制限されるため、手の追跡がエゴセントリックセンサに依存する多くのミックスリアリティ体験では、部分的な手の可視性が生じます。 イギリスのマイクロソフト・ミックスド・リアリティ&AIラボの研究者は、画期的な手法であるHMD-NeMo(HMDニューラルモーションモデル)を紹介しました。この統一されたニューラルネットワークは、手が部分的にしか見えていない場合でも信憑性のある正確な全身の動きを生成します。HMD-NeMoはリアルタイムかつオンラインで動作し、ダイナミックなミックスリアリティシナリオに適しています。 HMD-NeMoの核となるのは、時空間エンコーダであり、新しい時間的に適応可能なマスクトークン(TAMT)を備えています。これらのトークンは、手の観測がない場合でも合理的な動きを促進する重要な役割を果たします。この手法では、再帰的ニューラルネットワークを使用して時間的な情報を効率的にキャプチャし、トランスフォーマーを使用して異なる入力信号の複雑な関係をモデル化しています。 この論文では、評価のために考慮された2つのシナリオが概説されています。モーションコントローラ(MC)では、手はモーションコントローラで追跡され、ハンドトラッキング(HT)では、ハンドトラッキングセンサを介して手が追跡されます。HMD-NeMoは統一されたフレームワーク内で両方のシナリオを取り扱うことができる初めての手法です。HTのシナリオでは、手が視野外に部分的または完全にある場合、時間的に適応可能なマスクトークンは時間の一貫性を維持する効果を示します。 提案された手法は、SE(3)での人間のポーズ再構成におけるデータの正確さ、滑らかさ、および補助的なタスクを考慮した損失関数を使用してトレーニングされます。実験では、人間の動作シーケンスを3D人間メッシュに変換した大規模なAMASSデータセットの評価が行われます。HMD-NeMoのパフォーマンスを評価するために、平均関節位置誤差(MPJPE)や平均関節速度誤差(MPJVE)などのメトリクスが使用されます。 モーションコントローラシナリオにおける最先端の手法との比較では、HMD-NeMoは優れた精度とスムーズなモーション生成を実現しています。さらに、モデルの汎化能力は、異なるデータセットでの評価を通じて証明されており、既存の手法を上回る結果を示しています。 割合解析研究では、TAMTモジュールが欠落した手の観察を処理する上での効果など、さまざまなコンポーネントの影響について詳しく調査されます。この研究は、HMD-NeMoの設計選択肢がその成功に重要な貢献をしていることを示しています。 結論として、HMD-NeMoはミックスリアリティシナリオにおける全身アバターの動きを生成する課題に向けた重大な進歩です。モーションコントローラおよびハンドトラッキングの両方のシナリオを処理する柔軟性と、優れたパフォーマンスメトリクスにより、この手法はその分野で先駆的な解決策と位置づけられます。

「GitLabがDuo Chatを導入:生産性向上のための対話型AIツール」

ソフトウェア開発では、開発者は複雑なコードやプロジェクトの問題の効率的な管理に取り組むことが多いです。ワークフローで正しい情報や支援を見つけることはハードルとなることもあります。これらの課題に対処するため、GitLabは既存のワークフローに会話型AIを統合するという新しいツール「Duo Chat」を導入しました。 以前、開発者にはコーディングやプロジェクト管理のためのツールがありましたが、これらは異なるアプリケーション間を切り替える必要があり、作業の自然な流れを妨げることがありました。たとえば、GitHubのコーディングアシスタント「Copilot Chat」は、コードエディタ内で直接提案やコマンドを提供します。しかし、これらの溶決法は時には開発者のワークフローにシームレスに統合する必要がありました。 GitLabのAIツールスイートの最新追加であるDuo Chatは、このギャップを埋める役割を果たします。開発者はAIの能力を活用して自然言語の会話を行うことができ、コードの説明を得たり、テストを生成したり、コーディングのタスクを簡素化したりすることがGitLabプラットフォーム内で容易になります。これにより、開発者は異なるアプリケーション間を切り替えることなくAIの支援を利用することができ、開発プロセスが直感的になります。 このツールは、Anthropic Claude-2、Vertex AI Codey、およびテキスト埋め込みGecko LLMsを組み合わせてバックエンドを強化しています。この組み合わせにより、Duo Chatはオンデマンドの説明、コードの提案、および問題の要約を提供することができます。GitLabはプライバシー第一のアプローチを強調し、ユーザーのデータ(コードやチャットのやり取りを含む)がAIモデルのトレーニングデータとして使用されないことを保証しています。これは、GitLabの調査で83%の回答者が信頼できるプラットフォーム上でのAI実装の重要性を表明したことと一致しています。 他のプラットフォーム(例:GitHub)もAIコーディングアシスタントを強化している中、GitLabの戦略はAIを開発プラットフォームにネイティブに統合することです。Duo Chatを通じて、GitLabはスキルレベルに関係なく開発者にAIをアクセス可能にし、インスタントサポート、生産性向上、ステップバイステップのガイダンスを提供します。計画、コーディング、セキュリティ、コラボレーションに対する包括的なAI機能セットを提供することで、GitLabは開発者のワークフローを合理化し、効率的でユーザーフレンドリーなものにしようとしています。 まとめると、GitLabのDuo Chatは、AIを効果的にワークフローに統合したい開発者にとって有望な解決策です。開発プロセスで直面する課題に取り組み、プライバシー第一のアプローチを提供することで、GitLabは世界中の開発者にとって価値あるアクセス可能なツールとなっています。 この記事は GitLab Introduces Duo Chat: A Conversational AI…

「あなたに適した量子化メソッドはどれですか?(GPTQ vs. GGUF vs. AWQ)」

昨年を通じて、私たちは大規模言語モデル(LLM)のワイルドウエストを目にしました新しいテクノロジーやモデルがどんどんリリースされていくスピードは驚くべきものでした!その結果、私たちはさまざまなものを持っています...

「医療における説明可能なAIの実装の重要性」

健康管理システムはAIを導入しており、患者や医療関係者はその詳細な仕組みを知りたがっています説明可能なAIが、高い要求がある現代社会において、技術との健康的で信頼性のある関係性を築きながら、必要な医療ケアを迅速に進めるための解決策となるかもしれません説明可能なAIとは何でしょうか?説明可能なAIは…

「NvidiaのH200 GPUは、AI技術における里程標です」

人工知能とコンピューティングの大きな進歩として、NvidiaがH200 GPUを発表し、生成AIの新たな時代を切り拓いていますこの最先端のグラフィックス処理ユニットは、その前身であるH100のアップグレードとして登場し、大いに注目されたOpenAIの高度な大規模言語モデル、GPT-4のトレーニングに重要な役割を果たしました

「Rosalynがオンライン試験の不正行為に立ち向かうためのStableSight AIを公開」

オンライン教育における学術的不正行為の複雑さが増す中、RosalynはStableSightを導入し、オンライン試験中の生成AIと組織化された不正行為に対抗するために開発された高度なAIシステムを提供しています。プロフェッショナルな資格の需要の増加は、認定された従業員と非認定された従業員の賃金格差によって引き起こされていますが、これによりオンラインテスト環境での堅固な反不正対策の必要性が高まっています。革新的な機能と積極的なアプローチを備えたStableSightは、公正さ、正確さ、受験者の権利を重視しながら、この問題に対処することを目指しています。 StableSightは従来の反不正対策を超えた包括的なAIベースのソリューションです。目線追跡モデルにより、試験中に不正行為を試みる個人がよく利用する副画面の検出が可能です。キーボード相関モデルにより、キーボードの音響分析を通じて入力されるテキストを予測し、隠されたデバイスを不正目的で使用する試みを阻止します。このプラットフォームのアプローチには、不正行為の疑われるケースを特定し、人間のレビュアーにエスカレートすることが含まれており、受験者の行動評価における公正さと正確さへの取り組みが強調されています。 チームはオンライン教育と試験の変化する状況を強調し、生成AIが不正行為に新たな機会を提供していることや、ネットワーク効果を引き起こす可能性があることを指摘しました。StableSightは従来の不正行為や生成AI、組織化された不正行為の複雑な課題に対処するために、注意深く開発されました。Rosalynは招待制のゲーム化されたポータルを導入し、StableSightに対して20回の録画された試験セッションを通じて不正行為の検出能力をテストする機会を提供しています。 このプラットフォームのAI監督サービスは、米国国防総省、Coursera、Stripe、Nexford大学、Dominican大学、Missouri Baptist大学など、注目すべき組織から認められています。Rosalynは、認定と学位の誠実性と信憑性を維持することに焦点を当てながら、AIによって新しい不正行為方法を検出するための継続的な更新と学習が不可欠であると考えています。 報告されたオンライン試験の不正行為の増加に関して、特にコロナ禍中のオンラインテスト環境において、Rosalynの積極的なアプローチは厳格な反不正対策の需要に合致しています。2022年の学術研究によれば、35%の学部ビジネス学生がオンラインテスト中に不正行為を認めています。Rosalynと言語テストパートナーによる共同研究は、StableSightが受験者の中で不正行為を行っているグループを特定する能力を示しています。 AI監督プラットフォームによって生じる潜在的なバイアスや誤った警告に対する懸念に対応するため、Rosalynはバランスの取れたアプローチを重視しています。StableSightは、高度なアルゴリズムと人間の監督を組み合わせた人工知能との連携を活用し、オンライン不正行為の検出精度を向上させています。この統合により、特定の場合にのみテストシナリオに介入が行われ、受験者に不要な結果が生じることがないようになっています。 リモート監督の需要がますます高まる中、Rosalynはシステムをより透明で使いやすくする必要性を認識しており、受験者のプライバシーと快適さを重視しながら、オンラインテスト体験を向上させ、オンライン資格の誠実さを維持するための調和の取れたエコシステムの確立を目指しています。StableSightはオンライン試験の不正行為に対する戦いで先駆的な解決策として現れ、公正で安全なオンライン教育環境に向けた大きな進歩です。 記事元:Rosalyn Unveils StableSight AI to Combat Rising Online Exam Cheating – MarkTechPost

ワビとトロント大学の研究者が、オートラベリングのためのオブジェクト軌跡を洗練するための効率的なトランスフォーマベースのAIモデル、LabelFormerを紹介しました

現代の自動運転システムでは、交通参加者を認識するためのオブジェクト検出器を訓練するために、広範な手動注釈付きデータセットが頻繁に使用されています。最近、自動的にセンサーデータのラベルを生成する自動ラベリング手法が注目されています。自動ラベリングは、計算コストが人の注釈付けよりも少なく、生成されるラベルが同等の品質である場合、人の注釈付けの費用の一部で非常に大きなデータセットを提供することができます。そうすることで、より正確な認識モデルをこれらの自動ラベリングされたデータセットを使用してトレーニングすることができます。多くの自動運転プラットフォームで主要なセンサーとして使用されているLiDARは、その後に入力として使用されます。さらに、彼らは自動ラベリングがグラウンドトゥルースラベルのコレクションを使用してトレーニングされることがある監督シナリオに焦点を当てています。  この問題設定はオフボードパーセプションとしても知られており、リアルタイムの制約を持たず、オンボードパーセプションとは異なり、将来の観測にアクセスできます。図1に示すように、最も人気のあるモデルは、2つのステップでオフボードパーセプションの問題を解決しています。人の注釈付け手法から着想を得て、「検出してから追跡する」というフレームワークを使用して、最初にオブジェクトとその粗いバウンディングボックストラジェクトリを取得し、各オブジェクトトラックを独立して洗練します。最初のステージの主な目標は、可能な限り多くのオブジェクトをシーンで追跡することであり、高い再現性を得ることを目指しています。一方、第2ステージは、より高品質のバウンディングボックスを生成するためにトラックの洗練に集中しています。彼らは2番目のステップを「トラジェクトリ洗練」と呼び、これが研究の主題です。  図1:2つのステップで行われる自動ラベリングのパラダイム。最初のステップでは、検出してから追跡する方法を使用して粗いオブジェクトの軌跡を収集します。それぞれの軌跡は第2のステップで個別に洗練されます。 オブジェクトの遮蔽の管理、範囲が広がるにつれての観測の疎薄さ、およびオブジェクトのさまざまなサイズと運動パターンは、この作業を困難にします。これらの問題に対処するためには、完全なオブジェクトの軌跡の時間的な文脈を効率的かつ効果的に活用できるモデルが設計される必要があります。しかし、現在の技術は、サブ最適なスライディングウィンドウの方法で動的なオブジェクトの軌跡を処理するために設計されているため、十分な時間的文脈を計算予算内に収めるために、制約された時間的文脈で各時間ステップで個別にニューラルネットワークを適用して特徴量を抽出するという方法は不十分です。これはより効率的であり、特徴はいくつかの重複するウィンドウで同じフレームから繰り返し取得されるためです。したがって、これらの構造は計算予算内にとどまるために比較的少ない時間的文脈を活用します。  さらに、以前の試みでは、複雑なパイプラインを使用して複数の異なるネットワーク(例:静的オブジェクトと動的オブジェクトの異なる処理への適用)を扱う必要があり、これは構築、デバッグ、およびメンテナンスが困難です。異なるアプローチをとることで、Waabiとトロント大学の研究者は、この論文でLabelFormerを提供し、簡単で効果的かつ経済的なトラジェクトリ洗練技術を提供しています。彼らは完全な時間環境を利用してより正確なバウンディングボックスを生成します。さらに、彼らのソリューションは計算効率において現在のウィンドウベースのアプローチよりも優れており、人の注釈付けに対して自動ラベリングには明確な優位性を提供します。このために、彼らは、初期のバウンディングボックスパラメータと各時間ステップのLiDAR観測を個別にエンコードした後、セルフアテンションブロックを使用したトランスフォーマーベースのアーキテクチャを作成します。  彼らのアプローチは、完全な軌跡を1回のショットで洗練することにより、不必要な演算を排除し、推論中に追跡される各アイテムごとに1回しか使用する必要がありません。また、彼らの設計は以前の方法よりもはるかに簡単であり、静的および動的なオブジェクトを簡単に処理します。彼らのハイウェイと都市のデータセットに対する包括的な実験評価によって、彼らの方法はウィンドウベースの方法よりも速く、より高いパフォーマンスを提供することが示されています。彼らはまた、LabelFormerがより正確な検出を提供するために人間のデータ単独または他のオートラベラーと比較してより大きなデータセットを自動的にラベル付けできることを示しています。

「Amazon Personalizeを使用してリアルタイムで個別のおすすめを実施しましょう」

基本的には、機械学習(ML)技術はデータから学習し、予測を行いますビジネスは、MLによる個別化サービスを活用して顧客体験を向上させるためにデータを利用しますこのアプローチにより、ビジネスはデータを活用して実行可能な洞察を導き、収益とブランドロイヤリティの成長を支援することができますAmazon PersonalizeはMLを用いたデジタルトランスフォーメーションを加速させます...

セレブラスとG42が4エクサフロップのAIスーパーコンピュータで新たな地平を切り拓く:8エクサフロップへの道を開拓

技術が驚異的な速さで進化する中、Cerebras SystemsとG42は人工知能の世界において大きな飛躍を遂げました。画期的なパートナーシップのもと、彼らは成功裏に4エクザフロップのAIスーパーコンピューターを完成し、前例のない計算能力を目指す旅路における重要なマイルストーンを築きました。この成果はまた、驚異的な8エクザフロップに到達する壮大な旅路のはじまりを意味します。 エクザフロップの力を解き放つ:AIのマイルストーン 人工知能と高性能計算の世界は絶えず進化しており、研究者やエンジニアは可能な限りの領域を追求し続けています。CerebrasとG42はこの競争において先頭に立ち、4エクザフロップのAIスーパーコンピューターを完成させることでその技術力を見せつけました。この成果は彼らの革新への取り組みと人工知能の分野を前進させるための献身の証です。 8エクザフロップへの道:壮大な野望 この成果がさらに注目される理由は、それがCerebrasとG42にとって終わりではなく、より野心的な旅路の始まりであることです。成功した4エクザフロップスーパーコンピューターの完成により、彼らは目を向けている驚異的な8エクザフロップの目標を設定しました。この追求は、かつて想像もできなかった新たな可能性を開き、AI研究の限界を再定義することを約束します。 AI研究とその先への影響 この成果の影響は広範囲にわたります。人工知能が医療から金融、自動運転車など、さまざまな産業においてますます重要な役割を果たす中、このような巨大な計算能力にアクセスできることはゲームチェンジャーです。研究者は前例のない規模で複雑な問題に取り組むことができ、それによって社会全体に利益をもたらすAIアプリケーションの突破口を得ることができます。 協力とイノベーション CerebrasとG42の成功は、テック業界における協力とイノベーションの重要性を示しています。これら2つの企業がリソースと専門知識を結集し、かつて不可能と思われていたことを達成したのです。このパートナーシップは、優れたマインドが最も困難な問題に取り組むために一緒になるときに何が達成されるかというインスピレーションのある例となっています。 AIへの明るい未来 将来を見据えると、AIの世界はさらなる進歩を遂げる準備が整っていることは明らかです。CerebrasとG42の成果は、人間の創造力と卓越性の執念の信じられないほどの可能性を証明しています。彼らが8エクザフロップに向けて目を向けていることで、我々はAIの分野で待ち受けている画期的な発見と革新を想像することしかできません。 まとめると、CerebrasとG42による4エクザフロップのAIスーパーコンピューターの完成は、人工知能の世界における歴史的な瞬間です。これは8エクザフロップを目指す興奮の旅路のはじまりであり、AI研究とイノベーションの新たな時代を切り開くものです。テックの世界は、これら2つのビジョンある会社がAIの分野で可能性の領域をどれほど広げることができるかを期待しながら注視しています。 この記事はCerebrasとG42が4エクザフロップのAIスーパーコンピューターで新たな道を切り開く: 8エクザフロップへの道を築くというタイトルで、MarkTechPostに掲載されています。

「AIの利用者と小規模事業者を保護するための法的措置を講じる」

「今日、私たちは2つの詐欺グループに対して法的措置を取る予定です」

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us