Learn more about Search Results 同期 - Page 4
- You may be interested
- バイツからバイオロジーへ 第1回 コンピュ...
- ティーンエイジャーたちはAIのリテラシー...
- LangChainによるAIの変革:テキストデータ...
- NVIDIAリサーチがCVPRで自律走行チャレン...
- コンテナの力を解放する:あらゆる開発ニ...
- 「5つの簡単なステップでCSVから完全な分...
- スキーラーンチュートリアル:モジュール1
- マルチモーダル医療AI
- 昇進しました! (Shōshin shimashita!)
- Amazon TranslateのActive Custom Transla...
- 役に立つセンサーがAI in a Boxを立ち上げる
- 「完璧なPythonデータ可視化のためのAIプ...
- ‘LLMがデータアナリストを置き換えること...
- 「ガードレールを使用して安全で信頼性の...
- ビッグテックはおそらくAI政策を米国で決...
「パーソナリティをピクセルにもたらす、Inworldは自己再生AIを使用してゲームキャラクターをレベルアップさせます」
ゲーム体験を一層向上させるために、スタジオと開発者は非常な努力を払い、写実的で没入感のあるゲーム内環境を作り上げています。 しかし、非プレイヤーキャラクター(NPC)はしばしば取り残されています。多くのNPCは深さやリアリズムに欠けた方法で行動し、その相互作用は繰り返しがちで忘れられやすいものとなっています。 Inworld AI は、生成AI を使用して、プレイヤーの行動に動的かつ応答性のあるNPCの振る舞いを実現することで、ゲームのルールを変えています。このカリフォルニア州マウンテンビューを拠点とするスタートアップのCharacter Engine は、どんなキャラクターデザインにも使用でき、スタジオと開発者がゲームプレイを向上させ、プレイヤーのエンゲージメントを高めるお手伝いをしています。 ゲーミング体験を高める:アチーブメント解除 Inworldのチームは、AIを搭載したNPCを開発することを目指しており、高品質のパフォーマンスを提供しながら、ゲーム内の没入感を保ちながらプレイヤーとの関係を築き上げることができるようにしています。 開発者がAIベースのNPCをゲームに統合しやすくするために、InworldはCharacter Engineを構築しました。このエンジンは、NVIDIAの技術上で動作する生成AIを使用して、没入感のあるインタラクティブなキャラクターを作り出すことができます。これは、プロダクションに対応したスケーラブルなソリューションであり、リアルタイムな体験に最適化されています。 Character Engine は、Character Brain、Contextual Mesh、Real-Time AI の3つのレイヤーから成り立っています。 Character Brain は、テキスト読み上げや自動音声認識、感情、ジェスチャー、アニメーションなどの複数のパーソナリティ 機械学習 モデルに同期することで、キャラクターのパフォーマンスを制御します。…
クラウドソーシングされたフィードバックは、ロボットの訓練に役立ちます
「強化学習アプローチは、非専門家のユーザーからのクラウドソーシングされたフィードバックを使用してロボットをトレーニングします」
関係データベースとその応用についての深い探求
今日では、さまざまな頻繁に関連のないカテゴリに膨大な量のデータを記憶する必要性が、高い効率のデータベースの重要な意義を強調しています。データベースは、迅速なアクセス、操作、分析を可能にするために、注意深く整理、構造化、保存されたデータのコレクションです。データベースは、データウェアハウジングやオンライントランザクション処理など、さまざまなタスクに役立ち、在庫記録、顧客情報、財務記録などのデータの種類をサポートしています。 リレーショナルデータベースとは何ですか? リレーショナルデータベースは、基本的にはテーブル形式で行と列にデータが整然と構造化されたセットです。このパラダイムでは、テーブルを使用してデータを記述し、各行が特定のレコードを示し、各列が特定のプロパティまたはフィールドを定義します。 基本的には、予め定義された関係を持つデータオブジェクトのセットがリレーショナルデータベースを構成します。テーブルの列は、各々が特定のタイプのデータを含み、フィールドは属性の実際の値を含んでいます。テーブルの行は、単一のアイテムやエンティティの関連する値のグループを表します。テーブル内の各行を識別するために一意の識別子である主キーが使用されます。外部キーは、異なるテーブルの行の関係を確立するために使用されます。 リレーショナルデータベースの例 子供の夏キャンプのデータでは、テーブル内の各行が個別のキャンパーを表し、彼らの名前、年齢、参加しているアクティビティ、および一意のID番号などの情報が含まれています。 ID Name Age Activity 1 John 11 Pottery 2 Courtney 16 Photography 3 Matt 14 Cooking 4 Jasmine…
マイクロソフトとジョージア工科大学の研究者が、ヘッドウォーンデバイスを使用した多様な舌ジェスチャー認識技術「TongueTap」を紹介しました
スマートウェアラブルテクノロジーの急速な発展において、スムーズで手を使わず誰もが使えるインタラクションを追求するといくつか画期的な発見がありました。TongueTapは、舌のジェスチャー認識を可能にするために複数のデータストリームを同期させる技術であり、非常に有望です。この方法により、ユーザーは手や目を使わずに静かにインタラクションを行い、通常は口の内側または近くに配置される特別なインターフェースなしで操作することができます。 ジョージア工科大学の研究者は、Microsoft Researchとの共同研究により、TongueTapという舌のジェスチャーインターフェースを開発しました。このインターフェースは、Muse 2とReverb G2 OEの2つの商用ヘッドセットのセンサーを組み合わせて作成されました。両方のヘッドセットにはIMUsと光電プレソモグラフィ(PPG)センサーが含まれています。また、そのうちの1つのヘッドセットには脳波測定(EEG)、視線追跡、および頭部追跡センサーも搭載されています。これらの2つのヘッドセットからのデータは、多様な脳-コンピュータインターフェースに一般的に使用される時刻同期システムであるLab Streaming Layer(LSL)を使用して同期されました。 研究チームは、EEG信号に対してSciPyを使用して128Hzのローパスフィルターを適用し、独立成分分析(ICA)を実施しました。他のセンサーには、それぞれのセンサーごとに主成分分析(PCA)を適用しました。ジェスチャー認識には、Scikit-LearnのSupport Vector Machine(SVM)を使用し、放射基底関数(RBF)カーネルを使用してハイパーパラメータC=100およびgamma=1でバイナリ分類を行い、データウィンドウがジェスチャーを含んでいるかどうかまたはノンジェスチャーであるかを判定しました。 研究者は16人の参加者を対象に舌のジェスチャー認識の評価のために大規模なデータセットを収集しました。研究から最も興味深い結果は、どのセンサーが舌のジェスチャーの分類に最も効果的であったかです。MuseのIMUは単独でも80%の精度を達成し、MuseのIMUを含む多様なPPGセンサーの組み合わせは94%の精度を達成しました。 最も精度が高いセンサーに基づいて、耳の後ろにあるIMUは舌のジェスチャーを検出するための低コストな手法であり、これまでの口内感覚アプローチと組み合わせることができます。舌のジェスチャーを製品に対して実用的にするためには、信頼性のあるユーザー非依存の分類モデルが重要です。より現実的な環境にジェスチャーが応用できるようにするには、複数のセッションや環境間の移動を含むエコロジカルに妥当な研究デザインが必要です。 TongueTapは、スムーズで直感的なウェアラブルデバイスのインタラクションへの大きな進歩です。市販の技術を使用して舌のジェスチャーを識別し分類する能力により、秘密のような正確なヘッドウェアデバイスの制御が可能になる未来が見えます。舌のジェスチャーを制御するための最も有望な応用は、ARインターフェースの制御です。研究者は、ARヘッドセットでの使用や他の視線ベースのインタラクションとの比較を行いながら、さらなる研究によってこの多機能な相互作用を探求する予定です。
Google DeepMindの研究者がDiLoCoを導入:効果的かつ強靭な大規模言語モデルのトレーニングのための新しい分散型、低通信マシンラーニングアルゴリズム
現実世界のアプリケーションにおける言語モデルのソアリング能力は、標準的なバックプロパゲーションのような従来の方法を使用しての大規模トレーニングに関連する複雑な課題によってしばしば制約されます。Google DeepMindの最新のブレークスルーであるDiLoCo(Distributed Low-Communication)は、言語モデルの最適化において新たな基準を設定します。研究チームの論文「DiLoCo:分散低通信言語モデルのトレーニング」では、革新的な分散最適化アルゴリズムを紹介し、緩く接続されたデバイスのクラスタ上で操作することで、驚異的なパフォーマンス向上と通信の500倍の削減を実現しています。 Federated Learningの原則に触発され、研究者たちは広く認識されたFederated Averaging(FedAvg)アルゴリズムの変種を考案し、FedOptアルゴリズムに似た要素を注入しました。DiLoCoは内部最適化手法としてAdamWを戦略的に取り入れ、外側の最適化手法としてNesterov Momentumを活用し、従来のトレーニングパラダイムに内在する課題に立ち向かう巧妙な融合を実現しています。 DiLoCoの輝きは、3つの基本的な柱にあります: 1. 限られた共有位置の要件:各ワーカーは共有位置のデバイスを必要としますが、必要な総数は著しく小さく、物流の複雑さが軽減されます。 2. 通信頻度の削減:ワーカーはすべてのステップで通信する必要はなく、𝐻ステップごとに同期するだけで、通信オーバーヘッドを数百または数千に大幅に削減します。 3. デバイスの異質性:クラスタ内のデバイスは同一である必要がありますが、DiLoCoは異なるクラスタが異なるデバイスタイプを使用して運用できる柔軟性を提供します。 DiLoCoのトレーニングプロセスは、事前トレーニングされたモデル𝜃(0)を複数回複製することで行われます。各ワーカーは独自のデータシャードでモデルのレプリカを独立してトレーニングし、𝐻ステップ後に外部グラデーションを平均化し、外部最適化手法がグローバルパラメータコピー𝜃(1)を更新し、それがワーカーに配布されます。このサイクルは𝑇回繰り返され、各レプリカのトレーニングは異なるグローバル位置で異なるアクセラレータを使用して行われます。 C4データセットを用いた実験では、8つのワーカーを使用したDiLoCoは、通信を驚異的な500倍削減し、完全同期最適化と同等のパフォーマンスを達成します。さらに、DiLoCoはワーカー間のデータ分布の変動に対して非常に強い耐性を示し、トレーニング中にリソースの可用性の変化にシームレスに適応します。 要するに、DiLoCoは複数の接続が弱いマシン上でトランスフォーマー言語モデルのトレーニングを分散するための堅牢で革新的な解決策として浮上しています。この画期的なアプローチは、インフラの課題だけでなく、卓越したパフォーマンスと適応性を示し、言語モデルの最適化において大きな飛躍をもたらします。 この投稿は、Google DeepMind Researchers Introduce DiLoCo: A Novel…
dbtコア、Snowflake、およびGitHub Actions データエンジニアのための個人のプロジェクト
これは、Data/Analyticsエンジニア向けの簡単で高速なプロジェクトですdbt Core、Snowflake、Fivetran、およびGitHub Actionsなどの最新のデータスタックツールを試してみたい方にお勧めですハンズオン形式で行います...
「Daskデータフレームのパーティションサイズについて知りたいことのほとんどすべて」
最近、私と同僚は、高負荷の大規模なサービスに取り組んでおり、Xgboost機械学習モデルと分散データ処理と予測のためのツールとしてDaskを使用しています…
「Amazon SageMakerを使用して数百のモデルにスケールされたファウンデーションモデルの推論 – パート1」
「ファンデーションモデル(FM)の民主化が一般化し、AIを活用したサービスへの需要が増加するにつれ、ソフトウェアプロバイダーは、組織内のデータ科学者および外部の顧客を対象にしたマルチテナントをサポートする機械学習(ML)プラットフォームを利用しようとしていますますます多くの企業が、ファンデーションモデルの利用価値に気付き始めています...」
ダックAIは、DuckTrackを紹介します:マルチモーダルコンピュータインタラクションデータコレクター
ユーザーの相互作用の正確で精密なトラッキングは、コンピューターエージェントの機能を進化させる上で重要な基盤となります。このタスクは、インテリジェントシステムの開発とトレーニングにおいて中心的な役割を果たしています。認知プロセスを模倣し、独立して業務を実行することを目的としたこれらのシステムの効果は、ユーザーの相互作用の慎重な調査と体系的な記録に依存しています。 ダックAIの研究者は、コンピューターエージェントが収集されたデータに適切に訓練されるように、さまざまな入力を正確に記録するためのDuckTrackを開発しました。DuckTrackは、主要なオペレーティングシステムと互換性のある使いやすいデスクトップアプリを通じて、マウス、キーボード、画面のビデオ、および音声データを同期して収集します。 さらに、DuckTrackはコミュニティデータ収集イニシアチブを開始しました。 このオープンソースの取り組みでは、さまざまなコンピューターの相互作用データの収集に参加する貢献者を募集しています。 DuckTrackは、すべての主要なオペレーティングシステムでスムーズに動作し、Pythonで作成されています。 DuckTrackの機能概要には、マウスおよびキーボードアクションの正確で精密な記録と再生の能力が示されています。 リサーチャーは、画面の録画をOBSと統合することで、その汎用性をさらに向上させると述べています。 DeepTruckでは、描画タスクにおいて構造的類似性指数(SSIM)は常に0.9を超えています。各イベントは、市場に存在する既存のトラッカーよりも低い誤差範囲で0.03ms ± 0.4msで記録されています。 DuckTrackは、パフォーマンスメトリックにおいて卓越したコミットメントを示しており、最高のトラッキングおよび再生ソリューションを求めるユーザーにとって信頼性のある選択肢となっています。 しかし、DuckTrackにも一定の制限があります。再生時にダブルクリックやトリプルクリックをリアルに再現することは現実的には難しく、これらのアクションの正確性に影響を与えます。さらに、DuckTrackはトラックパッドのジェスチャーを記録することができず、ゲームなどの生の情報を含むシナリオで入力をキャプチャする際に制限があります。 開発者たちは、これらの制限に対処し、コミュニティとの関与を継続することでDuckTrackの能力を向上させるために積極的に取り組んでいます。 リサーチャーは、M2 Pro MBP 14(macOS Sonoma 14.0を実行)、Intel i7-10510U System76 Lemur Pro 9(PopOS!…
「サーモン 大規模な言語モデルのための一般的な聴覚能力へ」
聞くことは、一般的な音声情報の感知と理解を含むため、AIエージェントにとって現実世界の環境では重要ですこの音声情報は、音楽、オーディオイベント、および音声の3つの主要な音声タイプを包括しています最近、テキストベースの大規模言語モデル(LLM)フレームワークは、自然言語処理(NLP)のさまざまな分野で人間レベルのパフォーマンスを達成するなど、注目すべき能力を示してきました
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.