Learn more about Search Results A - Page 332

UCバークレーの研究者が、Neural Radiance Field(NeRF)の開発に利用できるPythonフレームワーク「Nerfstudio」を紹介しました

アイアンマンのファンは誰もいないでしょう?彼は自分の研究室で働いているときに本当にクールに見えます。彼が使っているホログラムや新しいガジェットは彼をクールに見せます。2Dの写真からこのような3Dのナビゲーション可能なシーン(ホログラムのようなもの)を作成することは可能でしょうか?UCバークレーの研究者たちは、Neural Radiance Fields(NeRF)という技術を使ってそれを実現しました。バークレーの他の研究者たちは、NeRFプロジェクトを加速させてよりアクセスしやすくするための開発フレームワークも作成しました。 コンピュータビジョン、グラフィックス、ロボット工学の幅広い応用のため、NeRFの開発は急速に進展しています。バークレーの研究者たちは、NeRFベースの手法をさまざまなプロジェクトで実装するためのプラグアンドプレイのコンポーネントを含むモジュラーなPyTorchフレームワークを提案しています。彼らのモジュラーデザインは、リアルタイムの可視化ツールやビデオ、ポイントクラウド、メッシュ表現へのエクスポートツールもサポートしています。 NeRFの急速な発展により、多くの研究論文が公開されていますが、コードの統合が不足しているため、その進捗状況を追跡することは困難です。多くの論文は自分自身の孤立したリポジトリで機能を実装しており、それがさまざまな実装間での機能と研究貢献の転送プロセスを複雑にしています。この問題を解決するため、バークレーの研究者たちは、Nerfstudiosとして統合されたNeRFの革新を提案しています。Nerfstudiosの主な目標は、さまざまなNeRFの技術を再利用可能なモジュラーコンポーネントにまとめ、豊富な制御スイートを備えたNeRFシーンのリアルタイム可視化を実現することです。これにより、ユーザーがキャプチャしたデータから簡単にNeRFを作成するための使いやすいワークフローが提供されます。 Nerfstudiosは、トレーニングやテスト中に任意のモデルと連携して作業するためのリアルタイムビジュアライザーをウェブ上でホストしています。これにより、ローカルのGPUマシンを必要とせずにアクセスすることができます。これはまた、Polycam、Record3D、KIRI Engineなどのさまざまなカメラタイプとモバイルアプリケーションからクリックされた異なるイメージもサポートしています。 Nerfstudiosのリアルタイム可視化インターフェースは、モデルの質的分析に便利です。これにより、手法の開発中により情報を持った意思決定が可能になります。キャプチャ軌跡から遠く離れたビューに対して、PSNRと比較して、NeRFはパフォーマンスの包括的な理解を提供します。質的分析は重要です。なぜなら、これにより開発者はモデルのパフォーマンスについてより総合的な理解を得ることができるからです。 課されたイメージに対して、Nerfstudiosは放射輝度、密度、セマンティクス、法線、特徴などの他の量に基づいて3Dシーンを最適化します。これらはデータマネージャーによって入力され、その後モデルによって処理されます。データマネージャーは、DataParserを介してイメージ形式を解析し、RayBundlesとしてレイを生成します。これらのRay Bundlesは、フィールドをクエリし、量をレンダリングするためのモデルに入力されます。 研究者の将来の課題には、より適切な評価基準の開発や、コンピュータビジョン、コンピュータグラフィックス、機械学習などの他の分野とのフレームワークの統合が含まれます。NeRFベースの手法の開発は、ニューラルレンダリングコミュニティの進歩を加速させています。

「Med-PaLM Multimodal(Med-PaLM M)をご紹介します:柔軟にエンコードし、解釈するバイオメディカルデータの大規模なマルチモーダル生成モデル」

大規模言語モデル(LLM)は、医療、金融、教育、ソーシャルメディアなど、ほとんどの領域で進化しています。医療業界の臨床医は、高品質なケアを提供するためにさまざまなデータソースに頼っています。このカテゴリの情報には、臨床ノート、検査結果、バイタルサインと観察、医療写真、およびゲノミクスデータなどのモダリティが含まれます。バイオメディカル人工知能(AI)の分野では、常に進歩がありますが、現在使用されているAIモデルの大部分は、単一のタスクでのみ作業し、単一のモダリティからのデータを分析することに制限されています。 よく知られている基礎モデルは、医学的AIを完全に変革する機会を提供し、これらのモデルは自己監督学習または教師なし学習目的を使用して膨大なデータ量で訓練されるため、コンテキストに基づいた学習またはフューショットファインチューニングを通じて、さまざまな活動や環境に対応するように調整されます。複雑な構造を持つさまざまなモダリティからのデータを理解し、さまざまな医療上の困難に対処するための統合されたバイオメディカルAIシステムが現在開発されています。そのようなモデルは、基礎的なバイオメディカル研究から患者の治療に至るまで、あらゆる領域に影響を与えると予想されています。 研究者は、汎用のバイオメディカルAIシステムを作成するために取り組んでいます。Google ResearchとGoogle DeepMindの研究者チームは、このバイオメディカルAIシステムの開発を支援するために、MultiMedBenchという14の異なるバイオメディカル活動から成るユニークなベンチマークを紹介しました。これらの活動は、医学的な質問に答えること、皮膚科および乳房造影画像の分析、放射線学レポートの作成と要約、および遺伝子変異の同定など、さまざまな難易度をカバーしています。 著者らは、Med-PaLM Multimodal(Med-PaLM M)と呼ばれる概念実証を提供しています。これは、臨床言語、医療画像、遺伝子データなど、さまざまな柔軟性レベルで多様な種類のバイオメディカルデータを理解しエンコードできる大規模なマルチモーダル生成モデルです。最先端のモデルと比較して、Med-PaLM MはMultiMedBench評価でカバーされるすべてのタスクで競争力のあるまたはさらに高いパフォーマンスを達成しています。Med-PaLM Mは、専門モデルよりも多くの場合において顕著に優れたパフォーマンスを示しました。 チームはまた、いくつかの特徴的なMed-PaLM Mの能力も共有しています。彼らは、タスク間のポジティブな転移学習や医療概念やタスクへのゼロショット一般化など、モデルの能力を証明しています。このAIシステムは、特に明示的にトレーニングされていない医療状況に関して意思決定ができるゼロショットの医療推論の新たな能力を示しています。これらの励ましの結果にもかかわらず、一般的なバイオメディカルAIシステムが実用的な環境で使用される前に、さらなる作業が必要であるとチームは強調しています。それにもかかわらず、公開された結果は、これらのシステムの大幅な前進を示し、AIを活用した医療ソリューションの将来に期待を抱かせます。 チームは、以下のように貢献をまとめています。 この研究は、広範な生物学的データへのアクセスがトレーニングおよび実用時のパフォーマンスの検証において依然として問題であるが、汎用的なバイオメディカルAIシステムの医学的応用の可能性を示している。 MultiMedBenchは、さまざまなバイオメディカルモダリティをカバーする14の異なるタスクを持つユニークなベンチマークである。タスク固有の修正を必要としない、初のマルチタスキング汎用バイオメディカルAIシステムであるMed-PaLM Mが紹介されている。 このAIシステムは、新しい医療概念への一般化やゼロショットの医療推論など、新たな能力を示している。 Med-PaLM Mの出力についての人間のレビューにより、胸部X線報告書の作成など、臨床的な有用性が示されている。 平均的なミスが少ないため、放射線科医は最大40.50%のケースでMed-PaLM Mの報告書を放射線科医の報告書よりも好む。

「ジェネレーティブAIの企業導入」

「こんにちは、私はマイケルです2018年からエンタープライズAIの導入に没頭しており、私たちはAi4というAIカンファレンスを開始しました数年間に渡り、私たちの年次カンファレンスは300人規模のイベントから...」

「新しいHADARベースのイメージングツールにより、暗闇でもクリアに見ることができます」

ロボットや自律型車両が最も暗い夜でも容易に移動できる世界を想像してみてください。それは熱シグナルを知覚するAIによって駆動される先進的なカメラにのみ依存することができます。この未来的なビジョンは、HADAR(Heat-Assisted Detection and Ranging)と呼ばれる革新的な技術のおかげで現実に近づいています。パデュー大学とミシガン州立大学の研究チームによって開発されたHADARは、機械が周囲を知覚する方法を革新し、さまざまな産業において刺激的な可能性を開く能力を持っています。HADARの世界に飛び込んで、AIシステムとの相互作用方法を探ってみましょう。 また読む:Red Cat & Athena AIによる夜間視野を持つ知的軍用ドローン 熱視覚の課題 熱視覚はSF映画の定番ですが、常に環境中で熱放射が拡散する方法による制約に直面してきました。この現象は、ぼやけたテクスチャのない映像、いわゆる「ゴースティング」を引き起こします。しかし、研究チームはこの持続的な問題に取り組むために機械学習アルゴリズムを採用することで、驚くべき突破を遂げました。 AIによる熱シグナルの解読 人工知能の力を使って、研究者たちは商用赤外線カメラによってキャプチャされたデータを解釈するためにHADARを訓練しました。HADARは今や物体の物理的特性や周囲の状況を正確に判断し、霧、煙、暗闇のような視覚の障害を切り抜けることができます。温度、材料組成、熱放射パターンを識別することにより、HADARは環境条件に関係なく詳細で明確な画像を作成します。 ギャップの埋め合わせ:夜間の昼間の明瞭さ HADARのユニークなアプローチは、音響、レーダー、LiDARなどのアクティブモダリティとは異なり、信号を送信し反射を検出してオブジェクトの存在と距離を推測するものです。これらの方法とは異なり、HADARは目に見えない赤外線放射を使用して夜間のシーンを昼間のような明瞭さで再構成します。この突破は、自動運転車からタッチレスのセキュリティスクリーニングまで、さまざまな産業を革新する可能性があります。 また読む:Jeepの次世代AI&自律型オフロードドライビングテクノロジーで未来に向かって進む 前途多難:課題の克服 HADARは非常に有望な技術ですが、課題も存在します。この技術は高価で、リアルタイムのキャリブレーションが必要であり、精度に影響を及ぼす環境的な障壁にも依然として弱いです。しかし、研究者たちはこれらの障壁が近い将来克服できると楽観的です。これにより、HADARが日常的に使用されるようになります。 また読む:AIが自動車産業を変革している方法は? HADARと共に明るい未来 HADARの潜在的な応用範囲は広範で興奮を持って迎えられます。この技術が進化するにつれて、自動運転車、自律型ロボット、セキュリティスクリーニングなどのAIシステムの必須コンポーネントになる可能性があります。最も暗い夜でも明瞭に「見る」ことができるようにすることで、HADARは産業を変革し、安全性を向上させ、よりつながりのある知能化された世界への道を切り拓くことができます。 また読む:Didi Neuron:未来的な無人ロボタクシー 私たちの意見…

中国のこのAI論文は、HQTrackというビデオ内のあらゆるものを高品質で追跡するためのAIフレームワークを提案しています

ビジュアルオブジェクトトラッキングは、ロボットビジョンや自動運転など、コンピュータビジョン内の多くのサブフィールドの基盤です。この仕事は、ビデオシーケンス内のターゲットオブジェクトを信頼性を持って特定することを目指しています。最先端のアルゴリズムがビジュアルオブジェクトトラッキング(VOT)のチャレンジで競い合っており、トラッキングフィールドで最も重要な競技の1つです。 ビジュアルオブジェクトトラッキングおよびセグメンテーション競技(VOTS2023)は、従来のVOTチャレンジで課せられた制約の一部を取り除き、参加者がオブジェクトトラッキングについてより広く考えることができるようにしています。その結果、VOTS2023では、単一のターゲットの短期および長期のモニタリング、および多数のターゲットの追跡を、位置指定としてターゲットセグメンテーションのみを使用して組み合わせています。これには、正確なマスクの推定、複数のターゲットの軌跡追跡、およびオブジェクト間の関係の認識など、新たな困難が生じます。 中国の大連理工大学とアリババグループのDAMOアカデミーによる新しい研究では、HQTrackと呼ばれるシステムが紹介されています。HQTrackは、High-Quality Trackingの略です。このシステムは、主にビデオマルチオブジェクトセグメンターやマスクリファイナーなどで構成されています。複雑な設定で微小なオブジェクトを認識するために、研究者はDeAOTの改良版であるVMOSを使用し、1/8スケールでゲート付き伝搬モジュール(GPM)を連鎖させます。さらに、異なるタイプのオブジェクトを区別する能力を向上させるために、フィーチャーエクストラクタとしてIntern-Tを使用しています。VMOSでは、研究者は長期記憶に最近使用されたフレームのみを保持し、古いフレームは破棄してスペースを作ります。ただし、トラッキングマスクを改善するために大規模なセグメンテーションモデルを適用することは有用です。複雑な構造を持つオブジェクトは、特にSAMにとって予測が難しく、VOTSチャレンジでは頻繁に現れます。 事前にトレーニングされたHQ-SAMモデルを使用することで、チームはトラッキングマスクの品質をさらに向上させることができます。最終的なトラッキング結果は、VMOSとMRから選ばれ、予測されたマスクの外側の囲むボックスをボックスプロンプトとして使用して、オリジナルの画像とともにHQ-SAMに供給され、改善されたマスクを取得します。HQTrackは、テストセットで品質スコア0.615でVOTS2023競技会で2位になります。

『Stack OverflowがOverflowをリリース:開発者コミュニティとAIの統合』

Stack Overflow(スタック・オーバーフロー)は、問題解決と知識を求める開発者のための名高いプラットフォームであり、新しいロードマップを発表することで画期的な一歩を踏み出し、生成型AIの統合による新たな時代を迎えます。OverflowAIという名前のこのビジョナリーなイニシアチブは、プラットフォームの機能を向上させ、検索機能を改善し、世界中の開発者にとってシームレスな体験を提供することを約束しています。 この革新的な取り組みの基盤となるのは、従来の語彙的な検索方法からのパワフルなアップグレードであるセマンティック検索です。Stack Overflowは、ベクトルデータベースの潜在能力を活用することで、ユーザーのクエリによりインテリジェントな応答を提供し、それらを彼らの研究トピックと正確に一致させることを目指しています。目標は、信頼性と正確性に重点を置いた、まさに会話形式のヒューマンセントリックな検索体験を作り出すことであり、GenAIの力で問題の解決策に瞬時にアクセスできるようにすることです。このアプローチの特徴は、貢献者の努力が認識され、報酬が与えられることに対する断固たる焦点です。 OverflowAIの利点は、同様の強化された検索機能がStack Overflow for Teamsに統合されることによって、公共プラットフォームを超えて広がります。これにより、お客様はStack Overflow for Teams、公共プラットフォーム、Confluence、GitHubなどの知識リポジトリを活用しながら、迅速に関連する回答を見つけることができます。 OverflowAIの最も興奮する要素の1つは、Stack Overflow for Teams向けの「エンタープライズナレッジインジェスチョン」の導入です。この画期的な機能により、ユーザーは既存の正確で信頼性の高いコンテンツを活用して、わずか数分で包括的なナレッジベースを構築することができます。AIと機械学習アルゴリズムを利用して、システムは初期のタグ付け構造を作成し、チームの最も頻繁な問い合わせ領域に基づいて関連する質問と回答を推奨します。このAIパワードプロセスにより、Stack Overflowコミュニティを効率的に始めることができ、開発者は正確性と関連性を確保するためにコンテンツのキュレーションと改善に集中できます。投票、編集、コメント、ビューなどの品質と正確性の指標により、すべての知識は内部コミュニティ内で発見可能で再利用可能であり、価値ある情報の活気ある拠点を創り出します。 アクセシビリティをさらに向上させるために、Stack OverflowはStack Overflow for Teamsのナレッジベースをその新しいチャットボットStackPlusOneに統合し、Slackとシームレスに連携させています。この巧妙な統合により、最も技術的な課題に対する解決策に瞬時にアクセスでき、TeamsのインスタンスとStack Overflowの公共プラットフォームのコミュニティが検証したソースからの情報を引き出すことができます。GenAIは会話形式で応答を提供し、技術的に少なくともない組織のメンバーでも情報を簡単に理解できるようにします。 AIをプラットフォームに統合するだけにとどまらず、Stack OverflowはAIを中心とした知識共有コミュニティの育成にも積極的に取り組んでいます。GenAI…

Scikit-Learnのパイプラインを使用して、機械学習モデルのトレーニングと予測を自動化する

Scikit-Learnのパイプラインは、機械学習のライフサイクル(主にデータの前処理、モデルの作成、テストデータでの予測)で複数の操作をつなぐために使用されますこれにより、時間と労力を節約することができます...

「NYUとMeta AIの研究者は、ユーザーと展開されたモデルの間の自然な対話から学習し、追加の注釈なしで社会的な対話エージェントの改善を研究しています」

ヒューマンインプットは、社会的な対話モデルを改善するための重要な戦術です。ヒューマンフィードバックを用いた強化学習では、満足な報酬関数を保証するために多くのヒューマンアノテーションが必要とされており、フィードバックからの学習には非常な改善が見られています。フィードバックの源は、対話ターンや対話エピソードについてのユーザーからの数値スコア、ランキング、自然言語のコメント、およびボットターンのバイナリ評価などが含まれます。ほとんどの研究では、これらの信号をクラウドワーカーを利用して意図的に収集しています。なぜなら、一般のユーザーはそうすることを避けたいか、もしそうする場合には正確な情報を提供しないかもしれないからです。 この研究では、ニューヨーク大学とMeta AIの研究者が、モデルと有機的なユーザー間の実際の議論を特徴とする多くの展開時対話エピソードを持っている状況を考慮しています。彼らは、これらの自然なユーザーの議論から何らかの暗黙の指示を得ることができ、それらの信号を対話モデルの向上に利用することができるかどうかを調査しようとしています。これには2つの理由があります。まず第一に、彼らは明示的な注釈を提供しないかもしれませんが、有機的なユーザーは将来の展開のためのデータ分布に最も近いです。第二に、対話の以前のエピソードからの暗黙の信号を使用することで、クラウドソーシングに費やされるお金を節約することができます。 図1: アプローチの概要。人間とロボットの対話から、次のヒューマンターンが長くなるか短くなるか、または喜ばしいかどうかなどの暗黙の信号を得ます。 より具体的には、彼らはチャットボットを調整して、将来のヒューマンの回答の数量、長さ、感情、または反応性などの最適な暗黙のフィードバック信号を使用することができるかどうかを検討しています。彼らは、この問題を調査するためにBlenderBotのオンライン展開から公開された匿名化されたデータを使用しています。このデータを使用して、彼らはサンプルモデルと再ランクモデルをトレーニングし、さまざまな暗黙のフィードバック信号を比較します。彼らの新しいモデルは、自動化された評価と人間の判断の両方を通じて、ベースラインの返信よりも優れていると発見されました。さらに、彼らの暗黙のフィードバック信号が世代の品質の粗いプロキシ指標であるため、これらの指標をサポートすることが望ましくない行動を引き起こすかどうかを尋ねています。 はい、使用される信号によります。特に、議論の長さを最適化すると、モデルが論争的な意見を提供したり、敵意を持ったり攻撃的な態度で返答する可能性があります。一方、好意的な応答やムードを最適化すると、これらの行動がベースラインに比べて減少します。ヒューマンからの暗黙のフィードバックは、全体的なパフォーマンスを向上させることができる有益なトレーニング信号であると結論づけられますが、具体的な手法には重要な行動的な影響があります。

「Scikit-Learnクラスを使用したカスタムトランスフォーマを作成するためのシンプルなアプローチ」

データの前処理はデータサイエンスのライフサイクルで最も重要なステップの一つです非常に人気のある機械学習ライブラリであるScikit-Learnは、私たちをサポートするための多くの定義済みのトランスフォーマーを持っています

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us