Search Results A

NVIDIAのAI研究者は、オブジェクト周囲の狭いバンドにボリューメトリックレンダリングを制限することで、効率的にNeRFレンダリングを行うための人工知能アプローチを提案しています

ナビディアの研究者たちは、体積ベースと表面ベースのレンダリング間で効率的に移行するためのニューラル放射輝度場の定式化を紹介します。この手法は、適応的なシェルを使用して、シーン特性に基づいてレンダリングプロセスを適応させることにより、ニューラル体積表現の周りに明示的なメッシュエンベロープを構築します。このアプローチは、特に1ピクセルあたりの単一サンプルで十分な固体領域で、レンダリング速度を大幅に加速します。提案された手法は実験によって高精度なレンダリングを実証し、アニメーションやシミュレーションなどの下流アプリケーションの可能性を紹介しています。この研究は、効率的なレンダリングのための適応的なシェルを導入することで、ニューラル放射輝度場（NeRF）の定式化であるNeuSを拡張しています。この手法は、学習された空間的に変動するカーネルサイズを利用することで、シーン特性に基づいてレンダリングアプローチを適応させ、必要なサンプル数を大幅に減らしています。NeRFの計算複雑さに対処し、加速戦略を探索し、表面ベースのアプローチとの性能を比較しています。提案された手法は、類似の結果をより高速な推論と共に示し、アニメーションや物理シミュレーションのアプリケーションに適しています。この手法は、リアルタイムで高解像度の新しい視点合成におけるNeRFの計算コストに対処します。明示的なジオメトリとNeRFを組み合わせて、異なるシーン領域に異なるレンダリングスタイルを割り当てる適応的なシェルアプローチを導入します。この手法により、レンダリングに必要なサンプル数が大幅に減少し、知覚的な品質を維持または向上させることができます。目標は、NeRFの効率性を損なうことなく高い視覚的忠実度を向上させ、3Dシーン表現と合成の実用的かつリアルタイムなアプリケーションを可能にすることです。表面周りの明示的なメッシュエンベロープを利用することで、レンダリングに必要なサンプルを減らしながら品質を維持することができます。三角メッシュで表現される提案手法は、外見レンダリングのために重要な領域を示しています。PSNR、LPIPS、SSIM、および光線ごとのピクセルあたりのサンプル数などの評価メトリックを使用して、レンダリングの品質と計算の複雑さに関する洞察を提供しています。このアプローチは、3Dシーンのレンダリングにおいて効率と視覚的な忠実度の向上を示しています。提案された適応的シェルアプローチは、高い忠実度を維持しながら必要なレンダリングサンプルを減らし、アニメーションやシミュレーションなどの下流アプリケーションに適したものです。MipNeRF360データセットを用いたすべてのメトリックで基準を上回る性能を発揮し、DTUデータセットの結果ギャラリーはレンダリングされた画像の品質を示しています。さまざまなメトリックの包括的な使用により、この手法の計算の複雑さと全体的なパフォーマンスについての洞察が提供されます。この研究は、PSNR、LPIPS、SSIMのメトリックにおいてベースラインと同等の性能を実現し、効率を示しています。NeuSと空間的に変動するカーネルサイズを組み合わせることでNeRFのレンダリングを強化します。ニューラルフィールドの出力の事前計算方法を通じてさらなる高速化が示唆されています。薄い構造を捉える限定性が認識され、将来の作業に向けた反復手順が提案されています。この研究は、ニューラル表現と高性能技術の相乗効果により、コンピュータグラフィックスのリアルタイムの進展を想定しています。今後の研究の手法には、再構築の向上とシェルの反復的な適応に関する調査が含まれます。最新のニューラル表現とリアルタイムグラフィックス技術の相乗効果の調査が推奨されています。SDFとグローバルカーネルサイズを使用した表面の精度のさらなる改善、おそらくは正則化を介した方法が提案されています。追加の高速化のために、適応的シェルアプローチを離散グリッド上の事前計算ニューラルフィールド出力と組み合わせることが提案されています。薄い構造の捕捉を改善し、反復手順およびアルゴリズムの進展によってアーティファクトを減少させることは、将来の研究の課題として確認されています。

アルトマンが帰ってきた：OpenAIのCEOがボードルームの騒動に打ち勝つ

驚くべき展開となって、OpenAIの元CEOであるSam Altmanが、会社を揺るがす乱闘が起きた直後に、その地位を取り戻そうとしている。混乱は金曜日にAltmanが追放されたが、物語に予想外の展開が起きた。取締役会の混乱におけるAltmanの復活 OpenAIの混乱は、元CEOであるSam Altmanが交渉を成功させ、復帰を確保したことで劇的な展開を見せた。内部の不和に苦しむ同社は、Altmanのカムバックのための「原則合意」を明らかにした。新しい取締役会の構成がガバナンスのリセットを示す初期合意の一環として、Bret Taylor、Larry Summers、Adam D’Angeloから成る新しい取締役会が提案された。この臨時の取締役会の主な任務は、最大9人のメンバーからなる形式的な取締役会を審査し任命することである。これにより、OpenAIのガバナンス構造をリセットすることを目指している。リシェイプされたOpenAIにおけるマイクロソフトの役割マイクロソフトが拡大した取締役会に席を確保する可能性から、Altmanの復帰は2つの組織の戦略的パートナーシップを示唆している。AltmanとマイクロソフトのCEOであるSatya Nadellaを含むリシェイプされたリーダーシップは、OpenAIにとって重要な瞬間を強調している。公式発表にもかかわらず、「原則合意」に関する詳細は不明のままである。OpenAIは、その契約条件についての追加コメントを提供しなかったため、Altmanの復帰の複雑さに関する推測の余地が残されている。従業員の反乱と取締役会の脆弱性 Altmanの追放中の前例のない従業員の反乱は、内部の不安を示した。Altmanの解任の明確な説明の不足は、取締役会のメンバーを脆弱にし、重要なメンバーであるIlya SutskeverがAltmanに同調する結果となった。我々の見解この驚くべき企業のサガが終息するにつれて、OpenAIはその旅路において重要な節目に立たされている。Altmanの復帰は期待と不確実性をもたらし、この予想外の展開につながった会社の将来の方向性やダイナミクスについての疑問を呼び起こしている。

このAI研究では、BOFT（Foundationモデルの適応のための新しい一般ファインチューニングAIメソッド）を紹介します

人工知能の分野における最近の進展、特に大規模言語モデルの導入は、ほぼすべての領域でAIの道を開いています。ChatGPTやStable Diffusionなどの基本モデルは、顕著な汎化能力を持っています。しかし、これらのモデルをゼロからトレーニングすることは、パラメータの数の増加のために難しい課題です。モデルの微調整アプローチは、追加の推論遅延を伴わないため簡単です。しかし、従来の微調整技術では、低い学習率を持つために、重み行列の関係情報を最適に維持することが難しいです。研究者は、オーソゴナル微調整（OFT）技術を研究しており、同じ直交行列を使用して同じ層のニューロンを変換することにより、微調整中にニューロン間のペアワイズ角度を維持します。この技術には良い潜在能力がありますが、同じ制限が生じるという問題があります。それは、直交行列の高次元性から生じる訓練可能なパラメータの膨大な数です。この課題に対処するために、研究チームはオーソゴナルバタフライ（BOFT）というパラメータ効率の向上を可能にするユニークな最新の方法を紹介しました。Cooley-Tukey高速フーリエ変換技術におけるバタフライ構造からインスピレーションを受けて、BOFTは多数の因子化スパース行列と組み立てることで密な直交行列を生成します。直交行列をスパース行列の積として表現するためには、計算時間を空間と交換する必要があります。研究チームは、これをグリッド構造のグラフ上の情報伝達問題と比較することで理解できると共有しており、表現力を保ちながら訓練可能なパラメータを制限するさまざまなスパース行列因子化技術を使用することが可能になります。BOFTは、Cooley-Tukeyのバタフライグラフに触発されており、その主な革新はバタフライ因子化プロセスです。この因子化を利用することで、O(log d)のスパース行列の積で密な行列を生成することができます。各スパース行列において直交性を保証することで、BOFTはO(d log d)のパラメータで効率的な直交パラメータ化を実現し、オリジナルのOFTパラメータ化から大幅に削減します。BOFTは一般的な直交微調整フレームワークを提供し、OFTを包括します。研究チームは、OFTのブロック対角構造とBOFTを比較し、効果的な訓練可能なパラメータを削減するためにBOFTとOFTの両方が直交行列にスパース性を追加することを示しました。しかし、ダウンストリームアプリケーションでは、BOFTのバタフライ構造によって、フル直交行列と単位行列の間でよりスムーズな補間が可能な、より小さな仮説クラスが提供されます。この構造的アプローチは、ローラの低ランク構造と比較することで、低ランクとスパース行列の両方がパラメータ効率を達成する構造化アプローチであることを強調するために行われました。研究者たちは、主な貢献を以下のようにまとめています。ダウンストリームタスクのための大規模モデルの適合性を向上させるために、直交微調整のパラメータ効率の問題を研究しました。情報伝達のための新しいフレームワークが紹介され、パラメータ効率の高い密な直交行列の構築の問題がグリッド構造グラフ内の課題として再構成されました。パラメータ効率の高い直交微調整手法であるオーソゴナルバタフライ（BOFT）が紹介されました。 BOFTによる訓練可能なパラメータの劇的な削減を保ちながら、表現力とトレーニング安定性を維持するための行列因子化と理論的な説明が議論されました。 BOFTは、適応アプリケーションにおいて最先端の技術を上回り、その優れたパラメータ効率と汎化能力を示しました。

アニメーションワードクラウドでのデータストーリーテリング’ (Animeshon wādo kuraudo de no data sutooriteringu)

アニメーションされたワードクラウドは、テキストサンプルアイテムの連続したシーケンスであるn-gram（連続した文字列）の絶対的な頻度を時間の経過とともに画像のシーケンスとしてビデオファイルで表示します単語により重要性を与えます...

「このAI研究は微生物学者が細菌を識別するのを助けます」

新しいAI研究がマイクロバイオロジーの研究所での菌叢の同定と解析のための包括的なフレームワークであるDeepColonyを提案しています。このシステムは培養プレートの高解像度デジタルスキャンを使用し、細菌の菌叢の解析と同定のための5つの階層構造を採用しています。レベル0では、DeepColonyは菌叢の位置と量を確定し、重要な空間分布情報を提供します。レベル1では、微生物学者が使用する基準に類似した基準を考慮して、孤立した菌叢を同定します。DeepColonyの核心は、レベル2から4にあります。ここでは、システムが初期の種の同定を行い、同定のランキングを洗練し、全体的なプレートの臨床的意義を評価します。システムのアーキテクチャには、階層構造で組織化された畳み込みニューラルネットワーク（CNN）が含まれます。単一の菌叢同定のためのCNNは、畳み込み層4層と完全接続層1層から構成されています。DeepColonyのユニークなアプローチには、コンテキストに基づく同定が含まれます。同定には、非線形の類似度に基づいた埋め込みが用いられるSiameseニューラルネットワークが使用されます。この埋め込みは、平均シフトクラスタリングと組み合わされ、視覚データに基づいて病原体種の同定を向上させます。この研究で使用されたデータセットには、培養プレートの高解像度デジタルスキャンから得られた菌叢レベルおよびプレートレベルのデータが含まれています。システムの評価は尿培養に焦点を当てて行われ、データセットには多様な範囲の生物が含まれています。 DeepColonyはマイクロバイオロジー研究所の日常業務の効率と品質を向上させる潜在能力を示しています。それは作業量を減らし、解釈のガイドラインに沿った一貫した意思決定を行い、微生物学者の役割を向上させることができます。システムには、同種の領域での種の同定の難しさなどの制約がありますが、安全設計の特徴により結果の一貫性への影響を最小限に抑えています。まとめると、DeepColonyは高スループットな研究所における微生物学者の重要な役割を洗練し強化する能力を持つ、ユニークなフレームワークとして浮かび上がります。これにより、微生物学的分析における意思決定プロセスの改善に大きな潜在力をもたらすことができます。この記事はAI研究がマイクロバイオロジストに菌を同定するのを助けるに最初に投稿されたものであり、MarkTechPostによって提供されました。

「Amazon Textractの新しいレイアウト機能は、一般的な目的と生成型のAIドキュメント処理タスクに効率をもたらします」

Amazon Textractは、任意のドキュメントや画像から自動的にテキスト、手書き、データを抽出する機械学習（ML）サービスですAnalyzeDocument Layoutは、ドキュメントから段落、タイトル、字幕、ヘッダー、フッターなどのレイアウト要素を自動的に抽出する新機能ですこのレイアウト機能は、Amazon Textractの単語と行の検出を拡張します

「Amazon SageMaker JumpStartを使用したスケーラブルなテキスト埋め込みと文の類似性検索」

この記事では、SageMaker Python SDKを使用してテキスト埋め込みと文の類似性の使用方法を示します文の類似性は、LLMによって埋め込まれた2つのテキストの間の類似度を評価することを意味しますこれは、検索増強生成（RAG）などのアプリケーションの基本ステップです

「MATLABとAmazon SageMakerによる機械学習」

この投稿はMathWorksのBrad Duncan、Rachel Johnson、Richard Alcockとの共同執筆ですMATLABはデータ処理、並列コンピューティング、自動化、シミュレーション、機械学習、人工知能など、さまざまなアプリケーションにおいて人気のあるプログラミングツールです自動車、航空宇宙、通信、製造業など多くの産業で頻繁に使用されています

Amazon MusicはSageMakerとNVIDIAを使用してMLの訓練および推論のパフォーマンスとコストを最適化しています

Amazon Music のストリーミングのダイナミックな世界では、曲やポッドキャスト、プレイリストの検索ごとに物語、ムード、感情の洪水が待っていますこれらの検索は新たな発見、大切な経験、永続する思い出への入り口となります検索バーは単に曲を見つけるためだけではありません

「NVIDIAスタジオ」で美しく写実的なフードレンダリングを作り出す3Dアーティストが今週登場しました

エディターの注釈：この投稿は、私たちの週間In the NVIDIA Studioシリーズの一部であり、注目のアーティストを称え、クリエイティブなヒントやトリックを提供し、NVIDIA Studioテクノロジーがクリエイティブなワークフローの向上にどのように役立つかをデモンストレーションします。感謝の季節です：人々や小さな瞬間に感謝する時間です。それらが私たちの人生を特別なものにするのです。今週の注目のCG Realism YouTuberであるRavissen Carpenenさんは、食卓に見事なほどリアルな3Dフードの映像を提供しています。彼の美味しそうなタイムラプス映像は、彼のYouTubeチャンネルで視聴できます。ブライトな音楽とスタイリッシュさを添えて楽しんでください。 Carpenenさんは、食べ物テーマのStudio Standoutビデオコンテストへの数多くの貢献者の一人であり、Roger Roqueさん（@rogerroqueid）、Nicole Morenaさん（@nicky.blender）、Heloise Cartさん（@isoheell）および Kris Theroinさん（@kristheorin）と一緒に作品を提供しました。最新のアップデートでは、OBS Studioを使用するライブストリーマーは、HDR10キャプチャサポート、WHIPおよびWebRTC出力などの機能を備えた最新バージョンをダウンロードできます。詳細はこちらをご覧ください。 All About That Baste…

Learn more about Search Results A - Page 68