Learn more about Search Results Rodin

「Rodinに会ってください:さまざまな入力ソースから3Dデジタルアバターを生成する革新的な人工知能(AI)フレームワーク」

生成モデルは、コンピュータサイエンスの多くの困難なタスクに対する事実上の解決策となっています。それらは視覚データの分析と合成のための最も有望な方法の一つを表しています。Stable Diffusionは、複雑な入力プロンプトから美しいリアルな画像を生成するための最もよく知られた生成モデルです。このアーキテクチャはDiffusion Models(DMs)に基づいており、画像と動画に対して驚異的な生成力を示しています。拡散と生成モデリングの急速な進歩が、2Dコンテンツの創造において革命を起こしています。その鍵となる言葉は非常にシンプルです。「それを説明できるなら、それを視覚化できる」ということです。または、さらに良いと言えば、「それを説明できるなら、モデルがそれを描くことができる」ということです。本当に信じられないほど、生成モデルが何ができるかです。 2DコンテンツはDMsにとってストレステストとなることが示されていますが、3Dコンテンツは追加の次元によると限定されないさまざまな課題をもたらします。アバターなどの3Dコンテンツを2Dコンテンツと同じ品質で生成することは、高品質のアバターに必要な豊富な詳細を生成するためのメモリと処理コストが制約となるため、困難な課題です。 技術が映画、ゲーム、メタバース、そして3D産業でデジタルアバターの使用を推進する中、誰でもデジタルアバターを作成できるようにすることは有益です。それがこの研究の進展を促している動機です。 著者たちは、デジタルアバターの作成の問題に対処するために、Roll-out diffusion network(Rodin)を提案しています。モデルの概要は、以下の図に示されています。 モデルへの入力は画像、ランダムノイズ、または望ましいアバターのテキストの説明であることができます。次に、与えられた入力から潜在ベクトルzが導かれ、拡散に使用されます。拡散プロセスは、いくつかのノイズ除去ステップから成り立っています。最初に、ランダムノイズが初期状態または画像に追加され、より鮮明な画像が得られるようにノイズが除去されます。 ここでの違いは、望ましいコンテンツの3D性質にあります。拡散プロセスは通常通り実行されますが、2D画像を対象とする代わりに、拡散モデルはアバターの粗いジオメトリを生成し、詳細合成のための拡散アップサンプラーを生成します。 計算およびメモリの効率性は、この研究の目標の一つです。このため、著者たちはニューラル輝度場の三軸(三軸)表現を利用しました。この表現は、ボクセルグリッドと比較して、記憶フットプリントをかなり小さくすることができるため、表現力を犠牲にすることなく効率性を高めることができます。 次に、別の拡散モデルが訓練され、生成された三面体プレーン表現を望ましい解像度にアップサンプリングします。最後に、4つの完全接続層から構成される軽量なMLPデコーダを利用して、RGBの体積画像を生成します。 以下にいくつかの結果を報告します。 先述の最先端の手法と比較して、Rodinは最も鮮明なデジタルアバターを提供します。モデルでは、他の手法とは異なり、共有されたサンプルにはアーティファクトが見られません。 これは、さまざまな入力ソースから簡単に3Dデジタルアバターを生成するための新しいフレームワークであるRodinの概要でした。興味がある場合は、以下のリンクで詳細情報を見つけることができます。

スタンフォード研究者がGLOWとIVESを使用して、分子ドッキングとリガンド結合位姿の予測を変革しています

ディープラーニングは、スコアリング関数の改善により、分子ドッキングの向上の可能性を持っています。現在のサンプリングプロトコルは、正確なリガンド結合ポーズを生成するために事前情報が必要であり、スコアリング関数の正確さが制限されています。GLOWとIVESという2つの新しいプロトコルは、スタンフォード大学の研究者によって開発され、この課題に対応し、ポーズのサンプリング効果を向上させることを示しています。AlphaFoldで生成されたタンパク質構造を含むさまざまなタンパク質構造でのベンチマークテストにより、これらの手法の妥当性が確認されています。 分子ドッキングにおけるディープラーニングは、しばしば剛体タンパク質ドッキングデータセットに依存しており、タンパク質の柔軟性を無視しています。一方、柔軟ドッキングはタンパク質の柔軟性を考慮していますが、精度が低い傾向があります。GLOWとIVESは、これらの制限に対応する高度なサンプリングプロトコルであり、特に動的結合ポケットでベースラインメソッドを常に上回っています。これは、タンパク質リガンドドッキングにおけるリガンドポーズのサンプリングを改善するために重要であり、ディープラーニングベースのスコアリング関数の向上に重要です。 分子ドッキングは、薬物探索においてタンパク質結合サイトへのリガンド配置を予測します。従来の方法は正確なリガンドポーズの生成に課題を抱えています。ディープラーニングは正確性を向上させることができますが、効果的なポーズのサンプリングに依存しています。GLOWとIVESは、チャレンジングなシナリオに対してサンプルを改善し、正確性を向上させるための進んだサンプリングプロトコルです。AlphaFoldで生成された未リガンド化または予測されたタンパク質構造に適用可能であり、キュレーションされたデータセットとオープンソースのPythonコードも提供しています。 GLOWとIVESは、分子ドッキングのための2つのポーズサンプリングプロトコルです。GLOWはソフト化された分散力ポテンシャルを利用してリガンドポーズを生成し、IVESは複数のタンパク質構造を組み込むことで正確性を向上させます。ベースラインメソッドとのパフォーマンス比較により、GLOWとIVESの優位性が示されています。クロスドッキングケースにおける正しいポーズの割合を測定するテストセットの評価は、IVESの効率において重要なシードポーズの品質を示しています。 GLOWとIVESは、リガンドポーズのサンプリングにおいてベースラインメソッドを上回る正確性を持ち、チャレンジングなシナリオやAlphaFoldベンチマークにおいて顕著なタンパク質の構造変化にも優れています。テストセットの評価により、正しいポーズのサンプリング確率の優越性が確認されています。IVESは複数のタンパク質構造を生成することで、タンパク質構造の幾何学的なディープラーニングにおいて、より少ない構造でSchrodinger IFD-MDと同様のパフォーマンスを達成します。GLOWとIVESによって生成された5,000のタンパク質リガンドペアのリガンドポーズデータセットは、ディープラーニングベースのスコアリング関数の開発と評価において貴重なリソースとなります。 https://arxiv.org/abs/2312.00191 結論として、GLOWとIVESは、基本的な技術よりも効果的な2つのポーズサンプリング方法であり、特に困難なシナリオとAlphaFoldベンチマークにおいて優れた性能を発揮しています。IVESでは複数のタンパク質構造が生成されるため、幾何学的ディープラーニングに非常に有利です。また、GLOWとIVESが提供する5,000のタンパク質リガンドペアのリガンドポーズを含むデータセットは、分子ドッキングのディープラーニングベースのスコアリング関数に取り組んでいる研究者にとって貴重な資源です。

『完全な初心者のための量子コンピューティング』

「地球の資源に対する人類の支配の数千年ぶりを、人新世と形容する者もいるこの言葉は、ギリシャ語の「anthropo」で人間を意味し、「cene」で最近を意味するものである最後の...」

トップ10の生成AI 3Dオブジェクトジェネレーター

高性能なAI 3Dオブジェクトジェネレータにより、3Dモデルの作成と可視化がより正確かつアクセスしやすく効率的になりました。グラフィックデザイナーまたはゲーム開発者であっても、AI 3Dオブジェクトジェネレータはあなたの要件に応じて最適なものがどれかはあなた次第です。イメージ、テキスト、またはビデオのみを使用して革新的な方法で3Dモデルを作成することができます。ここでは、トップ10のAI 3Dオブジェクトジェネレータを紹介します。 AI 3Dオブジェクト生成とは何ですか? AI 3Dオブジェクト生成は、AI 3Dオブジェクトジェネレータの助けを借りて、より正確に3Dモデルを作成するプロセスです。これらのツールを使用して、あなたのアイデアを3次元で生み出し、3Dモデルをデザインすることができます。テキストを3Dジェネレータに、画像を3Dオブジェクトに、ビデオを3Dモデルに変換することができます。あなたの要件に合わせたツールが用意されています。これらのツールで創造性の新しい扉を開けてみましょう。 トップ10のAI 3Dオブジェクトジェネレータ AI 3Dオブジェクトジェネレータは、3Dモデルの設計ニーズに対応しています。これらのツールを最大限に活用して、アイデアに生命を与えることができます。以下に、トップ10のAI 3Dオブジェクトジェネレータをご紹介します。 1. Spline Splineは、ブラウザ上でインタラクティブなウェブ体験を形作ることができるAI 3Dオブジェクトジェネレータの一つです。リアルタイムのコラボレーション機能を備えたチームプロジェクトには絶好のツールです。 主な特徴: マテリアルレイヤー、3Dスカルプティング、物理制御とゲームコントロール、3Dモデリングとアニメーション、インタラクティブな体験、ビデオテクスチャやコンポーネントなど、幅広いアニメーションと3Dモデリングの機能を提供します。 カメラコントロール、3Dベクトル編集、ドラッグアンドドロップ機能、Webブラウザイベントのツールを探索することができます。ユーザーはAPIまたはウェブサイトを通じてデジタルメディアをアップロードし、それが自動的に3Dモデルに分析されます。 価格: 基本プラン:無料 スーパープラン:$7…

「2023年のトップAI画像から動画を生成するツール」

Genmo Genmoは、テキストをページの二次元以上に超えるビジュアル形式に変換する、人工知能によるビデオ生成システムです。自然言語処理、画像認識、機械学習のアルゴリズムが使用され、テキスト、画像、シンボル、絵文字を動画に変換することができます。背景色、キャラクター、音楽など、ビデオをパーソナライズする方法はさまざまです。提供されたテキストと関連する画像がビデオに含まれます。GenmoのAIによって作成されたビデオは、広告、教育、説明など、さまざまな目的で使用することができます。興味深い映画を迅速かつ低コストで作成する必要がある企業、グループ、個人にとって、素晴らしいリソースです。 D-ID D-IDは、人工知能によって駆動されるビデオ制作プラットフォームであり、テキストからプロ品質のビデオを簡単かつ迅速に作成することができます。Stable DiffusionとGPT-3を使用して、同社のCreative RealityTM Studioは100以上の言語でビデオを作成します。D-IDのLive Portrait機能は、静止画像から短編映画を作成し、Speaking Portrait機能は書かれたテキストや話されたテキストにスピーチを与えます。数万のビデオの助けを借りてAPIを改善し、高品質のビジュアルを生成することができます。Digiday、SXSW、TechCrunchは、伝統的なアプローチに比べて低コストで高品質なビデオを作成する能力でD-IDを認識しています。 LeiaPix Converter LeiaPix Converterは、通常の写真を3D Lightfield写真に変換する、ウェブベースの無償サービスです。AIを使用して、写真をリアルな没入型の3D環境に変換します。出力形式を選択し、写真をLeiaPix Converterにアップロードします。変換されたファイルは、Leia Image Format、Side-by-Side 3D、Depth Map、Lightfield Animationなど、複数の形式でエクスポートできます。LeiaPix Converterの出力は高品質で使いやすいです。写真に新しい雰囲気を与え、ユニークな視覚的な作品を作る素晴らしい方法です。2Dの画像から3D Lightfieldへの変換を行います。Leia Image Format、Side-by-Side…

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us