Learn more about Search Results A - Page 227

このAI研究は、ポイントクラウドを2D画像、言語、音声、およびビデオと一致させる3Dマルチモダリティモデルである「Point-Bind」を紹介します

現在の技術的な景観では、3Dビジョンが急速な成長と進化により注目を浴びています。この関心の高まりは、自動運転、強化されたナビゲーションシステム、高度な3Dシーン理解、およびロボティクスといった分野の急成長に大いに貢献しています。3Dポイントクラウドを他のモダリティのデータと組み合わせるためには、3D理解の向上、テキストからの3D生成、および3Dの質問に答えるための試みが数多く行われています。 https://arxiv.org/abs/2309.00615 研究者は、Point-Bindという革命的な3Dマルチモーダルモデルを紹介しました。このモデルは、2D画像、言語、音声、ビデオなどのさまざまなデータソースとのポイントクラウドのシームレスな統合を目指しています。ImageBindの原則に基づいてガイドされたこのモデルは、3Dデータとマルチモダリティの間のギャップを埋める統一された埋め込み空間を構築します。このブレークスルーにより、任意のモダリティに基づいた3D生成、3D埋め込み算術、包括的な3Dオープンワールド理解など、多くのエキサイティングなアプリケーションが可能になります。 上記の画像では、Point-Bindの全体的なパイプラインが表示されています。研究者はまず、対照的な学習のために3D-画像-音声-テキストデータのペアを収集し、ImageBindによって3Dモダリティを他のモダリティに調整します。共通の埋め込み空間を持つことで、Point-Bindは3Dクロスモーダル検索、任意のモダリティに基づいた3D生成、3Dゼロショット理解、および3D大規模言語モデルの開発(Point-LLM)に利用することができます。 この研究のPoint-Bindの主な貢献は以下の通りです: ImageBindによる3Dの整列:共通の埋め込み空間内で、Point-Bindはまず3Dポイントクラウドを2D画像、ビデオ、言語、音声などのマルチモダリティと整列させます。 任意のモダリティに基づいた3D生成:既存のテキストから3Dへの生成モデルに基づいて、Point-Bindはテキスト/画像/音声/ポイントからメッシュの生成など、任意のモダリティに基づいた3D形状合成を可能にします。 3D埋め込み空間の算術:Point-Bindの3D特徴は、他のモダリティと組み合わせてその意味を取り込むために追加することができます。これにより、構成されたクロスモーダル検索が実現されます。 3Dゼロショット理解:Point-Bindは、3Dゼロショット分類の最先端の性能を達成します。また、テキストに加えて音声に基づいた3Dオープンワールド理解もサポートします。 https://arxiv.org/abs/2309.00615 研究者はPoint-Bindを活用して、3D質問応答やマルチモーダルな推論を実現するためにLLaMAを最適化した3D大規模言語モデル(Point-LLM)を開発しています。Point-LLMの全体的なパイプラインは、上記の画像で確認することができます。 Point LLMの主な貢献は以下の通りです: 3D質問応答のためのPoint-LLM: PointBindを使用して、英語と中国語の両方をサポートする、3Dポイントクラウド条件で指示に応答する初の3D LLM、Point-LLMを紹介します。 データとパラメータの効率: 3Dの指示データなしで、公共のビジョン言語データのみを調整に使用し、リソースを節約するためにパラメータ効率の高いファインチューニング技術を採用しています。 3Dおよびマルチモーダル推論: 共有埋め込み空間を介して、Point-LLMは3Dとマルチモーダルの入力の組み合わせを推論することにより、記述的な応答を生成することができます。例えば、画像/音声とポイントクラウドなどです。 将来の研究は、室内や屋外のシーンなど、より多様な3Dデータとマルチモダリティを統合することに焦点を当て、より広範な応用シナリオを可能にする予定です。

「AIに関する新しい公聴会を議会が開催する」

来週はAIと議会にとって熱い週になるでしょうなぜなら、議会は人工知能に関する3つの公聴会を開催する予定であり、そのうち1つにはテック巨大企業のマイクロソフトも参加しますロイターによると、公聴会にはブラッド・スミス社長とNvidiaの主任科学者ウィリアム・デイリーも出席する予定ですこれらの公聴会の目的は、...

OpenAIとLangChainによるMLエンジニアリングとLLMOpsへの導入

「OpenAI LLMsの操作方法とPythonでの人気のあるLangChainツールキットの使用方法を理解する書籍『Machine Learning Engineering with Python』からの抜粋、Packt、2023年」

「Amazon Rekognition、Amazon SageMaker基盤モデル、およびAmazon OpenSearch Serviceを使用した記事のための意味論的画像検索」

デジタルパブリッシャーは、新しいコンテンツをできるだけ迅速に生成し、公開するために、メディアのワークフローを効率化し自動化する方法を常に探していますパブリッシャーは、何百万もの画像を含むリポジトリを持っており、これらの画像を記事間で再利用することで費用を節約する必要がありますこのようなスケールのリポジトリ内で、記事に最も適した画像を見つけることは、時間のかかる繰り返しの手作業であり、自動化することができますまた、リポジトリ内の画像が正しくタグ付けされていることも自動化できます(お客様の成功事例については、Aller Media Finds Success with KeyCore and AWSを参照してください)この記事では、Amazon Rekognition、Amazon SageMaker JumpStart、Amazon OpenSearch Serviceを使用して、このビジネスの問題を解決する方法を示します

「Amazon TextractとAmazon OpenSearchを使用してスマートなドキュメント検索インデックスを実装する」

この投稿では、ドキュメント検索インデックスソリューションを迅速に構築および展開する旅に連れて行きますこのソリューションは、組織がドキュメントから洞察をより効果的に抽出するのを支援します例えば、人事部門では従業員契約の特定の条項を探しているか、財務アナリストでは支払いデータを抽出するために膨大な数の請求書を選別している場合でも、このソリューションは、あなたが必要な情報に前例のない速度と正確さでアクセスできるようにするためにカスタマイズされています

「NVIDIAがインドの巨大企業と提携し、世界最大の人口を持つ国でAIを進める」

世界最大の民主主義国は、AIを広範囲に採用し、自身と世界を変革する準備が整っています。 インドの最大の複合企業であるReliance Industries LimitedとTata Groupからの発表を受けて、NVIDIAの創設者兼CEOであるJensen Huangは、金曜日にベンガルールで記者会見を行い、AI技術とスキルを活用して、世界最大の人口を抱える国の最大の課題に取り組む計画の詳細を説明しました。 「これは世界最大のAI市場の1つになると思います」とHuangは述べました。彼は、インド全土での高レベルな会議、インドの首相ナレンドラ・モディ、主要なAI研究者、トップビジネスリーダー、報道関係者、およびインドの約4,000人のNVIDIA従業員との会議を終えたところでした。 両社は協力してAIコンピューティングインフラストラクチャとAIソリューションの開発プラットフォームを作ります。これには、NVIDIA GH200 Grace Hopper SuperchipやNVIDIA DGX Cloudなど、NVIDIAの技術が使用されます。 GH200は、卓越したパフォーマンスと大規模なメモリ帯域幅を提供する、コンピューティングアーキテクチャの根本的な変革を示すものであり、DGX Cloudはクラウド上のAIスーパーコンピューティングサービスであり、企業が従業員をAI技術でトレーニングし、技術にアクセスし、顧客に生成的AIサービスを提供するのを容易にします。 この発表に続いて、インドのトップテクノロジージャーナリスト数十人との質疑応答で、Huangはコンピュータ科学の専門知識がインドの中核的な競争力であり、技術と資本へのアクセスがあれば、インドは国内外の課題を解決するためにAIを構築する準備が整っていると述べました。 「データを持っていて、才能があります」とHuangは言いました。「ビジネスを展開しており、スーパーコンピュータを構築するための非常に豊富な専門知識を持っています」 報道陣との自由な質疑応答の中で、Huangはインドの情報技術の強みとAIが国のIT産業の発展を加速させる可能性に重点を置きました。 「ITはあなたの天然資源の1つです。それを信じられないほどのスケールで生産しています。それが非常に得意なのです。それを世界中に輸出しています」とHuangは述べました。 インドの「AIの瞬間」 以前にも、スタートアップのパイオニア、AIの提唱者、そしてインドのデジタル公共インフラの主要なプレーヤーを含む、この地域の多くのトップテクノロジーリーダーとの会議を終えた後、Huangは「インドの瞬間」と述べ、この国がグローバルなAIの強国になる前途について語りました。 NVIDIAのCEOであるJensen HuangとInfosysの創設者でありUIDAIの創設議長であるNandan…

「2人の上院議員が、A.I.法律のための両党間の枠組みを提案」

リチャード・ブルーメンソールとジョシュ・ホーリー上院議員による取り組みは、急速に進化する技術に追いつくための立法者の最新の動きです

「AIの成長に伴い、ラスベガスの労働者たちは変化に備える」

ラスベガスの労働者たちは、労働コストを削減しようとして人工知能や他の技術の採用が増える雇用主を注視しています

「VAST DataのプラットフォームがAIイノベーションの障壁を取り除く方法」

データが存在する場所に関係なく、より多くのデータへの高速アクセスは、AIに基づくアプリケーション、ソリューション、および発見の採用と成功を加速させます

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us