Learn more about Search Results OPT - Page 72

「Amazon SageMakerでのRayを使用した効果的な負荷分散」

以前の記事(たとえば、ここ)では、DNNトレーニングワークロードのプロファイリングとパフォーマンスの最適化の重要性について詳しく説明しましたディープラーニングモデルのトレーニングは、特に大規模なものは...

『ご要望に合わせたチャット:ソフトウェア要件に応用した生成AI(LLM)の旅』

「大規模言語モデル(LLM)をソフトウェア要件に適用し、ビジネスロジックの知識ハブと開発を加速するためのコパイロットを作成した方法を発見してください」

「Saturn 大規模な言語モデルおよびその他のニューラルネットワークのトレーニングへの新しいアプローチ」

編集者の注記 Kabir Nagrecha氏は、今年の秋に開催されるODSC West 2023のスピーカーです彼の講演「共同システム最適化によるオープンソース大規模モデルの微調整の民主化」をぜひチェックしてください!モデルのスケールは、現代の深層学習の実践において絶対に必要な要素となっています数十億パラメータの大規模モデルの成功は、...

「完璧なコンビ:adidasとCovision MediaがAIとNVIDIA RTXを使用して写真のようなリアルな3Dコンテンツを作成」

物理製品の3Dスキャンを作成するのは時間がかかる場合があります。多くの企業は、フォトグラメトリーベースのアプリやスキャナーなどの従来の方法を使用していますが、これらは数時間または数日かかる場合があります。また、すべてのアプリケーションでモデルがリアルに見えるようにするために必要な3Dの品質と詳細レベルを常に提供するわけではありません。 イタリアに拠点を置くスタートアップ企業であるCovision Mediaは、AIとNVIDIA RTXを活用して3Dスキャンプロセスと3Dベースのコンテンツ作成を向上させています。 Covision Mediaは、靴、眼鏡、スポーツ用品、おもちゃ、工具、家庭用品など、あらゆる製品のデジタルツインを作成できるAIベースの3Dスキャナを開発しています。同社は、最新のリソースと技術へのアクセスを提供する無料のプログラムであるNVIDIA Inceptionのメンバーです。 Covisionの技術を使用することで、顧客は迅速に3Dスキャンを作成し、詳細なテクスチャ、材料、色、ジオメトリなどを自動的に保存して、画像をできるだけリアルに見せることができます。 この技術はNVIDIA RTX上で動作し、ユーザーは高品質で詳細なフォトリアルな3Dモデルを作成することができます。Covision Mediaは、光、反射、透明な表面を正確に捉えるなど、典型的な課題に取り組みながら、ニューラル放射フィールド(NeRFs)を使用して3Dモデルの品質を向上させています。 アディダスとそのパートナーであるコンテンツ制作スタジオのNUREGは、Covision Mediaの3Dスキャン技術を利用して、電子商取引のコンテンツ制作を自動化および拡大する最初のユーザーの一部です。 RTXとAIによる3Dの新たな可能性の解放 Covisionの3Dスキャナは、NVIDIA RTX A5000およびRTX A6000 GPUを搭載した複数のワークステーションに接続されており、高いレイトレーシング性能と強力なAI機能を提供しています。 NVIDIA OptiXフレームワークのレイトレーシング性能とNVIDIA RTコアにより、Covisionはスキャンされたオブジェクトの照明を正確に測定することができます。これは、顧客がスキャンした製品を任意の仮想環境に配置できる最も重要な要素の一つです。Covisionはまた、ニューラルテクスチャの手法に対して最新のAIソリューションを開発するために、NVIDIAのソフトウェアインフラストラクチャを活用しています。 「NVIDIA RTX…

スマートな”メガネは非着用者とのパワーバランスを歪める

コーネル大学とブラウン大学の研究者は、拡張現実またはスマートグラスの着用者は、非着用者に比べて特定の利点を持っていることを発見しました

メタAIがNougatをリリース:科学文書を処理するためのOCRを実行するビジュアルトランスフォーマーモデルで、マークアップ言語に変換します

人工知能の発展とともに、そのサブフィールドである自然言語処理、自然言語生成、コンピュータビジョンなどは、広範なユースケースにより急速に人気を集めています。光学文字認識(OCR)は、コンピュータビジョンの確立された研究領域であり、積極的に研究が行われています。ドキュメントのデジタル化、手書き文字認識、シーンテキスト識別など、多くの用途があります。数式の認識は、OCRの中でも特に学術研究で大いに関心を集めている領域です。 ポータブルドキュメントフォーマット(PDF)は、科学知識の最も広く使用される形式の1つであり、通常は書籍に保存されるか、学術誌に掲載されます。インターネット上で2.4%の情報を占める最も使用されるデータ形式の2番目のPDFは、ドキュメント配信に頻繁に使用されます。広範な使用にもかかわらず、PDFファイルから情報を抽出することは難しい場合があります。特に、これらの論文がPDF形式に変換されると、数式の意味情報が頻繁に失われます。 これらの課題に対処するため、Meta AIの研究チームは「Neural Optical Understanding for Academic Documents」を意味する「Nougat」という解決策を提案しました。Nougatは、科学的なテキストに光学文字認識(OCR)を行うためのVisual Transformerモデルです。その目標は、これらのファイルをマークアップ言語に変換して、より簡単にアクセス可能で機械読み取り可能にすることです。 手法の効果を示すために、チームは学術論文の新しいデータセットも作成しました。この手法は、デジタル時代における科学知識のアクセシビリティを向上させるための具体的な答えを提供します。これにより、人間にとって読みやすい書面とコンピュータが処理・分析できるテキストとの間のギャップが埋まります。研究者、教育者、科学文献に興味のある人は、Nougatを使用して科学論文により効果的にアクセスし、取り扱うことができます。Nougatは、基本的にはイメージを持つドキュメントページ、特にPDFからフォーマットされたマークアップテキストに変換するためのトランスフォーマーベースのモデルです。 チームは、次のような主な貢献をまとめています。 事前学習済みモデルの公開:チームはPDFをシンプルなマークアップ言語に変換することができる事前学習済みモデルを作成しました。この事前学習済みモデルはGitHubで公開されており、研究コミュニティや誰でもアクセスできるようになっています。 データセット作成のためのパイプライン:PDF文書とそれに関連するソースコードをペアにするためのデータセット作成方法が研究で説明されています。このデータセットの開発方法は、Nougatモデルのテストや改善、将来の文書分析の研究や応用に役立つ可能性があります。 ページのイメージに依存:Nougatの特徴の1つは、ページのイメージのみで動作できる能力です。これにより、元のドキュメントがデジタルテキスト形式で利用できない場合でも、さまざまなソースからコンテンツを抽出する柔軟なツールとなります。スキャンされた論文や書籍を処理することができます。

「メタヒューリスティクスの説明:アントコロニーオプティマイゼーション」

最適化アルゴリズムの世界では、自然界の驚異に触発された多くの手法が存在します進化に基づく遺伝的アルゴリズムから冷却戦略まで、多岐にわたります

「オッペンハイマーからジェネラティブAIへ:今日の企業にとっての貴重な教訓」

先週末、最新の大ヒット作品「オッペンハイマー」を劇場で3時間観ましたストーリー全体と結末はすでに知っていたにも関わらず、私はまだドキドキしながら観ていました...

DSPyの内部:知っておく必要のある新しい言語モデルプログラミングフレームワーク

言語モデルプログラミング(LMP)フレームワークの世界は、ここ数か月で急速に拡大していますLangChainやLlamaIndexなどのフレームワークは、確かに関連するレベルの成果を上げています...

「セマンティックカーネルへのPythonistaのイントロ」

ChatGPTのリリース以来、大規模言語モデル(LLM)は産業界とメディアの両方で非常に注目されており、これによりLLMを活用しようとする前例のない需要が生まれました...

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us