Search Results src

スタンフォード大学とセールスフォースAIの研究者が「UniControl」という統合的な拡散モデルを発表：AI画像生成における高度な制御のための統一されたモデル

生成型の基礎モデルは、特定のタイプの入力データに似た新しいデータを生成するために設計された人工知能モデルのクラスです。これらのモデルは、自然言語処理、コンピュータビジョン、音楽生成など、さまざまな分野で使用されることがあります。彼らは、トレーニングデータから基礎となるパターンや構造を学び、その知識を使用して新しい似たようなデータを生成します。生成型の基礎モデルは、画像合成、テキスト生成、推薦システム、薬物探索など、さまざまな応用があります。彼らは常に進化し、生成能力の向上、より多様で高品質な出力の生成、可制御性の向上、および使用に関連する倫理的な問題の理解など、その応用能力を向上させるために研究者が取り組んでいます。 Stanford大学、Northeastern大学、Salesforce AI研究所の研究者たちは、UniControlを開発しました。これは、野生での制御可能なビジュアル生成のための統一拡散モデルであり、言語とさまざまな視覚条件を同時に扱うことができます。UniControlは、複数のタスクを同時に処理し、さまざまな視覚条件をユニバーサルな表現空間にエンコードし、タスク間で共通の構造を探求する必要があります。UniControlは、他のタスクや言語プロンプトから幅広い視覚条件を受け取る必要があります。 UniControlは、視覚要素が主な役割を果たし、言語のプロンプトがスタイルと文脈を指示することにより、ピクセルパーフェクトな精度で画像の生成を提供します。研究チームは、UniControlがさまざまな視覚シナリオを管理する能力を向上させるために、事前学習されたテキストから画像への拡散モデルを拡大しました。さらに、彼らはタスクに関する認識能力を持つHyperNetを組み込み、異なる視覚条件に基づいて複数の画像生成タスクに適応することができるようにしました。彼らのモデルは、ControlNetよりも3Dジオメトリガイドの深さマップや表面法線の微妙な理解を示しています。深さマップ条件により、より正確な出力が生じます。セグメンテーション、openpose、および物体のバウンディングボックスのタスク中、彼らのモデルによって生成された画像は、ControlNetによって生成された画像よりも与えられた条件によりよく整列し、入力プロンプトに対して高い忠実度を確保します。実験結果は、UniControlが同等のモデルサイズを持つ単一タスク制御法の性能をしばしば上回ることを示しています。 UniControlは、ControlNetのさまざまな視覚条件を統合し、新たに見たことのないタスクでゼロショット学習を実行することができます。現在のところ、UniControlは単一の視覚条件のみを受け入れるが、複数のタスクを同時に実行し、ゼロショット学習も可能です。これは、その汎用性と広範な採用の可能性を示しています。ただし、彼らのモデルはまだ拡散ベースの画像生成モデルの制限を継承しています。具体的には、研究者のトレーニングデータはLaion-Aestheticsデータセットの一部から取得されたものであり、データバイアスがかかっています。UniControlは、バイアスのある、有毒な、性的な、または他の有害なコンテンツの作成をブロックするために、より良いオープンソースのデータセットが利用可能であれば改善することができます。

「非構造化データファンネル」

非構造化データはさまざまな形を取ります通常、テキストが主な要素ですが、日付、数値、辞書などのデータも含まれる場合がありますデータエンジニアは一般的に非構造化データに出くわしますが、その…

LLM説明性への道：なぜ私のモデルはこの出力を出したのか？

大型言語モデル（LLM）は、この前の年にたくさんの進展を見せましたGPT-4やClaude 2の最近のリリースなどがありますこれらのモデルは以前のバージョンと比較して新しい能力を発揮していますが、...

『Amazon SageMaker を使用して、Talent.com の ETL データ処理を効率化する』

この投稿では、Talent.comでの求人推薦モデルのトレーニングと展開のために開発したETLパイプラインについて説明します当社のパイプラインは、大規模なデータ処理と特徴抽出のためにSageMaker Processingジョブを使用して効率的なデータ処理を行います特徴抽出コードはPythonで実装されており、一般的な機械学習ライブラリを使用してスケーラブルな特徴抽出を行うため、コードをPySparkを使用する必要はありません

リトリーバル・オーグメンテッド・ジェネレーションを使用して、安定した拡散プロンプトを改善しましょう

テキストから画像を生成することは、メディアやエンターテイメント、ゲーム、ECサイトの商品ビジュアライゼーション、広告やマーケティング、建築設計やビジュアライゼーション、芸術創作、医療画像など、さまざまな分野で応用される急速に成長している人工知能の分野ですStable Diffusionは、数秒で高品質な画像を作成する力を与えるテキストから画像へのモデルです11月には[…]

「Amazon ComprehendのためのPDFの事前ラベル付けを自動化する」

「Amazon Comprehend」はテキストデータから洞察を得るための事前トレーニング済みおよびカスタムAPIを提供する自然言語処理（NLP）サービスですAmazon Comprehendのお客様は、位置、人名、日付など、ビジネスに特有の興味のあるエンティティを抽出するためのカスタムなる名前エンティティ認識（NER）モデルをトレーニングすることができますカスタムモデルをトレーニングするには、[...]

『AWSプロトタイピングによるICL-GroupのAmazon SageMaker上でのコンピュータビジョンモデルの構築』

「これはICLとAWSの従業員が共同執筆した顧客投稿ですICLは、イスラエルに拠点を置く多国籍の製造および鉱業企業で、ユニークな鉱物に基づいた製品を製造し、主に農業、食品、エンジニアリング材料の三つの市場で人類の基本的なニーズを満たしています彼らの鉱山サイトでは、監視が必要な産業用機器が使用されています...」

「23andMeにおける複数の個人情報漏洩」

「盗まれた遺伝子データがテスト会社に対する集団訴訟につながる」

「Forza Horizon」がGeForce NOWにレースを展開」

このGFN Thursdayは、Microsoft Studiosの最新のForza Horizonゲームでタイヤを焼き尽くします。PC Game Passでチェックしてみてください。さらに、最新のメンバーシップバンドルでクラウドゲーミングのギフトを贈りましょう。このバンドルには、6ヶ月のGeForce NOW Ultimateメンバーシップの購入で無料の3ヶ月のPC Game Passサブスクリプションが含まれています。これは13の新しいゲームがGeForce NOWのライブラリに参加するエキサイティングな週の一部です。ズームズームプレイグラウンドゲームズとMicrosoft StudiosのForza Horizon 4およびForza Horizon 5にドライバーシートに飛び乗ってください。評価の高いオープンワールドレーシングゲームで、ダイナミックな天候と季節が最も経験豊富なドライバーですら大成功または大失敗にすることができます。フォルツァクラウド。美しい歴史あるイギリスを舞台にForza Horizon 4でレースを繰り広げましょう。単独で乗り出すか、オンラインで世界中のプレイヤーと共有のオープンワールドでチームを組めます。Horizonカーロスターの450台以上の車を収集、改造、運転し、レースやスタント、創造、探索をしてHorizonのスーパースターになりましょう。…

チャットボットに関する不正行為の懸念は誇張されていたと、新しい研究が示唆しています

「ChatGPTのようなA.I.ツールは、スタンフォードの研究者によると、高校での不正行為の頻度を増加させていない」と言われています

Learn more about Search Results src - Page 14