複数の画像やテキストの解釈 AI研究 - Section 42
AI 研究とイノベーションの最前線に留まります
「ニューヨーク大学の研究者が、人の見かけの年齢を画像内で変える新しい人工知能技術を開発しましたが、その人の独自の識別特徴を維持します」
AIシステムは、画像解析を使用して個人の年齢を正確に推定および変更するために、ますます使用されています。老化の変動に堅...
Googleの研究者たちは、AIによって生成された画像を透かしを入れたり識別するためのデジタルツールである「𝗦𝘆𝗻𝘁𝗵𝗜𝗗」を紹介しました
人工知能(AI)の急速に進化する風景の中で、生成モデルは伝統的な手段でキャプチャされたものとほとんど区別のつかない、写...
「GoogleはDeepfakeへの対策として、AIによって生成された画像にウォーターマークを付けます」
誤解を招くコンテンツの急増に対抗する重要な一歩として、Googleは革新的なソリューションを導入し、ディープフェイクに対す...
このAI研究は、深層学習システムが継続的な学習環境で使用される際の「可塑性の喪失」という問題に取り組んでいます
現代の深層学習アルゴリズムは、トレーニングが一度だけ行われるかなりのデータ収集に焦点を当てています。声の認識や画像の...
Googleとジョージア工科大学の研究者が、セグメンテーションマスクを作成するための直感的な後処理AIメソッドであるDiffSegを紹介しました
セマンティックセグメンテーションとして知られるコンピュータビジョンのタスクの目的は、画像内の各ピクセルにクラスまたは...
「S-LabとNTUの研究者が、シーニメファイ(Scenimefy)を提案しましたこれは、現実世界の画像から自動的に高品質なアニメシーンのレンダリングを行うための画像対画像翻訳フレームワークであり、セミスーパーバイズド(半教師付き)手法を採用しています」
アニメの風景は創造力と時間を大量に必要とするため、自動的なシーンのスタイル化のための学習ベースの手法の開発には明らか...
プリンストン大学の研究者が、MeZOというメモリ効率の高いゼロ次最適化器を紹介しましたこの最適化器は、大規模言語モデル(LLM)を微調整することができます
大きな言語モデルは、過去数ヶ月のジェネレーティブ人工知能の大成功により、急速に進化しています。これらのモデルは、驚く...
「SynthIDを使ったAI生成画像の識別」
今日は、Google Cloudとの提携により、SynthIDという新しいツールのベータ版をリリースしますSynthIDは、AIによって生成され...
UCLとGoogleの研究者が提案する「AudioSlots:オーディオドメインの盲目的なソース分離のためのスロット中心の生成モデル」
最近、集合構造化データ上で動作するアーキテクチャにおけるニューラルネットワークの使用と、非構造化入力から集合構造化出...
初心者のための2023年の機械学習論文の読み方
「私は数十の機械学習の論文を読み、論文の勉強方法がだいたい分かってきました まず最初に、特定の論文を読む目的を理解する...

- You may be interested
- ハギングフェイスがIDEFICSを導入:視覚言...
- 「エンティティ抽出、SQLクエリ、およびAm...
- 「Q-学習を用いたダイナミックプライシン...
- 「凍結された大規模言語モデルによるビジ...
- 「AIが執筆プロセスに民主化をもたらして...
- 「リリに会ってください:マッキンゼーの...
- 研究者たちは、肩越しに画面をのぞき見す...
- 「10000 DALL-Eのクレジットでは買えない...
- 話すロボット:新しいAIモデルは、ビジョ...
- 「Amazon Bedrockを使用した生成型AIアプ...
- エラスティックサーチでシノニムを便利に...
- プロセオンフォトニクス-コンピューティン...
- コールセンターにおけるAIソフトウェアが...
- 「言語の力を解き放つ:NVIDIAのアナマラ...
- 「Llama 2が登場しました – Hugging...
Find your business way
Globalization of Business, We can all achieve our own Success.