複数の画像やテキストの解釈 Applications - Section 88
「S-LabとNTUの研究者が、シーニメファイ(Scenimefy)を提案しましたこれは、現実世界の画像から自動的に高品質なアニメシーンのレンダリングを行うための画像対画像翻訳フレームワークであり、セミスーパーバイズド(半教師付き)手法を採用しています」
アニメの風景は創造力と時間を大量に必要とするため、自動的なシーンのスタイル化のための学習ベースの手法の開発には明らか...
プリンストン大学の研究者が、MeZOというメモリ効率の高いゼロ次最適化器を紹介しましたこの最適化器は、大規模言語モデル(LLM)を微調整することができます
大きな言語モデルは、過去数ヶ月のジェネレーティブ人工知能の大成功により、急速に進化しています。これらのモデルは、驚く...
「SelFeeに会いましょう:自己フィードバック生成によって強化された反復的自己修正LLM」
最近の研究では、自然言語フィードバックが言語モデルの性能向上に効果的であることが示されています。KAISTの研究チームは、...
UCLとGoogleの研究者が提案する「AudioSlots:オーディオドメインの盲目的なソース分離のためのスロット中心の生成モデル」
最近、集合構造化データ上で動作するアーキテクチャにおけるニューラルネットワークの使用と、非構造化入力から集合構造化出...
「岩石とAIの衝突:鉱物学とゼロショットコンピュータビジョンの交差点」
鉱物は、定義された化学組成と結晶構造を持つ天然の無機物です。彼らは岩の構成要素であり、さまざまな地質学的および産業プ...
ワシントン大学とAI2の研究者が、VQAを介してAIが生成した画像の忠実度を測定する自動評価指標であるTIFAを紹介します
テキストから画像を生成するモデルは、人工知能の進歩の最も良い例の一つです。研究者たちの持続的な進歩と努力により、これ...
「DenseDiffusionとの出会い:テキストから画像生成における密なキャプションとレイアウト操作に対処するためのトレーニング不要のAI技術」
テキストから画像を生成するモデルの最近の進歩により、短いシーンの説明に基づいて高品質の画像を生成することができる洗練...
Googleの研究者たちは、RO-ViTを紹介しますこれは、オープンボキャブラリー検出の改善のため、リージョンに意識を向けた方法でビジョントランスフォーマーを事前トレーニングするためのシンプルなAI手法です
最近の進歩により、コンピュータは人間の視覚のように、世界から視覚情報を解釈し理解することができるようになりました。画...
「50以上の新しい最先端の人工知能(AI)ツール(2023年9月)」
AIツールの開発が急速に増えており、新しいツールが定期的に導入されています。以下のいくつかのAIツールをチェックして、日...
「Google DeepMindの研究者が、チェスの課題に取り組むためのAIの多様性の力を明らかにする:計算問題解決における次の飛躍、AZ_dbの紹介」
人工知能はその領域をほぼすべての分野に広げ、私たちはほぼすべての生活の分野でその応用を見つけることができます。いくつ...
- You may be interested
- 「企業におけるAIの倫理とESGへの貢献の探...
- Spotifyで学んだ初級データサイエンティス...
- 「Power BIでのデータの視点変更」
- 複数の時間軸での予測 天気データの例
- 「2024年に機械学習を学ぶ方法(もし最初...
- 「機械学習 vs AI vs ディープラーニング ...
- 商務省は、「米国人工知能安全研究所」を...
- オーディオデータセットの完全ガイド
- 「リードジェネレーションにおいて直接参...
- 「前例のない緊急事態下でのオンライン機...
- 「このディスインフォメーションはあなた...
- Amazon MusicはSageMakerとNVIDIAを使用し...
- 「Mixtral 8x7Bについて知っていること ミ...
- 「ドラッグ&ドロップ、分析:ノーコード...
- スタンフォード大学の研究者たちは、「Hye...
Find your business way
Globalization of Business, We can all achieve our own Success.