複数の画像やテキストの解釈 AI研究 - Section 45
AI 研究とイノベーションの最前線に留まります
テンセントAIラボの研究者たちは、テキスト対応の画像プロンプトアダプタ「IP-Adapter」を開発しました:テキストから画像への拡散モデルのためのアダプタです
「リンゴ」と言えば、あなたの頭にすぐにリンゴのイメージが浮かびます。私たちの脳の働き方が魅力的であるように、生成AIも...
「Appleの研究者が、ポーズされた画像から詳細な3D再構築を生成するエンドツーエンドネットワークを提案」
GTA-5をプレイしたことはありますか?ゲーム内の3Dグラフィックには感動します。平面上の2Dグラフィックとは異なり、3Dグラフ...
マイクロソフトと香港浸会大学の研究者が、WizardCoder A Code Evol-Instruct Fine-Tuned Code LLMを紹介しました
大規模言語モデル(LLM)は最近注目を集め、驚異的な成功を収めています。特にOpenAIのChatGPTは注目すべき例です。これらの...
AIはロボットが全身を使ってオブジェクトを操作するのを支援します
新しい技術により、ロボットは指先だけでなく、動く物体について効率的に推論することができます
東京大学の研究者たちは、静的バンディット問題からより困難な動的環境に向けた拡張フォトニック強化学習手法を開発しました
機械学習の世界では、強化学習の概念が中心になっており、特定の環境内で反復的な試行と誤りを通じてエージェントがタスクを...
「SMARTは、AI、自動化、そして働き方の未来を進めるための研究グループを立ち上げました」
「Mens, Manus and Machina (M3S)は、人間と機械の成功した協働のために、技術、トレーニングプログラム、および制度を設計し...
スマートフォンにおける通話セキュリティリスクを明らかにするための研究ハック
複数の機関の研究チームが、スマートフォンの加速度計によって記録されたイヤースピーカーの振動データをスクリーニングする...
「研究者が深層学習と物理学を組み合わせてMRIスキャンを修正する」
医療画像の領域において、MRIはX線やCTスキャンの能力を上回る、ソフト組織の優れた可視化能力で注目されていますしかし、MRI...
光を基にした機械学習システムは、より強力で効率的な大規模言語モデルを生み出す可能性がある
MITのシステムは、現行のシステムと比較して、エネルギー効率が100倍以上向上し、計算密度が25倍向上していることを示しています
「研究者がロボットに自己学習で食器洗い機やドアを開ける手助けをしています」
スイスのETHチューリッヒの科学者たちは、ロボットにドアや食器洗い機を開ける方法を学習させるための「最小限の手動ガイダン...

- You may be interested
- マシンラーニングと最適化アルゴリズムの...
- AVFormer:凍結した音声モデルにビジョン...
- 「AIオートメーションエージェンシーのリ...
- 大規模な言語モデルによるレッドチーミング
- CLIPSegによるゼロショット画像セグメンテ...
- AI Time Journalは、「サイバーセキュリテ...
- 「2023年に注目すべきトップホームセキュ...
- 「Keras 3.0 すべてを知るために必要なこと」
- 「ChatGPTがGPT-4V(Vision)とともに視覚...
- 「David Smith、TheVentureCityの最高デー...
- 「大規模な言語モデルを使ったフェイクニ...
- 「金融業界におけるAIの進出:自動取引か...
- Apache Beamパイプラインの作成でのMap、F...
- データ再構築の革命:広範な情報検索にお...
- 「デバイス内AIの強化 QualcommとMetaがLl...
Find your business way
Globalization of Business, We can all achieve our own Success.