複数の画像やテキストの解釈 AI研究 - Section 50
AI 研究とイノベーションの最前線に留まります
研究者たちは、肩越しに画面をのぞき見する人々から身を守るためのスクリーン保護システムを開発しました
「Eye-Shieldは、遠くから見られた場合にデバイスの画面をぼかす革新的なピクセル化方式を使用しており、ショルダーサーフィ...
このAI研究は、多モーダル大規模言語モデル(LLM)の言語生成能力を受け継ぐ大規模言語指示セグメンテーションアシスタントであるLISAを紹介しています
コーヒーを飲みたいと思った場合、ロボットに作ってもらうように指示することを想像してください。指示には「コーヒーのカッ...
「AIがPowerPointと出会う」
この記事では、2023年5月のSnowflake SummitのStreamlit Hackathonで3位を獲得したオープンソースプロジェクトである「Instan...
腫瘍の起源の解読:MITとDana-Farber研究者が機械学習を活用して遺伝子配列を分析する方法
MITとDana-Farber Cancer Instituteの画期的な共同研究により、機械学習の力ががん治療における困難な課題に取り組むために活...
AIは人間過ぎるようになったのでしょうか?Google AIの研究者は、LLMsがツールのドキュメントだけでMLモデルやAPIを利用できるようになったことを発見しました!
人工知能が地球を支配しようとする現代において、大規模な言語モデルは人間の脳により近づいています。Googleの研究者たちは...
「UCLA研究者がGedankenNetを紹介:物理法則や思考実験から学ぶ自己教示AIモデルが計算機画像処理を進化させる」
深層学習の最近の進展は、計算画像処理、顕微鏡、ホログラフィ関連の分野に大きな影響を与えています。これらの技術は、バイ...
Google AI Researchは、正確な時空間の位置情報と密に関連付けられた意味的に正しい豊富なビデオの説明を取得する注釈手法であるVidLNsを提案しています
ビジョンと言語の研究は、最近、特に静止画とそれに対応するキャプションの関連を確立するデータセットにおいて、著しい進展...
ETHチューリッヒの研究者が、バイオミメティックな腱駆動式ファイブハンドを紹介:高次元自由度の3Dプリンタ対応設計で、器用な手の回転スキルを持つ
従来のモデルベースの制御手法では、コントローラーはロボットの動的モデルと直接的に対話します。最近の研究では、ロボット...
拡張版:NVIDIAがビデオ編集のためのMaxineを拡大し、3D仮想会議の研究を披露
プロフェッショナル、チーム、クリエイターなどは、NVIDIA Maxineの助けを借りて、標準のマイクやウェブカメラを使用しても高...
Airbnbの研究者がChrononを開発:機械学習モデルの本番用機能を開発するためのフレームワーク
機械学習の絶え間なく進化する風景において、特徴管理はAirbnbのMLエンジニアにとって重要な課題となっています。彼らはさま...

- You may be interested
- 「機械学習が位置データ産業において革命...
- AIはモバイルネットワークをより効率的にする
- テンセントAIラボは、検索補完された言語...
- PageRankアルゴリズム:詳細な概要
- 「ラマ-2、GPT-4、またはクロード-2;どの...
- 大規模な言語モデルの理解:(チャット)G...
- 自然言語処理のための高度なガイド
- 「1または0へ:画像分類におけるピクセル...
- 「AVIS内部:Googleの新しい視覚情報検索L...
- 「生成型AIのGPT-3.5からGPT-4への移行の...
- インテルのサファイアラピッズを使用してP...
- 「ユーレカ!NVIDIAの研究によるロボット...
- 東京理科大学の研究者は、材料科学におけ...
- マイクロソフトのボスは、AIが支配するこ...
- Amazon Kendraを使用して保険請求をインテ...
Find your business way
Globalization of Business, We can all achieve our own Success.