複数の画像やテキストの解釈 Applications - Section 16
このAIペーパーは、さまざまなタスクでChatGPTに追いついたり超えたりすると主張するオープンソースの大規模言語モデルの詳細なレビューを公開しています
昨年のChatGPTのリリースは、人工知能コミュニティを驚かせました。最新の大規模言語モデルであるGPTのトランスフォーマーア...
「SceneTexをご紹介:屋内シーンにおける高品質でスタイル一貫性のあるテクスチャ生成のための革新的なAI手法」
高品質の3Dコンテンツ合成は、自動運転、ロボットシミュレーション、ゲーム、映画製作、将来のVR / ARシチュエーションなど、...
「Perplexity(パープレキシティ)が2つの新たなオンラインLLMモデルを発表:『pplx-7b-online』と『pplx-70b-online』」
パープレキシティ(Perplexity)は、革新的なAIスタートアップとして、情報検索システムを変革する解決策を発表しました。こ...
ニューヨーク大学とMetaの研究者が、「Dobb-E」という家庭用ロボット操作のためのオープンソースかつ汎用フレームワークを紹介した
NYUとMetaの研究者チームは、DobbEという高度に適応性のあるシステムを開発し、家庭環境におけるロボットの操作学習の課題に...
「PepCNNという名のディープラーニングツールを紹介します:シーケンス、構造、言語モデルの特徴を使用してタンパク質中のペプチド結合残基を予測するためのものです」
Griffith University、RIKEN Center for Integrative Medical Sciences、Rutgers University、および東京大学の研究者によっ...
「3Dシーン表現の境界を破る:新しいAIテクニックによる高速かつ効率的なレンダリングとストレージ要件の削減によるゲームの変革」
NeRFは、連続的な3Dボリュームとしてシーンを表します。離散的な3Dメッシュやポイントクラウドの代わりに、シーン内の任意の3...
「マイクロソフトの研究者が提案するMAIRA-1:胸部X線写真(CXR)から放射線報告書を生成するための放射線学専用マルチモーダルモデル」
Microsoftの研究チームは、MAIRA-1と呼ばれる放射線学に特化したマルチモーダルモデルを開発することで、胸部X線画像(CXR)...
「Meditronを紹介:LLaMA-2に基づいたオープンソースの医学用大規模言語モデル(LLM)のスイート」
大規模言語モデル(LLMs)の最もエキサイティングな応用の1つは、医学分野であり、その使用例には医学研究、カスタマイズされ...
ノースイースタン大学およびMITのこのAIの論文では、拡散モデルにおける画像生成制御のための解釈可能なコンセプトスライダーが開発されています
芸術的なテキストから画像までの拡散モデルの利用者は、通常、生成された画像に表現される視覚的特徴と概念において細かい制...
Google DeepMind(グーグルディープマインド)が「GNoME(グノーム)」を発表:新素材の安定性を予測し、探索の速度と効率を劇的に向上させる新しいディープラーニングツール
無機結晶は、コンピュータチップ、バッテリー、太陽電池など、現代の多くの技術にとって不可欠です。安定した結晶は、細心の...
- You may be interested
- 「データサイエンスのスキルを磨くための1...
- 「LlamaIndex:カスタムデータで簡単にLLM...
- 「自然界がコンピュータビジョンの未来を...
- vLLMについて HuggingFace Transformersの...
- 「現実の応用における一般線形モデルの自...
- 「データエンジニアリングの本」
- 「2023年に知っておく必要のあるトップ10...
- 「生成型AIのGPT-3.5からGPT-4への移行の...
- 「教科書で学ぶ教師なし学習:K-Meansクラ...
- このAI論文では、「MotionDirector」とい...
- Pythonで美しく(かつ有用な)スパゲッテ...
- モデルインサイトの視覚化:ディープラー...
- ACM(Association for Computing Machiner...
- スタンフォードの研究者たちは、「EquivAc...
- LLM(Language Model)をアプリケーション...
Find your business way
Globalization of Business, We can all achieve our own Success.