複数の画像やテキストの解釈 Applications - Section 124
UCサンタクルーズとSamsungの研究者が、ナビゲーションの決定にChatGPTのようなLLM(言語モデル)で共通センスを活用するゼロショットオブジェクトナビゲーションエージェントであるESCを紹介しました
オブジェクトナビゲーション(ObjNav)は、未知の環境で物理エージェントを事前に決められた目的のオブジェクトに案内するも...
「CLAMPに会ってください:推論時に新しい実験に適応できる分子活性予測のための新しいAIツール」
数十年にわたり、化学構造に基づいて分子の化学的、巨視的、または生物学的な特性を予測するタスクは、重要な科学的な研究課...
新しいAI研究が、転移学習のためのマルチタスクプロンプトチューニング(MPT)を紹介します
事前学習済み言語モデル(PLMs)は、フィネチューニングにより多くの下位NLPタスクで大幅に改善されています。現在のPLMsは数...
ネゲヴのベン・グリオン大学の研究者たちは、社会的規範の違反を特定するAIシステムを設計しました
社会心理学辞典によれば、社会的規範は特定の社会的文脈内で典型的かつ適切な行動を示す社会的に決定された基準です。これら...
「プリズマーに会いましょう:専門家のアンサンブルを持つオープンソースのビジョン-言語モデル」
最近の多くのビジョン言語モデルは、非常に注目すべき多様な生成能力を示しています。しかし、通常、それらは膨大なモデルと...
中国からの新しいAI研究は、機械学習の手法と質問を組み合わせることで、指導者と学生の関係のつながりに新たな次元を明らかにします
学生と指導教員の関係は創造性に深い影響を与えます。調和の取れた学生と指導教員の関係は知識の伝達とイノベーションの基盤...
「アニメート・ア・ストーリー:高品質で構造化されたキャラクター主導のビデオを合成する、検索補完型ビデオ生成によるストーリーテリング手法による出会い」
テキストから画像へのモデルは最近注目を集めています。生成型人工知能の導入により、GPTやDALL-Eなどのモデルはリリース以来...
「Human Sketchesが物体検出にどのような役割を果たすことができるのか?スケッチベースの画像検索に関する洞察」
先史時代から、人類はアイデアを伝えたり記録したりするためにスケッチを使用してきました。言語の存在にもかかわらず、スケ...
スタンフォード大学の研究者たちは、安定した拡散に基づき、大規模な胸部X線および放射線データセットで微調整された「RoentGen」という人工知能(AI)モデルを開発しました
最近、高い忠実度、多様性、解像度を持つ画像を生成することが可能なデノイジング拡散モデルの一部である潜在的拡散モデル(L...
「人間の知能の解読:スタンフォードの最新のAI研究は、生来の数の感覚は学びのスキルなのか、自然の贈り物なのかを問いかける」
任意の数量を解読する能力は、数の感覚と呼ばれます。数の感覚は数学的認識において重要です。大量のものを小さなグループに...
- You may be interested
- データのクレンジングを通じたデジタルト...
- 「ChatGPT Visionをデータ分析に活用する5...
- ボット、詐欺ファームがウェブトラフィッ...
- スウィン・トランスフォーマー | モダンな...
- 「テキスト分類タスクについての迅速なエ...
- 技術と金融の交差点における成功
- 「テキストから言葉以上へ」 翻訳結果です
- 「Amazonが処方せんのドローン配送をテス...
- プロンプトエンジニアリング:検索強化生...
- Python例外テスト:クリーンで効果的な方法
- ハギングフェイスがSafeCoderを導入:エン...
- AIレポート:スタンフォードの研究者がテ...
- 実験から展開へ MLflow 101 | パート01
- マイクロソフトの研究者が「InstructDiffu...
- 「飛躍的進展:UCCの研究者が量子コンピュ...
Find your business way
Globalization of Business, We can all achieve our own Success.