複数の画像やテキストの解釈 Editors Pick - Section 61
「フォンダンAIは、クリエイティブ・コモンズ・ライセンスに基づいた画像テキストのペアデータセット、フォンダン-25Mを公開しました」
大量のデータの処理と分析を行うことを大規模データ処理と呼びます。これには有益な洞察の抽出、情報に基づいた意思決定、複...
「POCOと出会う:3D人体姿勢と形状推定のための画期的な人工知能フレームワーク」
写真や動画から3D人体のポーズと形状(HPS)を推定することは、現実世界の設定で人間のアクションを再構築するために必要です...
この人工知能による調査研究は、医療領域への大規模言語モデルの包括的な概要を提供します
このコンテンツは購読者のみ対象です 利用規約プライバシーポリシー 自然言語処理(NLP)システムは、音声認識、メタファー処...
このAI研究は、FireActを提案しますこれは、複数のタスクとエージェントの手法からの軌跡を使用して、言語モデルを微調整するための新しい人工知能の手法です
ファインチューニングされた言語モデルは、しばしば言語エージェントを作成する際に軽視され、特にGoogle検索APIを使用して質...
アップルとCMUの研究者が新たなUI学習者を披露:連続機械学習を通じてアプリのアクセシビリティを革新
機械学習は、さまざまな分野でますます統合されています。その普及は、ユーザーインターフェイス(UI)の世界を含むすべての...
「xVal」というものに出会いましょう:科学応用のために数字を言語モデルにエンコードするための継続的な方法で、任意の数字を表すために単一のトークンだけを使用します
大規模言語モデルの領域において、ひとつの迷惑な問題が浮かび上がっています。これらのモデルは多くの言語に基づくタスクを...
「多言語AIは本当に安全なのか?低リソース言語における大規模言語モデルの脆弱性を明らかにする」
GPT-4は、方針や倫理的な制約に反する要求に対して、「ごめんなさい、それには対応できません」と答えることをデフォルトにし...
Google AIは、屋外での人間の視点によるシーン理解のためのマルチ属性ビデオデータセットであるSANPOを導入しました
自動運転などのタスクにおいて、AIモデルは道路や歩道の3D構造だけでなく、道路標識や信号機を識別・認識する必要があります...
このAIの論文は、テキスト変換グラフとして言語モデルパイプラインを抽象化するプログラミングモデルであるDSPyを紹介しています
言語モデル(LM)は、リサーチャーにデータを少なく使用し、より高度な理解レベルで自然言語処理システムを作成する能力を与...
「取得した文書の圧縮は言語モデルのパフォーマンスを向上させることができるのか?このAIの論文では、圧縮と選択的な拡張によって検索増強型LMを改良するためのRECOMPを紹介しています」
計算リソースを管理しながらパフォーマンスを最適化することは、ますます強力な言語モデルの時代における重要な課題です。テ...

- You may be interested
- AIはお気に入りの食べ物を欲求することが...
- 「機械学習に人間のミスを組み込む」
- 強化学習の基礎 — TD(λ)と3つの有名な名前
- 化学プロセス開発のためのモデルフリー強...
- 「ChatGPTのコピーライターへの影響:AIと...
- UC Berkeleyの研究者たちは、ディープラー...
- 「DENZAはWPPと協力し、NVIDIA Omniverse ...
- 「2023年のトップ12のAI音楽生成器」
- インデータベース分析:SQLの解析関数の活用
- 「AIが生成したドレイクの曲がグラミー賞...
- 「DifFaceに会ってください:盲目の顔の修...
- DSPyの内部:知っておく必要のある新しい...
- 大規模言語モデル(LLM)のファインチュー...
- ML MonorepoのPantsでの組織化
- 「テスラ、『不十分な』自動運転安全制御...
Find your business way
Globalization of Business, We can all achieve our own Success.