Search Results METEOR

「マイクロソフトの研究者が提案するMAIRA-1：胸部X線写真（CXR）から放射線報告書を生成するための放射線学専用マルチモーダルモデル」

Microsoftの研究チームは、MAIRA-1と呼ばれる放射線学に特化したマルチモーダルモデルを開発することで、胸部X線画像（CXR）のための高品質なレポートの生成問題に取り組みました。このモデルは、CXRに特化した画像エンコーダと、Vicuna-7Bに基づく微調整されたLLMを利用し、Findingsセクションに焦点を当てたテキストベースのデータ増強を行います。この研究は、課題を認識し、将来のバージョンでは現在と過去の研究情報を取り入れて情報の錯覚を減らすことを提案しています。研究で探求されている既存の手法は、PaLMやVicuna-7Bなどのマルチモーダル機能を持つLLMを使用して、胸部X線写真から叙述的な放射線学のレポートを作成することです。評価プロセスには、ROUGE-LやBLEU-4といった従来のNLPメトリックや、臨床的に関連のある側面に焦点を当てた放射線学固有のメトリックが含まれます。この研究は、所見の詳細な説明を提供することの重要性を強調しています。現在の評価手法の制約にも対処しながら、機械学習が放射線学のレポート生成において持つ可能性を示しています。 MAIRA-1の方法は、ビジョンと言語モデルを組み合わせて、胸部X線写真から詳細な放射線学レポートを生成します。このアプローチは、臨床的なレポート生成の特定の課題に対応し、品質と臨床的な関連性を測定するメトリックを使用して評価されます。研究結果は、MAIRA-1の方法が放射線学レポートの正確さと臨床的な有用性を向上させることができることを示しており、医学画像の機械学習における進歩を表しています。提案されたMAIRA-1は、胸部X線写真のための放射線学に特化したマルチモーダルモデルです。このモデルは、CXR画像エンコーダ、学習可能なアダプタ、および微調整されたLLM（Vicuna-7B）を利用して、画像と言語を融合させ、レポートの品質と臨床的な有用性を向上させます。さらに、追加のレポートのためにGPT-3.5を使用したテキストベースのデータ増強を行います。評価メトリックには、従来のNLP指標（ROUGE-L、BLEU-4、METEOR）と放射線学固有の指標（RadGraph-F1、RGER、ChexBertベクトル）が含まれ、臨床的な関連性を評価します。 MAIRA-1は、胸部X線レポートの生成において、RadCliQメトリックや放射線科医に合致した語彙メトリックの向上を示しました。モデルの性能は所見のクラスによって異なり、成功と課題が観察されました。MAIRA-1は、通常の評価手法では捉えられない微妙な不具合モードを効果的に解明し、言語上と放射線学固有の側面をカバーする評価メトリックによって示されました。MAIRA-1は胸部X線レポートの包括的な評価を提供します。まとめると、MAIRA-1は、ドメイン固有の画像エンコーダと的確かつ正確に微妙な所見を特定する能力を備えた既存のモデルを上回る、胸部X線レポートの生成において非常に効果的なモデルです。ただし、既存の手法の制約と臨床的な文脈の重要性を評価することも重要です。モデルの改善のためには、多様なデータセットと複数の画像を考慮する必要があります。 MAIRA-1の将来の発展では、GPT-3.5と前回の作業で示されているように、現在のおよび以前の研究からの情報を取り入れてレポートの錯誤を軽減することができるようになるかもしれません。クリニカルエンティティの抽出における外部モデルへの依存に対処するために、将来の取り組みでは強化学習アプローチを検討することができます。より大規模かつ多様なデータセットでの強化トレーニングや複数の画像と視点の考慮を進め、MAIRA-1の性能をさらに高めることが推奨されます。

「品質と責任について大規模な言語モデルを評価する」

生成AIに関連するリスクは広く公表されています有毒性、偏見、逸出した個人情報、幻覚は組織の評判に悪影響を与え、顧客の信頼を損ないます研究によると、バイアスや有毒性のリスクは、事前訓練された基盤モデル（FM）から特定のタスクに向けた生成AIサービスに移行するだけでなく、FMを特定のタスクに調整することによっても発生します

「Amazon SageMaker ClarifyとMLOpsサービスを使用して、LLM評価をスケールで運用化する」

ここ数年、大規模言語モデル（LLM）は類稀なる能力を持ち、テキストの理解、生成、操作が可能な優れたツールとして注目されてきましたその潜在能力は、会話エージェントからコンテンツ生成、情報検索まで広範囲にわたり、あらゆる産業を革新する可能性を秘めていますしかし、この潜在能力を生かす一方で、責任ある利用と...

「ヌガーで科学文書処理を高める」

イントロダクション自然言語処理および人工知能の分野では、科学的なPDFなどの非構造化データソースから価値ある情報を抽出する能力がますます重要になっています。この課題に対処するため、Meta AIは「Nougat」または「Neural Optical Understanding for Academic Documents」と呼ばれる最先端のトランスフォーマーベースのモデルを導入しました。Nougatは、科学的なPDFを一般的なMarkdown形式に転写するために設計されたモデルであり、Lukas Blecher、Guillem Cucurull、Thomas Scialom、Robert Stojnicによって「Nougat: Neural Optical Understanding for Academic Documents」というタイトルの論文で紹介されました。これにより、オプティカル文字認識（OCR）技術の画期的な変革が実現され、NougatはMeta AIの印象的なAIモデルの最新バージョンとなります。この記事では、Nougatの機能を探求し、そのアーキテクチャを理解し、このモデルを使用して科学的なドキュメントを転写する実践的な例を見ていきます。学習目標 Meta AIの最新トランスフォーマーモデルであるNougatを理解する。 Nougatが前任であるDonutを基に開発され、ドキュメントAIに対する最先端アプローチが導入されていることを学ぶ。…

あなたのRAGベースのLLMシステムの成功を測る方法

「リサーチ・オーグメンテッド・ジェネレーション、またはRAG、は今年登場した大規模言語モデル（LLM）の最も一般的な使用例ですテキストの要約や生成はしばしば焦点となりますが...」

ミニGPT-5：生成的なヴォケンによる交錯したビジョンと言語の生成

ここ数年、大規模言語モデル（LLM）は、自然言語処理（NLP）のブレークスルーにより、AI開発者から世界的に注目されていますこれらのモデルは、テキストの生成と理解の新たな基準を打ち立てていますしかし、テキストに対応する画像を一貫して生成することは依然として難しい課題ですこの問題に取り組むために、[…]

「2023年におけるAIをリードするさらなる13の組織」

こちらはAIの顔を変える会社の2部構成、後半ですAIは、企業、非営利団体、政府が人工知能の力を見出し、数多くの産業に急速に拡大していますでは、いくつかの会社を見てみましょう...

West 2023

テキスト生成の評価におけるベクトル化されたBERTScoreのビジュアルガイド

『AIベースのテキスト生成は明らかに主流に入ってきています自動化されたライティングアシスタントから法的文書の生成、マーケティングコンテンツの生成、メールの執筆など、様々な領域で活用されています…』

生成AIと予測AI：違いは何ですか？

人工知能（AI）は、機械に難しい仕事を実行させながら、知的な選択を行うことで、いくつかの業界を大きく変えてきました。予測型AIと生成型AIは、最もよく知られていて使われているAIの方法です。両方とも適応能力が高いですが、具体的に何を達成するために使用されるかによって、彼らの潜在的な用途と独特の利点は異なります。では、ビジネス目標に最も適した方法をどのように選ぶのでしょうか？予測型AIは過去のデータを使用して予測を行い、生成型AIは新しいデータを生成します。組織のマーケティング部門に最適な技術を決定するために、次の比較を調べてみてください：生成型AI vs. 予測型AI。生成型AIとは？生成型AIは、特定のプログラミングの制約なしに、データに基づいて予測を生成するためのソフトウェアモデルを開発することによって動作する、機械学習の進化形です。確率分布を使用してデータの基本的な傾向を理解し、要求されるたびに似たパターンを示す結果を作成します。生成型AIは、教師なしおよび半教師あり機械学習の技術を包括しています。これにより、テキスト、音声およびビデオファイル、画像、コードなどの事前存在するデータを使用して、新しい形式のコンテンツを作成することができます。主な目標は、リアルなものに非常に近い100％の本物の結果を生成することです。具体的には、AIモデルには大量の最新データが提供され、新しいコンテンツを生成するためのモデルのトレーニングが行われます。このようなモデルは、既存のデータのパターンとフレームワークを発見するためにニューラルネットワークを活用して、革新的で独自の出力を作成します。生成型AIモデルの重要な要素は、潜在空間、トレーニングデータ、および生成アーキテクチャです。データは、データの重要な特徴を組み込んだ潜在空間に圧縮して表現されます。学習の基盤となるのは、トレーニングデータであり、モデルが基本的なパターンを理解するのに役立ちます。生成モデリングを実現する構造的な要素は、生成アーキテクチャです。生成型AIモデルは、広範なデータから知見を得て独自の結果を再現することを約束します。生成型AIモデル最も使用されている生成型AIモデルは次のとおりです： GAN（生成的対抗ネットワーク） GANは、さまざまな分野で効果的に使用されています。生成器ネットワークと識別器ネットワークの2つのネットワークから構成されています。識別器は生成されたサンプルと元のサンプルを区別しようとする一方、生成器は正確なデータを模倣する方法をトレーニングします。GANは持続的なプロセスを通じて常に進化し、非常に正確な結果を生成します。 GANは、特定のドメインに関連するデータを開発するのに適しており、高品質のサンプルと少ないパターンの多様性で素早く結果を生成することができます。変分エンコーダ（VAE） VAEは、オートエンコーダと確率モデリングの力を活用して、簡単な入力表現を学習する生成モデルです。取得した分布からエンドポイントを選択することで、VAEは提供されたデータを低次元の潜在空間にエンコードすることで新しい観測を作成することができます。 VAEは、提供されたデータを潜在空間から再構築するデコーダーネットワークと、生データを潜在空間に変換するエンコーダーネットワークの2つのネットワークを開発することによって機能します。 VAEは、獲得したパターンが存在する潜在空間の各ポイントから観測を取り、トレーニングデータを模倣する新しい独自のデータセットを作成することができます。VAEの潜在領域を移動しながら新しいデータを作成する能力により、創造的な研究とさらなるデータの作成が可能になります。拡散モデル…

「ROUGEメトリクス：大規模言語モデルにおける要約の評価」

「従来のモデルにおいて使用してきた指標であるAccuracy、F1スコア、またはRecallなどは、生成モデルの結果を評価するのに役立ちませんこれらのモデルでは、...」

Learn more about Search Results METEOR