Search Results ML Commons

「MLCommonsがAIモデルを実行するための新しいベンチマーク速度テストを公開しました」

月曜日、AIのベンチマークグループであるMLCommonsが、最高のハードウェアがAIモデルをどれくらい高速に実行できるかを判断するための新しいテストの結果を発表しましたReutersによると、このテストのトップパフォーマーはNvidiaのチップでしたテストは大規模な言語...

MLCommonsは、臨床効果を提供するためのAIモデルのベンチマークを行うためのオープンソースプラットフォームであるMedPerfを紹介します

AIモデルの有効性を大規模かつ多様な実世界データセットで評価することは、医療AIの臨床翻訳において重要です。MLCommonsというオープンな国際エンジニアリングコミュニティが発表したオープンベンチマーキングプラットフォーム「MedPerf」は、患者のプライバシーを保護し、法的および規制上の懸念を最小限に抑えながら、幅広い実世界医療データでAIモデルを効果的に評価し、臨床的な有効性を提供するために開発されました。医療AIモデルは、可能な臨床設定の小さなサブセットのデータで訓練された場合、特定の患者集団に対して意図しないバイアスを持つことがあります。一般化能力の欠如により、医療AIは実世界での効果が低いかもしれません。しかし、プライバシー、法的、規制上の考慮事項により、データ所有者はより大規模かつ多様なデータセットへのモデル訓練のアクセスをためらっています。MedPerfは、世界中のデータをAI研究者に便利かつ安全にアクセス可能にすることで、バイアスを排除し、一般化能力と臨床的な影響力を向上させることで、医療AIを強化します。患者データへのアクセスがない状況下で、MedPerfは医療機関が簡素化された人間監視方式でAIモデルを評価および検証できるようにします。医療AIモデルは、データ供給業者によってリモートでインストールおよびレビューされ、プラットフォームの分散評価によって可能になります。患者情報のプライバシーに関する懸念が軽減され、信頼が強化され、これらすべてが医療関係者間のより良い連携に貢献します。 MedPerfは、同じ共同作業者とともに数多くのAIモデルの評価を時間ではなく数か月で行うことができます。この効果は、最大の連邦実験である脳腫瘍分割（FeTS）チャレンジで示されました。FeTSチャレンジでは、6つの大陸の32のサイトで41の異なるモデルをMedPerfで評価しました。さらに、学術的な医療研究を反映した一連のパイロット試験によって、MedPerfの有効性が確認されました。これらの試験では、脳腫瘍、膵臓、手術ワークフローの段階などがカバーされました。その結果は、連邦評価ベンチマークが誰もが利用可能なAIを活用した医療ケアに向けた進展に役立つことを確認しています。 MedPerfは、利用性、適応性、パフォーマンスの観点で、fast.aiや他の広く利用されているMLライブラリの普及を促進するために、推奨しています。Microsoft Azure OpenAI Services、Epic Cognitive Computing、HF推論ポイントなどがサポートされるAPI専用およびプライベートAIモデルの一部です。 MedPerfは元々放射線学のために設計されましたが、バイオ医学の任意の分野に適用できる汎用プラットフォームです。MedPerfは、MLパイプラインの構築を簡素化するGaNDLFという姉妹プロジェクトにより、デジタル病理学やオミクスなど、さまざまな活動をサポートできます。データエンジニアリングのギャップを埋め、開発者に最先端の事前学習済みCVおよびNLPモデルへのアクセスを提供するために、MedPerfはPathMLやSlideFlow、Spark NLP、MONAIなどの特殊なローコードライブラリの例を作成しています。チームは、自分たちの作業が医療AIへの信頼を高め、臨床設定でのMLの普及を加速し、最終的には医療AIが各患者に合わせたケアを提供し、医療費を削減し、医師と患者の生活の質を向上させることを願っています。

「創発的AIのためのガードレール構築への責任あるアプローチ」

「私たちは、創発型人工知能にガードレールを築く方法の一部を共有しています」

パスライトのCTO兼共同創設者、トレイ・ドイグのインタビューシリーズ

トレイ・ドイグは、パスライトの共同創設者兼CTOですトレイは、IBM、クリエイティブ・コモンズ、Yelpでエンジニアとして働いた経験を持つ、テック業界で10年以上の経験を持っていますTreyは、Yelp Reservationsのリードエンジニアであり、SeatMeの機能をYelp.comに統合する責任を負っていましたTreyはまた、SeatMeウェブアプリケーションの開発を率いました...

Pythonの地図を使って貿易流をビジュアライズする – 第1部：双方向貿易流マップ

商品やサービスの交換は、それらの対応する価値と引き換えに私たちの日常生活の重要な一部です同様に、国々はさまざまな種類の貿易関係を築いています

マシンラーニングにおける線形回帰の幾何学的解釈と古典統計学との比較

上記の画像は、最小二乗法（OLS）または線形回帰（古典統計学では同義的に使用される言葉）の幾何学的解釈を示しています見ている内容を解説しましょう...

「AIがインターネットを食べた年」

2023年を私たちがロボットとコミュニケーションを取り、創造し、ごまかし、協力する年と呼ぶことにしましょう

次元性の祝福？！（パート1）

「これらの問題の1つまたは複数について、慎重に選ばれた科学者のグループが夏に一緒に取り組めば、重要な進展が期待できると私たちは考えています」と提案は述べましたジョンはまだ知りませんでしたが...

SetFitABSA SetFitを使用したFew-Shotアスペクトベースの感情分析

SetFitABSAは、テキスト内の特定の側面に対する感情を検出する効率的な技術です。 Aspect-Based Sentiment Analysis (ABSA)は、テキスト内の特定の側面に対する感情を検出するタスクです。例えば、「この電話は画面が素晴らしいですが、バッテリーは小さすぎます」という文では、側面の用語は「画面」と「バッテリー」であり、それぞれに対する感情極性はPositiveとNegativeです。 ABSAは、さまざまなドメインの製品やサービスの顧客フィードバックを分析して貴重な情報を抽出するために、組織によって広く使用されています。しかし、ABSAのためのラベル付けトレーニングデータは、トレーニングサンプル内で側面を手動で細かく識別する必要があるため、手間のかかる作業です。 Intel LabsとHugging Faceは、ドメイン固有のABSAモデルのfew-shotトレーニングのためのフレームワークであるSetFitABSAを紹介しています。SetFitABSAは、few-shotシナリオでLlama2やT5などの生成モデルに比べて競争力があり、さらに優れた性能を発揮します。 LLMベースの手法と比較して、SetFitABSAには次の2つのユニークな利点があります: 🗣 プロンプトが不要です: LLMを使ったfew-shot in-context学習では、結果がもろくなり、表現に敏感になり、ユーザーの専門知識に依存する手作りのプロンプトが必要です。SetFitABSAは、ラベル付けされた少数のテキスト例から直接豊かな埋め込みを生成することで、プロンプトを完全に不要とします。 🏎 高速トレーニング: SetFitABSAは、わずかなラベル付きトレーニングサンプルのみを必要とします。さらに、専門のタグ付けツールを必要としないシンプルなトレーニングデータ形式を使用します。これにより、データのラベリングプロセスが迅速かつ容易になります。このブログ記事では、SetFitABSAの動作方法と、SetFitライブラリを使用して独自のモデルをトレーニングする方法を説明します。では、さっそく見ていきましょう！どのように機能しますか？ SetFitABSAの3つのステージからなるトレーニングプロセス SetFitABSAは3つのステップで構成されています。第1ステップでは、テキストから側面候補を抽出し、第2ステップでは、側面候補を側面または非側面として分類し、最終ステップでは抽出された各側面に感情極性を関連付けます。第2ステップと第3ステップはSetFitモデルに基づいています。トレーニング 1. 側面候補の抽出…

上海人工知能研究所とMITの研究チームが、階層的に制御された再帰ニューラルネットワーク（RNN）の開発を発表しましたこれは効率的な長期依存性モデリングにおける新たなフロンティアです

上海人工知能研究所とMIT CSAIの研究者によって開発された階層的ゲート付き再帰ニューラルネットワーク（HGRN）技術は、線型RNNに忘却ゲートを組み込むことで、シーケンスモデリングの向上の課題に取り組んでいます。目的は、上位層が長期依存関係を捉える一方、下位層が短期依存関係に焦点を当てることを可能にし、特に非常に長いシーケンスの処理を効果的に行うことです。この研究では、並列トレーニングと長期依存性の能力によるトランスフォーマーの優位性をシーケンスモデリングにおいて探求しており、線型RNNを使用した効率的なシーケンスモデリングに対する再興にも注目しています。特に、忘却ゲートの重要性を強調しています。長いシーケンスに対して自己注意モジュールの代わりに線型再帰と長い畳み込みの代替手法を考慮し、長い畳込みの課題を明示しています。RNNの長期依存性モデリングとゲートメカニズムの制約も取り上げられています。シーケンスモデリングは、自然言語処理、時系列分析、コンピュータビジョン、音声処理など、さまざまな領域で重要です。トランスフォーマーの登場前には、RNNが一般的に使用されていましたが、トレーニングが遅く長期依存関係のモデリングには課題がありました。トランスフォーマーは並列トレーニングに優れていますが、長いシーケンスに対して二次時間の複雑性を持っています。この研究では、効率的なシーケンスモデリングのためのHGRNを提案しています。これは、トークンとチャネルのミキシングモジュールからなるスタックされたレイヤーで構成されています。線型再帰レイヤー内の忘却ゲートは、上位層での長期依存性のモデリングと下位層での局所依存性を可能にします。トークンミキシングモジュールは、状態空間モデルに着想を得た出力ゲートと射影を組み込んでいます。ゲートメカニズムと動的減衰率は勾配消失の問題に対処します。言語モデリング、画像分類、長距離ベンチマークの評価により、HGRNの効率と効果を示しています。提案されたHGRNモデルは、言語モデリング、画像分類、長距離領域ベンチマークで優れた性能を発揮します。バニラトランスフォーマー、MLPベース、RNNベースの手法よりも優れた性能を示し、オリジナルトランスフォーマーと同等の性能を言語タスクで発揮します。Commonsense ReasoningやSuper GLUEなどのタスクでは、より少ないトークンを使用してトランスフォーマーベースのモデルと同等の性能を発揮します。HGRNはLong Range Arenaベンチマークで長期依存関係の扱いにおいて競争力のある結果を達成します。ImageNet-1K画像分類では、HGRNはTNNやバニラトランスフォーマーなどの従来の手法を上回ります。結論として、HGRNモデルは言語モデリング、画像分類、長距離ベンチマークなど、さまざまな課題やモダリティで高い効果を発揮しています。忘却ゲートとその値の下限の使用により、長期依存関係の効率的なモデリングが可能です。HGRNは、バニラトランスフォーマー、MLPベース、RNNベースの手法のバリエーションに比べて言語タスクで優れた性能を発揮し、ImageNet-1K画像分類ではTNNやバニラトランスフォーマーなどの手法と比較して優れた性能を示しています。 HGRNモデルの将来の展望には、様々な領域や課題での広範な探索が含まれ、その汎用性と効果を評価します。さまざまなハイパーパラメータとアーキテクチャの変化の影響を調査することで、モデルの設計を最適化します。追加のベンチマークデータセットの評価と最先端のモデルとの比較により、性能をさらに検証します。注意力や他のゲートメカニズムの組み込みなど、長期依存性のキャプチャを向上させるための改善点を探求します。さらに長いシーケンスの拡張性とパラレルスキャン実装の利点も調査します。解釈可能性と説明可能性のさらなる分析により、意思決定の洞察を得て透明性を向上させることを目指します。

Learn more about Search Results ML Commons