Learn more about Search Results AI  - Page 11

「Microsoft AI Researchは、Pythonで直接ONNXモデルを作成するためのONNXスクリプトライブラリをオープンソース化しました」

機械学習の常に進化する風景の中で、ONNX(Open Neural Network Exchange)モデルは重要な技術として登場し、多様なハードウェアプラットフォームとランタイム環境にわたる標準化された柔軟な表現を提供しています。クラウドベースのスーパーコンピュータからスマートフォンやWebブラウザなどのリソース制約のあるエッジデバイスまで、ONNXモデルはスペクトラム全体でシームレスな実行を可能にします。 ONNXの力の中心は、通常Protobuf形式を使用して表されるグラフ形式です。しかし、ONNXは単なるグラフ表現以上のものです。それは一連の簡潔なプリミティブオペレータで構成されており、ランタイムとハードウェアベンダーによって普遍的に実装されています。広範なエコシステムを維持し、オーバーヘッドを最小限に抑えるため、ONNXは意図的にオペレータ数を低く保ち、ONNX関数を通じてモジュール性を促進します。 機械学習モデルはしばしばPyTorchやTensorFlowなどの高レベルフレームワークを使用して構築されますが、それらを本番環境に展開するには移行が必要です。モデルはフレームワークが提供するツールを使用してONNXにエクスポートされ、その後、Oliveなどのツールを使用して特定のターゲットに最適化されます。 ONNXモデルを直接作成するためのマイクロソフトチームによって設計された革新的なオープンソースライブラリであるONNX Scriptに出会ってください。ONNX Scriptは、クリーンで独自のPython構文を優先し、ONNXネイティブの関数を通じて合成性を促進します。このアプローチにより、モデルの作成が簡素化され、既存のPythonツールとの統合が容易になり、可読性と生産性が向上します。重要なことは、ONNX Scriptが将来のPyTorch ONNXエクスポータの基盤であり、TorchDynamoをサポートしているということです。 ONNX Scriptの登場前は、ONNXモデルの作成には仕様とシリアル化形式の深い理解が必要でした。ヘルパーAPIがこのプロセスを改善しましたが、ONNXの複雑さに精通している必要がありました。ONNX Scriptは、Pythonに深く埋め込まれるという異なるアプローチを取ります。 1. オペレータのための型付きAPI:ONNX Scriptは、opset 19を含む現在の186のすべてのオペレータのための型付きAPIを提供します。これにより、標準のPythonツール、リンター、IDEが貴重なフィードバックを提供し、正確性を強制することができます。 2. 自然なPython構文:ONNX Scriptは、条件分岐、ループ、バイナリおよび単項演算子、スライシングなど、Pythonの言語機能をサポートしています。Pythonでは、`a + b`のような式は、ONNX Scriptでは`Add(a,…

「AI Time Journalが「AIにおけるSEOのトレンド2023」eBookを紹介します:SEOの将来に関する専門家の洞察」

8月9日、アメリカ、サンフランシスコ - AI Time Journalは、人工知能分野でのリーディングな出版物として、最新のeBook「AI in SEO Trends 2023」を紹介することを誇りに思っていますこのeBookは、50以上の業界の専門家とリーダーの知恵を集め、人工知能(AI)がSEOに与える変革的な影響についての貴重な洞察を提供しています... AI Time Journalは「AI in SEO Trends 2023」eBookを紹介します:SEOの未来に関する専門家の洞察をご覧ください»

Google AI Researchは、正確な時空間の位置情報と密に関連付けられた意味的に正しい豊富なビデオの説明を取得する注釈手法であるVidLNsを提案しています

ビジョンと言語の研究は、最近、特に静止画とそれに対応するキャプションの関連を確立するデータセットにおいて、著しい進展を遂げている動的に進化する分野です。これらのデータセットでは、キャプション内の特定の単語を画像内の特定の領域に関連付けるため、さまざまな方法が使用されています。最新のローカライズド・ナラティブ(ImLN)によって提案される興味深いアプローチは、魅力的な解決策を提供します。アノテーターは画像を口頭で説明しながら、同時にマウスカーソルを話題の領域の上に移動させます。この音声とカーソルの移動の二重プロセスは、自然なコミュニケーションを模倣し、各単語に対して包括的な視覚的基盤を提供します。ただし、静止画は時間の一瞬しか捉えていません。動画への注釈付けの可能性は、複数のエンティティやオブジェクトが動的に相互作用するイベントを示す完全なナラティブを描くため、さらに魅力的です。 この時間のかかる複雑なタスクに対処するために、ImLNを動画に拡張するための強化された注釈付けアプローチが提案されています。 提案された技術のパイプラインは以下に示されています。 この新しいプロトコルにより、アノテーターは制御された環境でビデオのナラティブを作成することができます。アノテーターはまずビデオを注意深く観察し、主要なキャラクター(「男性」や「ダチョウ」など)を特定し、各キャラクターの重要な瞬間を表す鍵フレームを選択します。 その後、各キャラクターごとにナラティブが構築されます。アノテーターは口頭でキャラクターの関与するさまざまなイベントを述べながら、キーフレームの上にカーソルを移動させて関連するオブジェクトとアクションを強調します。これらの口頭の説明には、キャラクターの名前、属性、特にアクションが含まれます。これには、他のキャラクターとの相互作用(例:”ダチョウと遊ぶ”)や無生物のオブジェクトとの相互作用(例:”食べ物のカップを掴む”)も含まれます。包括的なコンテキストを提供するために、アノテーターは別のフェーズで背景の簡潔な説明も行います。 キーフレームを効果的に利用することで、時間制約がなくなり、各キャラクターに対して異なるナラティブを作成することが可能になり、複雑な状況を解明することができます。この解明は、複数のキャラクターが相互におよび多数の受動的なオブジェクトと相互作用する多面的なイベントの包括的な描写を容易にします。ImLNと同様に、このプロトコルは各単語を局所化するためにマウスの軌跡セグメントを活用しています。また、この研究では、前の研究の成果を超える正確な局所化を確保するために、いくつかの追加措置も実装されています。 研究者は、Video Localized Narratives (VidLNs) を使用して異なるデータセット上で注釈付けを行いました。考慮されたビデオは、さまざまなキャラクターや無生物のオブジェクトとの相互作用を特徴とする複雑なシナリオを描いており、詳細な注釈によって説明される魅力的なナラティブが生まれています。以下に例を示します。 VidLNsデータセットの深さは、Video Narrative Grounding (VNG) やVideo Question Answering (VideoQA) などのさまざまなタスクにとって堅牢な基盤を形成しています。新たに導入されたVNGの課題は、入力ナラティブから名詞を局所化し、ビデオフレーム上にセグメンテーションマスクを生成することができるテクニックの開発を必要とします。このタスクは、テキストが頻繁に多重の同一名詞を含むため、周囲の単語からの文脈的手がかりを活用した曖昧さの解消が必要であり、重要な課題です。これらの新しいベンチマークは、完全に解決されるには遠い複雑な課題ですが、提案されたアプローチは正しい方向に向けた意味のある進歩を示しています(詳細は公開された論文を参照してください)。 これは、ビジョンと言語をつなぐ新しい形式のマルチモーダルなビデオ注釈であるVideo Localized Narrativesの概要でした。興味があり、詳細を知りたい場合は、以下に引用されているリンクを参照してください。

MONAI 生成モデル:医療画像の進歩に向けたオープンソースプラットフォーム

最近の生成型人工知能のブレークスルーにより、特に医療画像処理の分野で重要な進展が見られています。しかし、これらの生成モデルの複雑さは、実際の応用や再現性において課題を提起し、さらなる進歩を妨げています。このため、世界中の優れた機関の研究者たちが協力して、MONAI Generative Modelsというオープンソースプラットフォームを作成しました。このプラットフォームは、生成モデルの開発と展開を民主化することを目指しており、標準化されたアクセス可能なソリューションを提供することで、医療画像処理の新たなアプローチの道を開拓します。 また、AIによる医療革命のレース:Amazon vs Google vs Microsoftも要チェックです。 医療画像の新たな時代:MONAI Generative Models MONAI Generative Modelsプラットフォームは、さまざまな医療画像の応用において、研究者や開発者が生成モデルの構築と活用を簡素化することを目指しています。標準化されたフレームワークを提供することで、プラットフォームは新しいアプローチの評価を促進し、分野の進歩を支援します。 また、2023年の医療における機械学習とAIも要チェックです。 5つの画期的な研究で示される多様性 研究チームは、MONAI Generative Modelsの潜在能力を示す5つの包括的な研究を実施しました。これらの研究では、分布外検出、画像変換、超解像、MRI再構成などのさまざまな医療画像の応用をカバーし、2Dおよび3Dのシナリオで異なるモダリティと解剖領域に対応するプラットフォームの適応性を示しています。 また、GoogleのMed-PaLM 2は最も進んだ医療AIになる予定です。 潜在拡散モデルで領域を拡大 MONAIプラットフォームにおける最先端のモデルの1つである潜在拡散モデルの性能を、さまざまなデータセットで評価しました。さまざまな体型や活動を持つ異なる被験者を反映しており、比較研究や革新を促す柔軟性があります。 また、Image-to-Image…

「OpenAIを任意のLLM(Language Model)と交換し、すべてを1行で行うことを想像してください!Genoss GPTに会ってください:OpenAI SDKと互換性のあるAPIで、GPT4ALLなどのオープンソースモデルをベースにして構築されています」

Genoss GPTは、何千行ものコードとテキストの何千行もの改善を経て洗練された最新の言語モデルです。そのため、従来の言語モデルよりもより整理された、より情報的で、より創造的なコンテンツを生成することができます。Genossは、GPT 3.5や4のようなプロプライエタリなOpenAIモデルをGPT4ALLのような無料のモデルで置き換えるための革新的なオープンソースプロジェクトです。 Genoss GPTはまだ開発中ですが、初期の結果は期待されています。それは、会話型チャットボットの作成、オリジナルのフィクションの制作、外国語の解釈などに活用されています。 Genoss GPTは複雑なクエリを理解し、回答する能力が非常に注目されています。”自然の美しさについての詩を書いてください”というプロンプトを与えられた場合、システムは両方の基準を満たす作品を生成することができます。 Genoss GPTはまだ開発中ですが、人間とコンピュータのインタラクションにおいて画期的な変化をもたらす可能性があります。それは、チャットボット、ライティングアプリケーション、翻訳プログラムに組み込まれ、それらをよりスマートで効果的なものにすることができるかもしれません。 Genoss GPTの利点には以下があります: Genoss GPTは、従来の言語モデルが生成するテキストよりもより一貫性があり情報量が多いテキストを生成します。その優れた言語理解能力は、大量のテキストとコードの訓練によるものです。 より創造的なテキストを生成することも、Genoss GPTの強みです。これは、単一の形式だけでなく、さまざまな形式の創造的な文章のパターンを認識するように訓練されているためです。 Genoss GPTは複雑なクエリを理解し、回答することができるため、優れた選択肢となります。これは、従来のモデルよりも言語理解能力が優れているためです。 Genoss GPTの使用例: Genoss GPTは、よりスマートなチャットボットの開発に活用される可能性があります。これにより、チャットボットはユーザーとより自然な会話を行い、より関連性の高いデータを提供することができるでしょう。 ライター向けツール:Genoss GPTは、より効果的なライティング支援ツールの開発に活用することができます。これにより、ユーザーはよりオリジナルで洞察に富んだ文章を作成することができます。 Genoss…

「IBM、HuggingFace、そしてNASAがWatsonx․ai Foundation Modelをオープンソース化 NASA初の公開可能なAI基盤モデルであり、HuggingFace上で最大の地理空間モデル」

IBMとオープンソースのAIプラットフォームであるHugging Faceは、watsonx.ai地理空間基盤モデルのリリースを共同で発表しました。この驚くべきAIモデルは、NASAの衛星データを使用して開発され、気候科学と地球研究の重要な進歩を表しています。このパートナーシップの主な目的は、AIへのアクセスの民主化を促進し、これらの重要な領域での加速度的なイノベーションを推進することです。 気候科学の領域は、環境条件の絶え間ない変化により、最新のデータにアクセスするという切迫した課題に直面しています。2024年までに新しいミッションからのデータが250,000テラバイトに達すると予想されているにもかかわらず、これらの広範なデータセットの分析は、科学者や研究者にとって困難な課題のままです。この懸念に対処するために、IBMは今年初めにNASAとの宇宙法協定の一環として、地理空間データのためのAI基盤モデルを開発しました。 地理空間基盤モデルをHugging Face上で利用可能にすることで、オープンソースのAIモデルの主要な提唱者であるこのコラボレーションは、AIコミュニティ内でのより大きな協力と情報共有を促進することを目指しています。この動きにより、地球に利益をもたらす影響力のあるソリューションの開発が迅速化することが期待されています。 地理空間基盤モデルは、1年間にわたって米国本土全体でハーモナイズド・ランドサット・センチネル2衛星データ(HLS)で共同でトレーニングされました。このモデルは、既存の手法に比べて15%の向上を示し、ラベル付きデータの半分しか必要としませんでした。このモデルは、森林伐採の追跡、作物収量の予測、温室効果ガスの検出と監視など、さまざまなタスクにさらなる微調整を行うことができます。IBMとNASAはまた、時系列セグメンテーションや類似性研究などの応用についてClark大学と協力しています。 IBMの地理空間モデルは、さまざまなタスクのためにAIモデルを作成しトレーニングするための同社の広範な取り組みの一環として、基盤モデル技術を活用しています。7月には、信頼性のあるデータを使用して高度なAIの影響をスケールアップおよび加速化するためのAIおよびデータプラットフォームであるWatsonxを発表しました。商業版の地理空間モデルは、IBM Environmental Intelligence Suite(EIS)に統合され、今年後半にリリース予定です。 まとめると、IBMとHugging Faceのパートナーシップは、NASAの衛星データによって強化され、科学の進歩を促進し、地球の気候に対する理解を深める有望な機会を提供しています。モデルのオープンソース性は、世界中の研究者や科学者に対して、緊急の環境課題に取り組む力を与えることになるでしょう。

新しいAI研究がMONAI Generative Modelsを紹介:研究者や開発者が簡単に生成モデルをトレーニング、評価、展開できるオープンソースプラットフォーム

最新の生成型人工知能の進歩により、医療画像を含む複数の分野で新たな進展がありました。これらの生成モデルは、異常検出、画像対画像変換、ノイズ除去、磁気共鳴画像(MRI)再構築など、様々な用途において大きな可能性を持っています。しかし、これらのモデルは複雑であるため、実践化や再現性には困難が伴います。この複雑さは進捗を遅らせ、ユーザーの参入障壁を作り、確立された手法と比較して新しいアプローチの評価を妨げる可能性があります。 生成モデルの構築と展開を簡単かつ標準化するために、研究者チームはMONAI Generative Modelsというオープンソースプラットフォームを作成しました。このグループには、キングスカレッジロンドン、国立精神衛生研究所、エジンバラ大学、バーゼル大学、韓国科学技術院、NVIDIA、スタンフォード大学、マウントサイナイ医学校、ロンドン大学などの研究者が参加しました。 技術の有効性を示すために、分布外検出から画像変換、スーパーレゾリューションまで、さまざまな医療画像関連のトピックをカバーした5つの研究が説明されています。2Dおよび3Dのシナリオでさまざまなモダリティと解剖学的領域を使用してプラットフォームの適応性が示され、医療画像のさらなる発展のための新しいツールとしての潜在能力が示されています。5つの実験は以下の通りです: 提案されたモデルは新しい状況に簡単に適応でき、さまざまな状況での徹底的な比較を可能にし、初期の対象範囲を広げることができます。この品質を示すために、研究者はパッケージ内の最先端のモデルの1つである潜在拡散モデルとその能力を評価しました。このモデルは、体型や活動タイプが異なるデータセットから新しい情報を生成する能力を持っています。 潜在的な生成モデルには、圧縮モデルと生成モデルの2つの基本的な部分が含まれており、チームはこれらが非常に柔軟であることを示しています。 このシステムを使用すると、さまざまな医療画像アプリケーションで生成モデルを使用することが容易になります。チームは、通常範囲外の3D画像データの検出に適用できることを示しました。 Stable Diffusion 2.0 Upscalerメソッドを使用して、生成モデルのスーパーレゾリューションの可能性も調査しました。調査結果は、特に3Dモデルにおいて、生成モデルがスーパーレゾリューションアプリケーションに有用であることを示しています。 チームはまた、モデルがスーパーレゾリューション写真とどのように機能するかをテストしました。これにより、拡大されたテストセットの写真とそれに対応する正解画像を比較しました。これらの結果は、モデルの優れたスーパーレゾリューション能力を確認し、画像の明瞭さ向上における効率性を証明しています。 将来的には、研究者はMRI再構築などの他のアプリケーションのサポートを向上させ、モデル比較を容易にするためにより最新のモデルを組み込む予定です。これらの進展により、医療生成モデルおよびその応用分野はさらなる発展を続けるでしょう。

ダイナミックAIプロジェクト見積もり’ (Dainamikku AI purojekuto mitsumori)

現在、ほとんどの人が見積もりを使用しています顧客は、プロジェクトの結果を使用するタイミングを計画し制御するためにそれらが必要です見積もりはまた、プロジェクトマネージャーにも役立ちます...

JupyterAI 生成AI + JupyterLab

「JupyterLabは、成長中のデータサイエンティストにとって最高の仲間の一つですベテランにとっても、コードが本番環境に移る前の最も使用される遊び場の一つですそれは本当に強力で...」

「EU AI Actについて今日関心を持つべき理由」

「MLおよびAI業界で働く私たちのほとんどは、新しい規制に関する見出しを見て流し読みするでしょう新しい規制は『法律用語』というカテゴリに属しますこの用語は、どんな規制でも表現されるものです…」

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us