Search Results Yi

機械学習を革新する：たった7行のコードでAutoGluonを使ってKaggleのトップ4％を達成

Slalom _buildで新しいデータエンジニアリングの役割を始めてから、数年前のMLの経験を最新化する必要があることに気付きましたデータエンジニアリング/データの経験を積んでから数年が経ちましたが...

このAIニュースレターはあなたが必要とするものです＃76

今週、私たちはトランスフォーマーや大規模な言語モデル（LLM）の領域を超えた重要なAIの進展に焦点を当てました最近の新しいビデオ生成拡散ベースのモデルの勢いについて…

「クオリティデータ分析の美学」

数週間前、私は品質の高い洞察を生成するためのシステムの構築について書きましたプロセス、ツールなどの領域に取り組むことで、チームの成果を向上させる方法を示しました...

リトリーバルオーグメンテッドジェネレーション（RAG）推論エンジンは、CPU上でLangChainを使用しています

「リトリーバル増強生成（RAG）は広範にカバーされており、特にチャットベースのLLMへの応用については詳しく語られていますが、本記事では異なる視点からそれを見て、その分析を行うことを目指しています...」

進化する離反予測：介入と再トレーニングのナビゲーション

「再教育回避モデルのリトレーニングには特別な注意が必要なユニークな課題が存在します特に注目すべきは、介入の因果関係を区別することです——積極的な顧客保持プログラムによって滞在し続けた顧客を特定し、彼らを対象にすることです」

GPUは人工知能の希少な地球の金属、さらには金そのものとも呼ばれています。それは、今日の生成的AI時代において基盤となる存在であるためです。それは3つの技術的理由と数多くのストーリーによって説明され、それぞれの理由には多くの側面がありますが、大まかに言えば次のようなものです。 GPUは並列処理を使用します。 GPUシステムはスーパーコンピュータの高さにまでスケールアップします。 AIのためのGPUソフトウェアスタックは幅広く深いです。その結果、GPUはCPUよりも高速かつエネルギー効率が優れており、AIのトレーニングおよび推論においても優れたパフォーマンスを提供し、高速計算を使用するさまざまなアプリケーションにおいても利益をもたらします。スタンフォード大学のヒューマンセンタードAIグループの最近のレポートによれば、GPUのパフォーマンスは「2003年以来約7000倍」向上し、価格性能比は「5600倍」増加していると報告されています。 2023年のレポートは、GPUのパフォーマンスと価格性能の急激な上昇を捉えています。レポートはまた、AIの進展を測定し予測する独立系の研究グループであるエポックの分析も引用しています。「GPUは、機械学習ワークロードを高速化するための主要なコンピューティングプラットフォームであり、過去5年間のほとんど（もしくはすべて）の最大のモデルがGPU上でトレーニングされています… それにより、AIの最近の進歩に重要な貢献をしています」とエポックはサイトで述べています。また、米国政府のためにAI技術を評価した2020年の研究も同様の結論を導いています。「製造および運用コストを含めた場合、最先端のAIチップは生産性と運用コストをリーディングノードCPUよりも1〜3桁高いと予想されます」と述べています。「NVIDIAのGPUは、過去10年間にAI推論のパフォーマンスを1000倍向上させました」と同社の首席科学者であるビル・デーリー氏は、半導体およびシステムエンジニアの年次集会であるHot Chipsの基調講演で述べています。 ChatGPTがニュースを広める ChatGPTは、GPUがAIにとって優れたものであることを強力に示した例です。数千のNVIDIA GPUでトレーニングされ、実行される大規模な言語モデル（LLM）は、1億人以上の人々が利用する生成的AIサービスを提供しています。その2018年のリリース以来、AIの業界標準ベンチマークであるMLPerfは、NVIDIA GPUのトレーニングおよび推論のリーディングパフォーマンスを詳細に示しています。例えば、NVIDIA Grace Hopper Superchipsは最新の推論テストで圧倒的な成績を収めました。そのテスト以降にリリースされたNVIDIA TensorRT-LLM推論ソフトウェアは、パフォーマンスを最大8倍向上させ、エネルギー使用量と総所有コストを5倍以上削減します。実際、NVIDIA…

「GTFSデータを使用して輸送パターンを数量化する」

「このノートには、ブダペスト、ベルリン、ストックホルム、トロントの4つの都市を選んで、公開されているGTFS（公共交通機関の一般転送仕様）データを使用して、それらの公共交通システムを概説しました…」

北京大学とマイクロソフトの研究者がCOLEを紹介：シンプルな意図プロンプトを高品質なグラフィックデザインに変換する効果的な階層生成フレームワーク

最近の品質の顕著な向上により、自然な写真制作はプロの写真と同等になりました。この進歩は、DALL·E3、SDXL、およびImagenなどのテクノロジーの創造に起因します。これらの開発を推進する主要な要素は、強力な大規模言語モデル（LLM）をテキストエンコーダとして使用し、トレーニングデータセットを拡大し、モデルの複雑さを増すこと、より良いサンプリング戦略の設計、およびデータの品質向上です。研究チームは、特にブランディング、マーケティング、広告において重要な機能を持つグラフィックデザインにおいて、よりプロフェッショナルなイメージの開発に焦点を当てる時期だと感じています。グラフィックデザインは、明確なメッセージを特定の社会グループに伝えるために視覚コミュニケーションの力を利用する専門分野です。それは想像力、独創性、迅速な思考を要求する領域です。グラフィックデザインでは、テキストとビジュアルをデジタルまたはマニュアルの方法で組み合わせて、視覚的に魅力的なストーリーを作成します。その主な目的は、データを整理し、概念に意味を与え、人間の経験を文書化するオブジェクトに表現と感情を提供することです。グラフィックデザインでは、書体の創造的な使用、テキストの配列、装飾、および画像によって、言葉だけでは表現できないアイデア、感情、態度を許容します。一流のデザインを生み出すには、高い想像力、独創性、斬新な思考が必要です。現在の研究によると、画期的なDALL·E3は、図1で見られるように、魅力的なレイアウトとグラフィックを特徴とする高品質のデザイン画像を生み出す非凡なスキルを持っています。ただし、これらの画像には欠点もあります。彼らの持続的な課題には、しばしばビジュアルテキストが不適切に表示されたり、追加の文字が入ったりするミスレンダリングが含まれます。また、これらの作成された画像は編集できないため、セグメンテーション、消去、およびインペインティングのような複雑な手順が必要です。ユーザーが包括的なテキストプロンプトを提供する要件も重要な制約です。視覚デザインの制作において良いプロンプトを作成するには、高いプロフェッショナルスキルが必要です。図1: DALL·E3によって作成されたデザイン画像を示すためにDESIGNERINTENTIONを使用しています（GPT-4で増強）。図2に示すように、DALL·E3とは異なり、彼らのCOLEシステムは基本的な要求だけで優れた品質のグラフィックデザイン画像を生み出すことができます。研究チームによると、これらの3つの制約は、グラフィックデザイン画像の品質を深刻に損なっています。高品質でスケーラブルな視覚デザイン生成システムは、柔軟な編集領域を提供し、さまざまな用途に適した正確で高品質なタイポグラフィック情報を生成し、ユーザーに低い努力を要求する必要があります。ユーザーはさらに結果を向上させるために必要に応じて人間のスキルを使用することができます。この取り組みは、ユーザーの意図プロンプトから優れたグラフィックデザイン画像を生成できる安定かつ効果的な自律型のテキスト-デザインシステムを確立することを目指しています。図2: COLEシステムによって生成された画像の視覚的な表現が上記に示されています。興味深いことに、システムが受け取る唯一の入力はテキストの意図的な説明です。残りの要素であるテキスト、デザイングラフィック、およびフォントタイプ、サイズ、位置などの関連するタイポグラフィックのプロパティは、すべてインテリジェントシステムによって独立して生成されます。マイクロソフトリサーチアジアと北京大学の研究チームは、グラフィックデザイン画像の作成プロセスを簡素化するための階層的生成アプローチであるCOLEを提案しています。このプロセスでは、異なるサブタスクに取り組むいくつかの専門的な生成モデルが関与しています。まず第一に、想像力に重点を置いたデザインと解釈、特に意図の理解に焦点を当てています。これは、最新のLLM、具体的にはLlama2-13Bを使用し、100,000点近くの選り抜かれた意図-JSONペアリングの大規模なデータセットを用いて最適化することによって達成されます。テキストの説明、アイテムのキャプション、背景のキャプションなど、デザインに関連する重要な情報は、JSONファイルに含まれています。研究チームは、オブジェクトの位置などの追加の目的のためにオプションのパラメーターも提供しています。次に、ビジュアルの配置と改善に焦点を当てており、ビジュアルのコンポーネントの作成とタイポグラフィの特徴の2つのサブタスクが含まれています。さまざまなビジュアルの特徴を作成するには、DeepFloyd/IFなどの特化したカスケード拡散モデルの微調整が必要です。これらのモデルは、レイヤー化されたオブジェクトの画像と装飾された背景などのコンポーネント間のスムーズな移行が保証されるように構築されています。その後、研究チームは、LLaVA-1.5-13Bを使用して構築されたタイポグラフィJSONファイルを予測します。これには、Design LLMからの予測されたJSONファイル、拡散モデルからの予測された背景画像、およびカスケード拡散モデルからの予測されたオブジェクト画像が使用されます。そして、ビジュアルレンダラーが予測されたJSONファイル内で見つかったレイアウトを使用してこれらのコンポーネントを組み立てます。第三に、プロセスの最後に品質保証とコメントが提供され、デザイン全体の品質を向上させます。反射LLMは丹念に調整する必要があり、包括的かつ多面的な品質評価のためにGPT-4V(ision)を使用する必要があります。この最後の段階では、テキストボックスのサイズや位置など、必要に応じてJSONファイルを微調整することが容易になります。最後に、研究チームは、さまざまなカテゴリにまたがる約200のプロのグラフィックデザイン意図プロンプトと約20のクリエイティブなプロンプトからなるDESIGNERINTENTIONを構築し、システムの能力を評価しました。そして、現在使用されている最先端の画像生成システムとのアプローチの比較、各生成モデルについての抜本的な消去実験、システムによって生成されたグラフィックデザインの徹底的な分析、そしてグラフィックデザイン画像生成の欠点と潜在的な将来の方向についての議論を行いました。

テキサス大学の研究者たちは、機械学習を用いてインプラントベースの再建合併症を予測する方法を紹介します

人工知能（AI）は現在ほとんどすべての分野を変革し、自動化、予測、意思決定の最適化を通じて既存のシステムを改善する潜在能力を持っています。乳房再建は非常に一般的な手術であり、ほとんどの場合、インプラントベースの再建（IBR）が使用されています。しかし、この手続きにはしばしば周辺プロステーシス感染が伴い、患者に大きな苦痛をもたらし、医療費を増加させる原因となります。テキサス大学のこの研究は、人工知能、特に機械学習（ML）とその機能、がIBRの合併症を予測するためにどのように活用され、最終的には生活の質を向上させるかを調査しています。乳房再建に関連するリスクと合併症は、多くの非線形の要因に依存しており、従来の手法では捉えることができません。したがって、この論文の著者は、IBRの合併症をより正確に予測するために9つの異なるMLアルゴリズムを開発・評価し、これらのパフォーマンスを従来のモデルと比較しました。データセットは、テキサス大学MDアンダーソンが収集した、約2年間の患者データで構成されています。研究者が使用した異なるモデルには、人工ニューラルネットワーク、サポートベクターマシン、ランダムフォレストなどがあります。さらに、研究者は最終的な予測を行うために、多数決を使用した投票アンサンブルも使用し、より良い結果を得るために性能指標として曲線下面積（AUC）を使用し、3回の10倍交差検証後に最適なモデルを選択しました。 9つのアルゴリズムの中で、周辺プロステーシス感染の予測の正確さは67％から83％まで幅広く変動し、ランダムフォレストアルゴリズムが最も正確で、投票アンサンブルが最も全体的なパフォーマンス（AUC 0.73）を示しました。説明を予測する場合、正確さは64％から84％の範囲で変動し、エクストリーム勾配ブースティングアルゴリズムが最も全体的なパフォーマンス（AUC 0.78）を示しました。さらなる分析により、周辺プロステーシス感染と説明の重要な予測要因も特定され、IBRの合併症の要因に対するより堅牢な理解を提供します。高いBMI、高齢などの要因は感染のリスクを高めます。 BMIと感染リスクの間には線形の関係があると研究者は観察しました。また、他の研究では年齢がIBR感染に影響を与えないと報告されていましたが、著者たちはその2つの間に線形の関係を特定しました。著者はまた、彼らのモデルの制限も強調しています。データが1つの研究所からのみ収集されているため、その結果は他の研究所への一般化ができません。さらなる検証によって、これらのモデルの臨床実装を可能にし、壊滅的な合併症のリスクを減少させるのに役立ちます。また、臨床上関連性のある変数や人口統計的要因を統合することで、パフォーマンスと正確性をさらに向上させることができます。研究論文の著者は、IBR合併症の発生を正確に予測するために、9つの異なるMLアルゴリズムをトレーニングしました。彼らはまた、過去のモデルでは無視されていたいくつかのIBR感染に影響を与える要因を分析しました。ただし、データが1つの研究所からしか得られていない、追加検証が不足しているなど、これらのアルゴリズムにはいくつかの制限があります。さらなるデータの追加や異なる研究所からのデータの統合、他の要因（臨床的および人口統計的）の追加により、モデルのパフォーマンスが向上し、医療専門家がIBR感染の問題に取り組むのに役立ちます。この記事の投稿元はテキサス大学の研究者たちは機械学習を使用してインプラントベースの再建合併症を予測です。

「2024年に必ず試してみるべきトップ15のベクターデータベース」

イントロダクション迅速に進化するデータサイエンスの風景において、ベクトルデータベースは高次元データの効率的な保存、検索、操作を可能にする重要な役割を果たしています。本稿では、ベクトルデータベースの定義と意義を探求し、従来のデータベースとの比較を行い、2024年に検討すべきトップ15のベクトルデータベースについて詳細な概要を提供します。ベクトルデータベースとは何ですか？ベクトルデータベースは、本質的にはベクトル化されたデータを効率的に処理するために設計されています。伝統的なデータベースが構造化データの保存に優れているのに対し、ベクトルデータベースは多次元空間におけるデータポイントの管理に特化しており、人工知能、機械学習、および自然言語処理のアプリケーションに理想的です。ベクトルデータベースの目的は、ベクトル埋め込み、類似検索、高次元データの効率的な処理を支援する能力にあります。伝統的なデータベースは非構造化データに苦労する場合があるのに対し、ベクトルデータベースはデータポイント間の関係性や類似性が重要なシナリオで優れたパフォーマンスを発揮します。ベクトルデータベース vs 伝統的なデータベース側面伝統的なデータベースベクトルデータベースデータの種類テーブル形式の単純なデータ（単語、数字）。専用の検索を行う複雑なデータ（ベクトル）。検索方法正確なデータの一致。近似最近傍探索（Approximate Nearest Neighbor、ANN）を使用した最も近い一致。検索手法標準的なクエリメソッド。ハッシュやグラフベースの検索など、ANNに特化した手法。非構造化データの処理予め定義された形式の不足により困難。…

Learn more about Search Results Yi - Page 7