「ODSC West 2023で機械学習をより良くする11の方法」

「ODSC West 2023で機械学習をさらに向上させる11の方法」

多くの企業がデータサイエンスと機械学習を活用していますが、ROIの向上の余地はまだまだあります。2021年のVentureBeatの分析によると、87%のAIモデルは本番環境に到達しないと報告されており、MIT Sloan Management Reviewの記事では、70%の企業がAIプロジェクトの影響が限定的であると報告しています。それにも関わらず、ガートナーは2022年の人工知能への投資が過去最高の625億ドルに達すると予測しており、2021年から21.3%増加するとしています。

ただし、私たちはまだ疑問が残っています。機械学習をどのように改善できるのでしょうか?それを知るために、私たちはODSC West 2023の今後のチュートリアルやワークショップから専門家のトピックを通じて、より良い機械学習の構築に向けて案内してもらいましょう。

データラベリングの概要

Chris Hoge | コミュニティ担当責任者 | Heartex

機械学習の現代において、高品質で正確なラベル付けされたデータの重要性は言い尽くせません。このプレゼンテーションでは、機械学習モデルの訓練に使用するための高品質なアノテーション付きデータセットの作成方法を紹介します。このチュートリアルでは、オープンソースの多様なデータラベリングツールであるLabel Studioを使用して、人間と自動化の両方のラベリング技術を含む一般的なデータセットのアノテーション方法を探求します。

不確実性の定量化:アプローチと方法

Brian Lucena | プリンシパル | Numeristical

まず、モデルの予測における不確実性を定量化することの重要性について概説します。分類問題と回帰問題における不確実性の違いを述べ、さまざまなアプローチについて紹介します。このワークショップでは、これらの手法の理論的な背景を提供し、Jupyterノートブックを使用して実世界の例に深く入り込みます。

データ変形:要約統計量の警告的な物語

Stefanie Molin | ソフトウェアエンジニア、データサイエンティスト、最高情報セキュリティ責任者、『Hands-On Data Analysis with Pandas』の著者 | Bloomberg

この講演では、前回のAutodeskの研究をベースにしたシミュレーテッドアニーリングを使用して、任意の入力データセットを平均、標準偏差、および複数の小数点以下の相関を保ちつつ、さまざまな形状に変形するためのオープンソースのパッケージであるData Morphについて説明します。その仕組みを紹介し、開発中の課題やこのアプローチの限界について探求します。

イベント – ODSC West 2023

対面および仮想カンファレンス

10月30日から11月2日まで

LLMsからデータ分析、機械学習から責任あるAIまで、最新のデータサイエンスとAIのトレンド、ツール、および技術についての詳細な掘り下げにご参加ください。

 

因果関係AI:データからアクションへ

Dr. Andre Franca | CTO | connectedFlow

この講演では、データサイエンスの実践者向けに、因果関係AIの世界を探求し、データ内の因果関係を理解して最適な意思決定に活用することに焦点を当てます。この講演では、Shapley、DAG、因果関係の発見、および最適な意思決定にフォーカスしました。

AIによる高品質な高速な知識探索の完成

Alex Liu, Ph.D. | 創設者およびディレクター | RMDS Lab

このプレゼンテーションでは、講演者が一連の一般的な失敗要素を包括的にレビューすることから始めます。さらに、知識発見のためのAI駆動のエコシステムアプローチを提案し、このアプローチを用いた14の知識発見プロジェクトに関する実世界のテストについて説明します。これにより、データ駆動型の知識発見プロジェクトの成功とAI技術の進歩との重要な関係について貴重な知見を得ることができます。参加者はまた、このエコシステムアプローチが知識発見イニシアチブにおいて、スピード、品質向上、効果的なリスク軽減といった素晴らしい成果をもたらす方法についても理解することができます。

顧客セグメンテーションにおける理解可能性のギャップを埋める

Evie Fowler | シニアデータサイエンティスト | Fulcrum Analytics

従来、セグメンテーションにはルールベースと機械学習に基づくアプローチの2つの主要な方法がありました。この講演では、両方の方法のベストな側面を組み合わせた新しいハイブリッドアプローチを紹介します。プロセスは、顧客データの注意深い観察とデータ内の自然なクラスタが形成されているかどうかの評価から始まります。次に、クラスタリングアルゴリズムの選択とモデルの微調整を行い、クラスタを作成します。その後、その他の探索的データ分析を行い、各クラスタを他のクラスタとの差別化を理解します。最後に、線形近似を使用して機械学習のクラスタリングアルゴリズムの簡単な表現を作成します。

ヒューマンセンタードAI

Peter Norvig, PhD | エンジニアリングディレクター、エデュケーションフェロー | Google、Stanford Institute for Human-Centered Artificial Intelligence (HAI)

近年、AIアプリケーションの技術的な進展を目の当たりにしました。この講演では、技術的な側面ではなく、ヒューマンサイドに焦点を当てます。ユーザー、その他の利害関係者、そして社会全体にとって公正で正義、真実、利益、およびウェルエアなアプリケーションになるための信頼性をどのように確保できるのか、ということを考察します。

グラフとネットワークにおける表現学習

Dr. Petar Veličković スタッフリサーチサイエンティスト |  アフィリエイト講師 DeepMind、ケンブリッジ大学

この講演では、GNNに関する「鳥の目」の複数の視点を提供します。グラフ表現学習の有用性についての迅速な動機づけから始め、順列不変性と同等性の第一原理からGNNを導き出します。入力グラフ構造に厳密に依存しないGNNを構築する方法についても議論します。この講演は一般的なコンピュータサイエンスの観客を対象としていますが、ニューラルネットワークを用いた機械学習の基礎知識があると有益です。

機械学習は死者蘇生術になった

Mark Saroufim | 著者 | Breaking Stagnation

オープンソースによって機械学習は大きな変革を遂げました。単純な曲線フィッティングしかできなかった技術から、人類の支配を終わらせる可能性のある技術にまで進化しました。2017年、アリ・ラヒミは機械学習が新しい錬金術であると宣言しましたが、私たちはさらに進んで、機械学習が新しい死者蘇生術であると主張したいと思います。カトリック教会によって最終的に破壊された、情熱的で強力なオープンソース倫理によって形成された忘れられた科学です。

CRMプロダクションデータの異常検出

Geeta Shankar、ソフトウェアエンジニアおよびTuli Nivas、ソフトウェアエンジニアリングアーキテクト | Salesforce

技術的な講演では、機械学習と分析ビジュアライゼーションの価値を示し、現実世界のデータ分析の課題に対する取り組みを紹介します。私たちのデータ駆動型プロダクションシステムがこれらの課題に対処する方法を示し、信頼性の確保と顧客信頼性の構築におけるデータ分析の重要性を強調します。

欠損データ:欠損データ補完のための合成データアプローチ

Fabiana Clemente | 共同創設者およびCDO | YData

この講演では、LLMやGANなどの生成モデルを使用して、欠損データの補完に活用できるスマートな合成データの生成について説明します。欠損データを補完するために生成モデルを使用することで、データ分布を代表する新しいサンプルを生成し、欠損データがモデルに与える影響を軽減することができます。さらに、これらのモデルは特定のデータセットに合わせて微調整することができるため、特定のユースケースに適した合成データを生成することができます。

オンライン開催のODSC West 2023で、さらに良い機械学習の方法を学びましょう

より詳細な知識を深めるために、10月30日から11月2日までの間、ぜひ実際に参加するかオンラインで参加してください。会議では、機械学習、ディープラーニング、MLOpsおよびデータエンジニアリング、責任あるAIなどの重点分野において、実践的なトレーニングセッションも行われます。さらに、ブートキャンプパスを使用してトレーニングを4日間に延長することもできます。パスの種類についてはこちらをご覧ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more