「ODSC West 2023 の最初の50セッションが発表されました」
ODSC West 2023の最初の50セッションが発表されました
ODSCウェストは数ヶ月後に迫っており、最初の50のセッションを発表できることを大変嬉しく思っています!全てについてお話するにはこのブログのスペースが足りませんが、以下にいくつかを強調しています。最初の50のセッションの完全なリストはこちらでご覧いただけます。
アンサンブルスタッキングアルゴリズムによるセミスーパーバイズド異常検知システム
Chuying Ma | シニアデータサイエンティスト | Walmart
在庫の損失や縮小を防ぐために顧客の活動の異常検知という複雑な問題に対処するため、この研究では既存のラベルを拡張し、低コストで異常を検出するための体系的で柔軟性のある異常検知アーキテクチャを提案しています。
このセッションでは、この新しいシステムが、ディープラーニングベースの異常検知モデルや他の伝統的な機械学習モデルを柔軟に組み込み、アンサンブルスタッキングアルゴリズムによって統一された異常スコアを生成し、異なるタイプの異常に同時に対処できるかどうかを探求します。
フィーチャーストアを使用したLLMsの個別化
Jim Dowling | CEO | Hopsworks
このセッションでは、フィーチャーストアとプロンプトエンジニアリングを使用して、LLMsを個別化する方法を紹介します。Hopsworksを使用したサーバーレスの個別化LLMアプリケーションの作成方法、組み込みのベクトルデータベースを備えたオープンソースのフィーチャーストアでのプロンプトテンプレートの作成方法、リアルタイムコンテキストデータでプロンプトテンプレートを埋め込む方法、フィーチャーストアからのユーザー入力と過去のユーザーデータを組み合わせてプロンプトにベクトルデータベースのドキュメントを組み込む方法について紹介します。
時系列データベースとは何か、そしてなぜ必要なのか?
Jeff Tao | Founder & CEO | TDengine
IoTとクラウドの登場により、時系列データの量が前例のない方法で指数関数的に増加しており、関係データベースやNoSQLデータベースのような一般的なデータベース管理システムにとって大きな課題となっています。一方、目的に特化した時系列データベースは、時系列データの特性に最適化されており、データの取り込み速度、クエリの遅延、データの圧縮などの面でより効率的です。
大規模言語モデルの評価技術
Rajiv Shah, PhD | マシンラーニングエンジニア | Hugging Face
ニーズに合った適切なLLMの選択はますます複雑になっています。このチュートリアルでは、評価とLLMの選択に関する実践的なツールとベストプラクティスについて学びます。
小規模な伝統的なMLモデルとの能力に関する既存の研究、EleutherAI Harnessなどの評価スイート、ヘッドトゥヘッドの競技アプローチ、LLMを評価するためのLLMの使用など、いくつかの技術について探求します。また、プロンプトの役割、トークナイゼーション、事実の正確性に対する要件、モデルのバイアスと倫理など、評価に影響を与える微妙な要素に触れます。
大規模モデルの景色を理解する
Lukas Biewald | CEO and Co-founder | Weights & Biases
このセッションでは、GPT-3からStable Diffusionまでの大規模モデルの現在の景色について探求します。さらに、いくつかのオープンソースプロジェクトのチームがW&Bを使用して作業を加速している方法についても議論します。
1行のコードを変更するだけでデータサイエンスワークフローをスケーリングする
Doris Lee | CEO and Cofounder | Ponder
pandasやNumPyのようなツールにより、あらゆるレベルの実践者が効率的にデータを扱うことができるようになりましたが、実践者がワークフローを本番環境にスケーリングする際にはいくつかの課題があります。このセッションでは、これらのツールの制限とデータサイエンティストが大規模なデータを扱う際に遭遇する問題点について探求します。また、オープンソースプロジェクトModin(1000万以上のダウンロード)が、たった1行のコード変更でpandasコードをシームレスにスケーリングする方法についてもカバーします。
言語モデルの本番展開における埋め込み/ベクトルドリフトのトラブルシューティングと計測
Amber Roberts | データサイエンティスト、グロースリード | Arize AI
このプレゼンテーションでは、Arize AIの機械学習エンジニアであるAmber Robertsが、画像と言語モデルのベクトル/埋め込みドリフトを計測する方法に関する研究の結果を発表します。Euclidean距離やCosine距離など、様々なアプローチのテスト結果から得られた知見をもとに、二つの非構造化言語データセットが異なるかどうかを検出する方法や、UMAPなどの技術を使用してその違いを理解する方法について詳しく解説します。
オープンソースの大規模モデルの共同システム最適化によるファインチューニングの民主化
Kabir Nagrecha | 博士課程学生 | UC San Diego
このセッションでは、Saturnの核心的なアイデアの概要、ランタイムとコストを削減するための技術的なレベルでのSaturnの動作方法、そしてSaturnを使用した大規模モデルのファインチューニングプロセスについて説明します。数行のコードでSaturnが大規模モデルのワークロードを加速し最適化する方法を探り、産業界や学術界の価値の高い実世界のユースケースを紹介します。
機械学習は死霊術になりました
Mark Saroufim | PyTorchエンジニア | Meta
ブレイクスルーがどのように生まれるかについては多くのことが言われていますが、ブレイクスルーがどのように失われるかについてはあまり話されていません。このトークでは、死霊術の進化と破壊を探求し、機械学習における最近提案された規制との類似点を示します。
こちらでお申し込みください
この10月30日から11月2日までのODSC Westに参加して、これらを含む多くの実践的なトレーニングセッション、ワークショップ、トークに参加するチャンスを手に入れましょう。さらに、今すぐ登録すると、対面またはバーチャルパスのいずれかで50%割引になります。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles