機械学習洞察のディレクター【パート4】

'Machine Learning Insights Director [Part 4]'

MLソリューションをより速く構築したい場合は、今すぐ hf.co/support をご覧ください！

👋 ML Insightsシリーズのディレクターへお帰りなさい！以前のエディションを見逃した場合は、こちらで見つけることができます：

ディレクター・オブ・マシン・ラーニング・インサイト[パート1]
ディレクター・オブ・マシン・ラーニング・インサイト[パート2：SaaSエディション]
ディレクター・オブ・マシン・ラーニング・インサイト[パート3：金融エディション]

🚀 この第4弾では、次のトップマシン・ラーニング・ディレクターがそれぞれの業界へのマシン・ラーニングの影響について語ります：ハビエル・マンシージャ、ショーン・ギットンズ、サミュエル・フランクリン、エヴァン・キャッスル。全員が現在、豊富なフィールドの洞察を持つマシン・ラーニングのディレクターです。

免責事項：すべての意見は個人の意見であり、過去または現在の雇用者の意見ではありません。

ハビエル・マンシージャ – マーケティングサイエンス部門のマシン・ラーニングディレクター、メルカドリブレ

経歴：経験豊富な起業家でありリーダーであるハビエルは、2010年以来マシン・ラーニングを構築する高級企業であるMachinalisの共同設立者兼CTOでした（そう、ニューラルネットの突破前の時代です）。 MachinalisがMercado Libreに買収されたとき、その小さなチームは10,000人以上の開発者を持つテックジャイアントにマシン・ラーニングを可能にする能力として進化し、ほぼ1億人の直接ユーザーの生活に影響を与えました。ハビエルは、彼らのマシン・ラーニングプラットフォーム（NASDAQ MELI）の技術と製品のロードマップだけでなく、ユーザーのトラッキングシステム、ABテストフレームワーク、オープンソースオフィスもリードしています。ハビエルはPython-Argentinaの非営利団体PyArの積極的なメンバーおよび貢献者であり、家族や友人、Python、サイクリング、サッカー、大工仕事、そしてゆっくりとした自然の休暇が大好きです！

おもしろい事実：私はSF小説を読むのが大好きで、引退後は短編小説を書くという10代の夢を再開する予定です。📚

メルカドリブレ：ラテンアメリカ最大の企業であり、コンチネンタルのeコマース＆フィンテックの普遍的なソリューションです

1. eコマースにおいてMLがポジティブな影響を与えたのはどのような場合ですか？

詐欺防止や最適化されたプロセスやフローなど、特定のケースにおいてMLは不可能を可能にしたと言えます。他のほとんどの分野では想像もできなかった方法で、MLがUXの次のレベルを実現しました。

中間には、MLがユーザーのリスティングやオファーの間を航海する際に追加された発見や偶然性などのアプリケーションがあります。

私たちは、検索、推奨、広告、信用スコアリング、モデレーション、いくつかのキーアスペクトの予測、物流など、少なくとも1つの基本的なメトリックを最適化するために、Machine Learningを用いて様々なコアユニットを実行しています。

さらに、私たちはインフラストラクチャを予約および使用する方法を最適化するためにMLを使用しています。

2. eコマースにおける最大のMLの課題は何ですか？

技術的な課題（例えば、リアルタイム性や個別化の増加など）に加えて、最大の課題は常にエンドユーザーに焦点を当てることです。

eコマースは年々市場のシェアを拡大しており、Machine Learningは常に確率的なアプローチであり、100％の完璧さを提供しません。私たちは、各個人の長尾と体験に注意を払いながら、製品を最適化し続ける必要があります。

最後に、マーケットプレイス、物流、クレジット、保険、実店舗での支払いなど、マルチチャネルおよびマルチビジネスの世界でデータ（入力と出力）の共存を調整し、促進するという成長する課題があります。

3. eコマースにMLを統合しようとする際によく見る一般的な間違いは何ですか？

最も一般的な間違いは、間違った問題に対して間違ったツールを使用することに関連しています。

たとえば、最も単純なベースラインから始める代わりに複雑な問題から始めること。たとえば、機械学習の影響を測定しないこと。たとえば、期待される利益の境界線が明確でない状態で技術に投資すること。

最後に、短期的なことだけを考え、隠れた影響や技術的な負債、メンテナンスなどを忘れることです。

4. 機械学習の将来について、何が一番ワクワクしますか？

10年前と同じように私たちが裸の手で技術を作り上げる立場から考えると、一番好きなのは、私たち業界が課題の遅くて繰り返しで boring な部分を解決していることを見ることです。

もちろん、常に動いているターゲットであり、新たな困難が生じます。しかし、成熟したツールやプラクティスを取り入れることによって、モデル構築のサイクルが短縮され、結果的に市場投入までの時間が短縮されています。

Shaun Gittens – マスターピースソリューションズの機械学習ディレクター

経歴：ショーン・ギッテンズ博士は、マスターピースソリューションズ株式会社の機械学習能力ディレクターです。同社は、クライアントに先進技術とミッションクリティカルなサイバーサービスを提供することに特化している企業です。彼の役割は以下のとおりです：

同社内の機械学習の専門家や実践者のコアを育成すること。
既存の従業員の間で最新の機械学習の実践知識を高めること。
同社のクライアントだけでなく、マスターピース内で育成されているスタートアップ企業に対しても、効果的な機械学習ソリューションとコンサルティングサポートを提供すること。

おもしろい事実：テニスに夢中で、大のアニメファンです。🎾

マスターピースソリューションズ：マスターピースソリューションズは、中大西部地域で最も急成長している先進技術企業の一つとして浮上しています。同社は、情報機関が直面する最も重要な課題を解決するためのソフトウェア、システム、ソリューション、製品の設計・開発を行っています。

1. 機械学習がエンジニアリングに与えるポジティブな影響は何ですか？

エンジニアリングはその応用範囲が広く、ロボティクスや自動車エンジニアリングなどの明らかな分野から、化学や土木工学などの意外な分野まで、さまざまな工学の側面に影響を与えていることが最近増えています。機械学習はその応用範囲が非常に広いため、以前に記録された労働プロセスのトレーニングデータの存在だけで、機械学習が利益に影響を与えることができます。要するに、人間だけが操作していた工学プロセスの自動化が、機械学習の時代になってきたと言えます。

2. エンジニアリングにおける最大の機械学習の課題は何ですか？

最大の課題は、人間の操作を最小限に抑えて機械学習によるソリューションを運用化し、展開することです。完全な自動運転車では既にそれを見ることができます。人間や人間が依存しているプロセスを危険に晒すことなくプロセスを自動化することは挑戦です。この現象の最も重要な例は、機械学習とバイアスです。無意識であっても、バイアスのある意思決定を含むデータでトレーニングされた機械学習モデルは、運用時にそのバイアスを再現することが現実となります。バイアスは、機械学習をエンジニアリングに組み込む試みにおいて重要な位置に置かれるべきであり、システミックな人種差別が将来の技術進歩に伴って被害をもたらさないようにするためにも重要です。バイアスのあるプロセスから生成されたデータでトレーニングされた機械学習システムは、繰り返される運命にあるのです。
エンジニアリングにおけるもう一つの重要な課題は、問題解決の必要性によって特徴づけられることで、これはしばしば創造性を必要とします。現在の機械学習ソリューションは、すべての可能な解を探索するだけの結果に過ぎないため、本当の「創造性」や「発想力」を持ち、様々な問題領域で一貫して創造性を発揮することができるMLエージェントの素晴らしい例はほとんどありません。私の謙虚な意見では、これらの手法によって多くの解が見つかるかもしれませんが、機械学習はエンジニアリングの領域でまだ限界があり、多くの課題が残されています。

3. エンジニアリングに機械学習を統合しようとする際によく見られる誤りは何ですか？

エンジニアリングに機械学習を統合する際に、小さな問題データセットに対して過剰な機械学習手法を使用することは、よく見られる誤りです。例えば、ディープラーニングはAIと機械学習を非常に短期間で想像を超える高みに押し上げていますが、問題空間によっては最適な解決方法ではない場合もあります。小規模なトレーニングデータセットと限られたハードウェアで作業する場合、よりシンプルな手法が同じくらいまたはより良い結果をもたらすことがよくあります。

また、MLソリューションのための効果的なCI/CD（継続的インテグレーション/継続的デプロイメント）構造を設定しないことも、よく見られる誤りです。非常に頻繁に、一度トレーニングされたモデルだけでは十分ではなく、データが経時的に変化するだけでなく、リソースと人員も変化するからです。今日の機械学習の実践者は次のことが必要です:

データの変化に合わせた一貫したデータフローの確保と、正確で有用な状態を保つための新しいモデルの継続的な再トレーニングの実施
古いモデルを新たにトレーニングされたモデルにシームレスに置き換えるための構造の確立
機械学習モデルの出力を利用する消費者に最小限の中断を許容する

4. 機械学習の将来について、一番ワクワクするポイントは何ですか？

機械学習の将来はまだまだ魅力的であり、この分野でさえ専門家たちを驚かせる進歩が毎月報告されています。1) 機械学習技術が改善され、確立されたプラクティショナーと初心者の両方によりアクセスしやすくなること、2) 日常のハードウェアが高速化し、3) ミニチュアのエッジデバイスにおける電力消費が問題とならなくなること、4) メモリ制約が時間とともに減少していくことにより、機械学習がエンジニアリングにおいて将来的に輝かしい展望が広がるでしょう。

Samuel Franklin – Pluralsightのデータサイエンスと機械学習エンジニアリングのシニアディレクター

経歴: SamuelはPh.D.を持つPluralsightのシニアデータサイエンスと機械学習エンジニアリングのリーダーです。彼は優れたデータサイエンティストと機械学習エンジニアのチームを率いて、Pluralsightのスキルプラットフォームを支えるインテリジェントサービスを開発しています。

バーチャルオフィスの外では、Dr. FranklinはEmory大学でデータサイエンスと機械学習のセミナーを教えています。また、彼はアトランタHumane Societyの取締役会の議長も務めています。

おもしろい事実: 私はアパラチア山脈の頂上にあるログキャビンに住んでいます。

Pluralsight: 当社は技術の労働力開発会社であり、私たちのスキルプラットフォームはFortune 500の70％がビジネスに不可欠なテクノロジースキルを身につけるために使用しています。

1. 機械学習が教育にどのような良い影響を与えていますか？

オンラインでリクエストに応じた教育コンテンツは、世界中の数十億人にとって、生涯学習をよりアクセスしやすくしています。数十年にわたる認知研究によると、教育コンテンツの関連性、形式、およびシーケンスは、学生の成功に大きな影響を与えます。ディープラーニングのコンテンツ検索と推薦アルゴリズムの進歩により、個別の学生のニーズに合わせて時間とともに適応できるカスタマイズされた効率的な学習パスを大規模に作成する能力が大幅に向上しました。

2. 教育における最大の機械学習の課題は何ですか？

私はMLOps技術を、あらゆる産業における機械学習の改善のための主要な機会領域として見ています。現在のMLOps技術の状況は、2015年から2016年頃のコンテナオーケストレーション戦争を思い起こさせます。熱心なコミュニティによって奨励され、大規模な組織によって支持される、MLトレーニング-デプロイ-モニタリングスタックの競合するビジョンが存在しています。もしも優勢なビジョンが最終的に浮かび上がれば、MLOpsエンジニアリングパターンについての合意が生まれ、現在の意思決定の複雑さを軽減することができるでしょう。

3. 既存の製品に機械学習を統合しようとする際によく見られる誤りは何ですか？

MLを導入する際に、あらゆる規模の組織が2つの重要な誤りを犯す場合があります。最初の誤りは、実績豊富なML経験を持つシニアリーダーへの投資の重要性を過小評価することです。ML戦略とオペレーションのリーダーシップは、BI/分析領域では通常見られない技術的な専門知識の深さから恩恵を受けます。教育プログラムでは、その分野への限定された導入しか提供されていません。2つ目の誤りは、プロダクションの展開パイプラインの設計、テスト、実装を行うのに長い時間を待つことです。効果的なプロトタイプモデルは、MLパイプラインの開発を待って数ヶ月、場合によっては数年間もリポジトリに眠ってしまうことがあります。これは組織に大きな機会コストをもたらし、MLチームをイライラさせ、離職リスクを増大させる可能性があります。

4. 機械学習の将来について、最もワクワクすることは何ですか？

私は次世代の機械学習のリーダーを指導する機会に興奮しています。私のキャリアは、クラウドコンピューティングプラットフォームがまだ始まったばかりで、機械学習のツールは現在よりもずっと成熟していませんでした。確立されたベストプラクティスがまれだったため、機械学習の実験や展開におけるさまざまなエンジニアリングパターンを探求することは興奮しました。しかし、その探求には、技術的な教訓やリーダーシップの教訓を多く学ぶという困難も含まれていました。これらの教訓を次世代の機械学習のリーダーと共有することで、彼らが過去10年以上にわたって見てきた以上の進歩を促進するのに役立ちます。

Evan Castle – エラスティックのMLディレクター、製品マーケティング

経歴: データサイエンス、製品、戦略の交差点での10年以上のリーダーシップ経験。エバンは、キャピタルワンでリスクモデルを構築したり、SisenseやElasticでML製品を立ち上げたりするなど、さまざまな業界で働いてきました。

おもしろい事実: ポール・マッカートニーに会ったことがあります。🎤

マスターピース・ソリューションズ: マスターピース・ソリューションズは、中大西洋地域で最も急成長している先進技術企業の1つとして浮上しています。同社は、インテリジェンスコミュニティが直面する最も重要な課題を解決するために、ソフトウェア、システム、ソリューション、製品を設計・開発しています。

1. SaaSへの機械学習のポジティブな影響は何ですか？

機械学習は、個別化、意味論的および画像検索、推奨など、さまざまなビジネスシナリオでパワフルなSaaSを実現しています。実際の影響は、MLがますます多くのアプリケーションに組み込まれていることです。それは期待されており、ほとんどの場合、エンドユーザーには見えません。例えば、Elasticでは、エンドポイントセキュリティとSIEMに最適化された異常検知のために、MLに投資しました。時間の系列分解、クラスタリング、相関分析、ベイジアン分布モデリングなど、さまざまな手法の組み合わせで、ボックス外の重要な機能が提供されます。セキュリティアナリストにとって大きな利点は、脅威検出がさまざまな方法で自動化されていることです。そのため、時間的な偏差、異常な地理的位置、統計的な珍しさなど、異常が迅速に浮かび上がります。それがMLを統合することの大きなポジティブな影響です。

2. SaaS内の最大の機械学習の課題は何ですか？

MLの利点を最大限に活用するためには、機械学習に馴染みのないユーザーに価値を提供すると同時に、経験豊富なデータサイエンティストにも価値を提供するという2つの課題があります。これら2つの人々の要求には明らかな違いがあります。MLの機能が完全なブラックボックスであれば、実際の影響を与えるにはあまりにも堅いか単純すぎる可能性があります。一方、開発者向けのツールキットのみを提供する場合、社内にデータサイエンスチームがある場合にのみ有用です。適切なバランスを取ることは、データサイエンスチームがモデルの透明性と制御を持つことができるようにするのと同時に、設定と展開がプロでなくても簡単な堅牢なモデルを詰め込むことです。

3. SaaSに機械学習を統合しようとする際によく見られる間違いは何ですか？

統合されたモデルがスケールで動作するためには、膨大なデータセットのサポートが必要ですが、結果が高速かつ正確であることも確保する必要があります。実際の例で説明しましょう。ベクトル検索への関心が高まっています。テキストや画像、イベントなど、さまざまなものをベクトルで表現することができます。ベクトルは、コンテンツ間の類似性を捉えるために使用され、検索の関連性や推奨などに非常に適しています。課題は、スピード、複雑さ、コストのトレードオフを考慮しながらベクトルを比較できるアルゴリズムを開発することです。エラスティックでは、ベクトル検索のための近似最近傍（ANN）アルゴリズムである階層的ナビゲーション可能小世界グラフ（HNSW）のアプローチを評価し、ベンチマークテストを行いました。HNSWは、さまざまなANNベンチマークでスピードと精度を桁違いに向上させます。これは、製品とエンジニアリングチームが成功裏にMLを製品に統合するために行う必要がある、非トリビアルな意思決定の1つの例です。

4. MLの未来で一番ワクワクすることは何ですか？

機械学習はオンラインで注文するのと同じくらい簡単になります。特にNLPの大きな進歩によって、機械学習は文脈、意図、意味を理解することでより人間らしくなりました。私は私たちが多くの興味深い方向に発展する基礎モデルの時代にいると思います。Elasticでは、Hugging Faceとの統合に大いに興奮しており、既に私たちのお客様がNLPを可観測性、セキュリティ、検索に活用していることを見て非常にわくわくしています。

🤗 MLディレクターのインサイト第4回目にご参加いただき、ありがとうございます。

Javier Mansilla、Shaun Gittens、Samuel Franklin、Evan Castleには、彼らの素晴らしいインサイトと参加に感謝いたします。私たちはあなたの継続的な成功を見守り、あなたの一歩一歩を応援しています。🎉

Hugging Face Expertsと一緒にMLのロードマップを加速させたい場合は、hf.co/supportをご覧ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful