機械学習洞察のディレクター

'Machine Learning Insight Director'

機械学習のテーブルの席は、技術的なスキル、問題解決能力、ビジネスの洞察力など、ディレクターのような役職にしかないものです。

機械学習および/またはデータサイエンスのディレクターは、しばしばMLシステムの設計、数学の深い知識、MLフレームワークの熟知、リッチなデータアーキテクチャの理解、実世界のアプリケーションへのMLの適用経験、優れたコミュニケーションスキルを持つことが求められます。また、業界の最新動向に常に精通していることも期待されています。これは大変な注文です!

これらの理由から、私たちはこのユニークなMLディレクターのグループにアクセスし、ヘルスケアからファイナンス、eコマース、SaaS、研究、メディアなど、さまざまな産業における彼らの現在のMLの洞察と業界のトレンドについての記事シリーズを作成しました。たとえば、あるディレクターは、MLを使用して空の空転トラック運転(約20%の時間が発生)をわずか19%に減らすことで、約10万人のアメリカ人の炭素排出量を削減できると指摘しています。注意:これは元ロケット科学者によって行われた即興の計算ですが、私たちはそれを受け入れます。

この最初のインストールでは、地中に埋まった地雷を検出するために地中レーダーを使用している研究者、元ロケット科学者、ツォンカ語に堪能なアマチュアゲーマー(クズ=こんにちは!)、バン生活を送っていた科学者、まだ実践的な高性能データサイエンスチームのコーチ、関係性、家族、犬、ピザを大切にするデータ実践者など、豊富なフィールドの洞察を持つ機械学習ディレクターの意見を紹介します。

🚀 さまざまな産業における機械学習ディレクターのトップと出会い、彼らの見解を聞いてみましょう:

アーキ・ミトラ – Buzzfeedの機械学習ディレクター

背景:ビジネスにおけるMLの約束にバランスをもたらす。プロセスよりも人。希望よりも戦略。AIの利益よりもAIの倫理。ブラウン・ニューヨーカー。

興味深い事実:ツォンカ語を話すことができます(Googleで検索してください!)そしてYouth for Sevaを支援しています。

Buzzfeed:デジタルメディアに焦点を当てたアメリカのインターネットメディア、ニュース、エンターテイメント会社。

1. MLがメディアにポジティブな影響を与えたのはどのような点ですか?

顧客のためのプライバシー重視のパーソナライゼーション:すべてのユーザーは個別であり、長期的な関心事は安定していますが、短期的な関心事は確率的です。彼らはメディアとの関係がこれを反映することを期待しています。ハードウェアアクセラレーションの進歩と推奨のためのディープラーニングの組み合わせにより、この微妙なニュアンスを解読し、ユーザーに適切なコンテンツを適切なタイミングで適切なタッチポイントで提供する能力が解き放たれました。

メディア製作者のための支援ツール:メディアにおける制作者は限られた資産ですが、MLによる人間-ループアシストツールにより、彼らの創造的な能力を保護し、協力的なマシン-人間のフライホイールを解き放つことができました。適切なタイトル、画像、ビデオ、および/またはコンテンツに合わせて自動的に提案するだけの簡単なことでも、協力的なマシン-人間のフライホイールを解き放つことができます。

テストの締め付け:資本集約型のメディアベンチャーでは、ユーザーの共感を得る情報を収集する時間を短縮し、即座に行動する必要があります。ベイジアンテクニックのさまざまな手法と強化学習の進歩により、時間だけでなくそれに関連するコストも大幅に削減することができました。

2. メディア内の最大のMLの課題は何ですか?

プライバシー、編集の声、公平な報道:メディアは今以上に民主主義の重要な柱です。MLはそれを尊重し、他のドメインや業界では明確に考慮されない制約の中で操作する必要があります。編集によるカリキュレーションされたコンテンツとプログラミングとMLによる推奨のバランスを見つけることは、依然として課題です。BuzzFeedにとってももう1つのユニークな課題は、インターネットは自由であるべきだと信じているため、他の企業とは異なり、ユーザーを追跡していないことです。

3. メディアへのMLの統合を試みる際に、よく見かける間違いは何ですか?

メディアの「製作者」を無視すること:メディアは、人々に深い影響を与える声を抱えているため、広告主、コンテンツ作成者、ライター、製作者はその声の喉頭です。ビジネスと彼らを可能にするMLを構築し、彼らの影響を広げ、彼らと調和して機能することが成功の鍵です。

4. MLの将来について、一番ワクワクしていることは何ですか?

おそらく、小規模なデータ駆動型の汎用マルチモーダルマルチタスクリアルタイムMLシステムが、薬剤開発、高精度手術、気候制御システム、没入型メタバース体験において、飛躍的な改善をもたらすことでしょう。現実的には、よりアクセスしやすく、低い努力で高精度なテキストと画像生成が可能なメタ学習技術が期待されます。

リー・タン – ジョンソン・エンド・ジョンソンの機械学習・AIディレクター

経歴: リー・タンは、ジョンソン・エンド・ジョンソン、マイクロソフト、アマゾンなどの業界リーダーでデータサイエンスチームを率いた経験を持つAI/MLのベテランです。

おもしろい事実: リー・タンは常に好奇心旺盛で学習を続け、実践的なプログラミングを楽しんでいます。

ジョンソン・エンド・ジョンソン: 医療機器、医薬品、消費財を開発する多国籍企業。

1. ファーマシューティカルにおいてMLはどのような正の影響を与えていますか?

過去数年間、AI/MLの応用はファーマシューティカル領域で爆発的に増え、長期的に多くのポジティブな影響をもたらしています。ファーマシューティカルとヘルスケアには、AI/MLを活用できる多くのユースケースがあります。

応用範囲は研究や実世界の証拠、スマート製造や品質保証までさまざまです。使用される技術も非常に幅広く、NLP/NLU、CV、AIIoT、強化学習など、AlphaFoldのようなものもあります。

2. ファーマシューティカルにおけるMLの最大の課題は何ですか?

ファーマシューティカルとヘルスケアにおける最大のMLの課題は、AIの応用において平等性と多様性を確保する方法です。例えば、トレーニングセットがすべての民族グループを適切に表現していることを確認する方法です。ヘルスケアとファーマシューティカルの性質上、この問題は他の分野の応用と比較してはるかに大きな影響を与える可能性があります。

3. ファーマシューティカルにMLを統合しようとする際によく見られる間違いは何ですか?

これは必ずしも間違いとは言えませんが、ヘルスケアにおけるAIの応用に関しては、極端な意見に偏る人々が多いと感じます。あまりにも保守的な立場を取る人もいれば、あまりにも積極的な立場を取る人もいます。

一部の人々は、厳しい規制要件のために抵抗感を示しています。私たちは多くのAIアプリケーションを厳格なGxP検証で資格を付与する必要がありました。多くの作業が必要かもしれませんが、私たちはその努力が価値があると考えています。反対の立場では、AI/ディープラーニングモデルが多くのアプリケーションで人間を上回り完全に自律的に動作できると考える人々もいます。

私たち実践者としては、現時点ではどちらも真実ではないことを知っています。

MLモデルは非常に価値がありますが、まだミスを comしてしまうことがあります。そのため、より積極的なアプローチをお勧めします。重要なのは、AIの力を活用できるフレームワークを持ちながら、ゴールキーパーを置くことです。FDAは医療ソフトウェアとしてのAI/MLの使用方法を規制する動きを取っており、それは業界にとって前進するポジティブな一歩だと私は考えています。

4. MLの将来について、一番ワクワクしていることは何ですか?

AI/MLと他の自然科学や技術の交差点です。これからの展開にワクワクしています。

アリナ・ザレ – フロリダ大学機械学習・センシング研究所のディレクター

経歴: アリナ・ザレは、フロリダ大学電気・コンピュータ工学部の教授および機械学習・センシング研究所のディレクターとして、機械学習と人工知能の領域で教育と研究を行っています。ザレ博士の研究は、データと画像を自動的に理解し処理するための新しい機械学習アルゴリズムの開発に主に焦点を当てています。

彼女の研究業績には、植物の根の形態計測、サブピクセルの高分光画像解析、ターゲット検出、合成開口ソナーを使用した水中シーンの理解、LIDARデータ解析、地中レーダ解析、埋設地雷および爆発物危険物検出などが含まれています。

面白い事実:アリナは漕ぎ手です。彼女は高校でクルーのチームに入り、大学と大学院では漕いで、助教授の間はミズーリ大学のチームのヘッドコーチを務め、その後、UFの教員になった際はマスターズの漕手として漕ぎました。

機械学習&センシング研究室:センサーデータを自律的に分析し理解するための機械学習手法を開発するフロリダ大学の研究室。

1. 機械学習が科学に与えたポジティブな影響は何ですか?

機械学習は、退屈で時間のかかるタスクを自動化したり、さまざまな問題を新たな視点で見る手段を提供するなど、さまざまな方法でポジティブな影響を与えています。植物科学の機械学習の取り組みの一例として、私たちは植物の根のセグメンテーションと特徴化を自動化するための機械学習手法を開発しました。これは以前、根のイメージを見る植物科学者にとってボトルネックでした。機械学習による自動化により、これらの分析をより高いスループットで実行し、このデータを使用して植物生物学の研究を規模化することができます。

2. 科学研究における最大の機械学習の課題は何ですか?

課題はたくさんあります。例えば、科学研究において機械学習を使用する際には、データ収集と整備のプロトコルを慎重に考える必要があります。非機械学習の分析に使用したプロトコルが適切で効果的でない場合があります。データの品質やアプリケーションで期待されるものとの一致度は、機械学習ベースのシステムの性能、信頼性、信頼性に大きな影響を与えることがあります。

3. 科学に機械学習を統合しようとする際によく見られる間違いは何ですか?

上記の質問に関連して、一般的な間違いは、結果やパフォーマンスを機械学習システムだけの機能と見なし、データ収集、整備、キャリブレーション、正規化のプロトコルを考慮しないことです。

4. 機械学習の将来について最もワクワクしていることは何ですか?

非常にエキサイティングな方向性がたくさんあります。私の研究の多くは、非常に豊富な事前知識と経験に基づいたモデルがある領域で行われています。たとえば、私は森林生態学研究に機械学習を使用した研究を行っています。林業コミュニティには豊富な事前知識があり、現在の純粋にデータ駆動型の機械学習システムには活用されていません。事前知識と機械学習手法をシームレスに組み合わせるハイブリッドな手法が興味深く、エキサイティングな進むべき道となるでしょう。例えば、特定の環境条件が与えられた場合に、2つの種が同時に存在する可能性はどれくらいあるか。または、どのような種の分布が予測されるか。これらは変動する状況での予測にデータ駆動型の手法と組み合わせて使用できるかもしれません。

Nathan Cahill Ph.D. – フレス・テクノロジーズの機械学習ディレクター

経歴:ネイサンはリサーチ&ディベロップメントの経験を持つ情熱的な機械学習リーダーであり、MLモデルを実際のビジネス価値に変えることでデータの力を早期に引き出すことに特化しています。彼はビジネスの最大の課題を見つけ、戦略的に優先順位をつけることに長けています。

面白い事実:輸送や物流に参入する前はノースロップ・グラマンでロケットのエンジニアリングを行っていました。 #ロケットサイエンス

Xpress Technologies:運送業界に効率性と自動化をもたらすデジタルな貨物マッチング技術で、出荷業者、ブローカー、キャリアをつなぎます。

1. 物流/輸送においてMLがポジティブな影響を与えたのはどのような点ですか?

輸送業界は非常に分散しています。この業界のトッププレーヤーの市場シェアは1%未満です。その結果、デジタルソリューションによって解決できる非効率性が存在します。

例えば、道路上でセミトラックを見ると、現在、そのトラックが後部に何も積んでいない(または「デッドヘッド」と呼ばれる)確率は20%です。つまり、トラクタートレーラーが走る距離の20%は、前回の積み荷の最後の配送地から次の積み荷のピックアップまでの間です。逆方向に何も積んでいない(または「デッドヘッド」)トラックがもう一台ある可能性があります。

機械学習と最適化を使うことで、このデッドヘッド割合を大幅に減らすことができます。例えば、その割合を20%から19%に減らすだけでも、10万人分のアメリカ人の炭素排出量と同等の削減が可能です。

注:10万人のアメリカ人の炭素排出量は私自身がおおざっぱに計算したものです。

2. ロジスティクスにおける最大の機械学習の課題は何ですか?

物流業界の最大の課題は、業界が非常に分散していることです。技術的な解決策が「大局」を把握するための共有データプールが存在しないためです。例えば、ブローカージョブの大部分、おそらくは過半数のコストは、個別のジョブごとに交渉されるため、非常に変動しやすくなっています。これにより、価格設定は非常に困難な問題になります。業界がより透明でデータを自由に共有するようになれば、さらに多くのことが可能になるでしょう。

3. ロジスティクスに機械学習を統合しようとする際によく見られる間違いは何ですか?

私が最もよく見る間違いは、人々が機械学習とデータサイエンスを孤立して行うことです。

物流業界内のほとんどの機械学習アプリケーションは、使用されている場合に問題のダイナミクスを大幅に変える可能性があるため、モデルをビジネスと繰り返し開発し、トレーニング時の予想と現実のパフォーマンスが一致することを確認することが重要です。

価格設定の例では、レーンをわずかに過小評価すると、価格が競争力がありすぎるため、そのレーンに荷物が押し寄せる可能性があります。これにより、ブローカーはこれらの荷物に対して容量を見つけるのに苦労し、問題が悪化します。

4. 機械学習の将来について、最もワクワクしていることは何ですか?

私が最もワクワクしているのは、機械学習が人々の仕事をより良くする機会です。

機械学習がビジネスで普及するにつれて、意思決定のスピードを速め、繰り返し作業を自動化することができるようになります。これにより、革新のペースが加速し、莫大な経済的価値が生まれます。データサイエンスと機械学習の支援を受けて次の10年間でどのような問題を解決するのか、楽しみにしています!

Nicolas Bertagnolli – BENの機械学習ディレクター

経歴: Nicは、機械学習を通じて人間のコミュニケーションを改善するために取り組む科学者兼エンジニアです。彼は過去10年間、がんゲノムの新しいパターンを明らかにするためにML/NLPを応用したり、数十億の臨床ノートを活用してコストを削減し、結果を改善するためにデータの問題を解決するために医療分野で働いてきました。

BENでは、Nicは人々に届けるための能力をスケーリングする知的なテクノロジーを革新しています。彼のCV、研究、VoAGIの記事はこちらからご覧いただけます。

おもしろい事実: Nicは、BENで働き始める前に、3年間西部アメリカを旅しながらバンに住んでいました。

BEN:インフルエンサー、ストリーミング、TV、映画のコンテンツにブランドを配置するエンターテインメントAI企業であり、広告では実現できない方法でブランドとオーディエンスをつなぎます。

1. マーケティングにおいて機械学習はどのようなポジティブな影響を与えていますか?

多くの面で!完全に風景を変えています。マーケティングは、勘に基づいた伝統に固執している分野です。過去20年間、統計的に根拠を持ったマーケティングの意思決定に移行してきましたが、多くのブランドはまだマーケティング部門の勘に頼っています。機械学習はこれを革命化しています。広告のパフォーマンスに関するデータを分析する能力により、どのように、誰にマーケティングすべきかについての非常に根拠のある意思決定ができるようになりました。

BENでは、機械学習はインフルエンサーマーケティングに関わるプロセスの多くの推測作業を排除するのに本当に役立っています。データは偏見や主観性の霧を通して光を当てるのに役立ち、根拠に基づいた意思決定ができるようになります。

それだけではありません!機械学習により、ブランドの安全なマーケティングの意思決定を可能にすることもできます。たとえば、21歳未満の人々に対してアルコールを広告することは違法です。機械学習を使用することで、主な視聴者が21歳以上であるインフルエンサーを特定することができます。これにより、アルコールブランドや自社のイメージがアルコールと関連付けられることを心配しているブランドの能力が拡大します。

2. マーケティングにおける最大の機械学習の課題は何ですか?

機械学習において他の多くの課題と同様に、問題はモデル自体にあるわけではありません。Hugging Face、torch hubなどのツールを使えば、多くの優れた柔軟なモデルが利用できます。

本当の課題は、データの収集、クリーニング、管理に関わるものです。仕事の難しい機械学習の要素について話すなら、人々が見たり楽しんだりするものには多くのノイズが存在するという事実に帰結します。バイラリティの理解は非常に困難です。

クリエイターやインフルエンサーが時間とともに成功する要素を理解することは非常に難しいです。かなりノイズの多い、入手が困難なデータには奇妙な好みの情報が埋もれています。これらの問題は、データ、機械学習、ビジネスチーム間の非常に堅固なコミュニケーションと、完全に彼らの役割を自動化するのではなく、人間と協働し補完するモデルの構築に関係しています。

3. マーケティングに機械学習を統合しようとする際、よく見られる間違いは何ですか?

これはマーケティングに限ったことではないと思いますが、良いインフラストラクチャーを優先することなく機械学習とデータサイエンスを重視することは、よく見られる大きな問題です。組織は機械学習について聞いて、その一部を手に入れたいと思い、いくつかのデータサイエンティストを雇いますが、新しい派手なモデルに対応するインフラストラクチャーがないことに気付きます。機械学習の価値の多くは、モデルの周りのインフラストラクチャーにあります。訓練されたモデルがあっても、インフラストラクチャーがないと困ります。

BENの素晴らしいところの一つは、私たちがデータインフラストラクチャーに多く投資し、先に基盤を作り上げたことです。そのため、データサイエンティストは自分自身でパイプラインの各ステップを理解する必要がなく、エンドユーザーに迅速に提供されるモデルを構築することができます。MLの多くの価値を生むには、データエンジニアリングに投資することが重要です。

4. 機械学習の将来について、一番ワクワクすることは何ですか?

現在、非常に興味深いことがたくさん進行中です。私が最もワクワクするのは、この分野の速さと民主化です。私は約10年前に初めて言語翻訳のための最初のseq2seqモデルを書きました。数百行のコードで、トレーニングには時間がかかり、かなりの挑戦でした。今では、100行以下のPythonコードで任意の言語を他の言語に翻訳するシステムを基本的に構築することができます。それは狂気です!このトレンドはおそらく続くでしょうし、MLのインフラストラクチャーがますます良くなるにつれて、深いドメインの専門知識を持たない人々がモデルを展開し、他の人々に提供することがますます容易になります。

インターネットの初期の時代には、ソフトウェア開発者は少なく、ウェブサイトを設定するには熟練したチームが必要でした。その後、DjangoやRailsなどのものが登場し、ウェブサイトの構築は簡単になりましたが、それを提供することは難しかったです。私たちは、モデルの構築は簡単になりましたが、それらを信頼性を持って提供したり、信頼性を持って監視したりすることはまだ難しいという状況にいます。私は、次数年間でこのエントリーバリアが大幅に低下し、実質的にどんな高校生でも深層変換モデルをクラウドインフラストラクチャーに展開し、一般の人々に有用な結果を提供できるようになることが非常にワクワクしています。これは本当にエキサイティングであり、オンラインサービスの爆発のように、より具体的なイノベーションが見られるようになるでしょう。たくさんの素晴らしいことがあります!

Eric Golinko – E Sourceの機械学習ディレクター

バックグラウンド:経験豊富なデータプラクティショナーであり、チームビルダーでもあります。さまざまな規模の企業で、さまざまな業界で働いてきました。私は数学者やコンピュータサイエンティストとしての訓練を受けた問題解決者です。しかし、何よりも関係性、家族、犬、旅行、ピザを大切にしています。

面白い事実:Ericはナチョスが大好きです!

E Source:ユーティリティ、主要なエネルギー利用者、および小売エネルギー市場の他の主要なプレーヤーに対して、独立した市場情報、コンサルティング、予測データサイエンスを提供しています。

1. エネルギー/ユーティリティ業界において、機械学習はどのようにポジティブな影響を与えていますか?

ビジネスインサイトへのアクセス。前提として優れたデータが必要です。ユーティリティは、顧客からデバイスまで、多くのデータ関係を持っています。具体的には、毎月の請求額やエネルギー節約プログラムへの登録などです。そのようなデータはリレーショナルデータベースに保存される可能性がありますが、デバイスやアセットのデータは、グリッドを構成する機械の部品のようなものです。このようなデータの結びつけは容易ではありません。

さらに、サードパーティのデータとして、空間/ GIS および天気は非常に重要です。機械学習の観点から、実際に影響を与える特徴や結果を見つけて探索することができます。

2. ユーティリティ業界における最大の機械学習の課題は何ですか?

解明が必要なことがあります。機械学習ができること、監視が必要なこと、または不十分なことがどこかを。ユーティリティ業界は、運用方法を確立しているため、機械学習は破壊者と見なされることがあります。そのため、部門は新しい技術やパラダイムを採用するのに遅れることがあります。ただし、実践者が結果を証明できれば、結果がトラクションを生み、より大きな採用意欲を醸成します。追加の課題はオンプレミスデータとクラウドおよびインフラへのアクセスです。これは徐々なプロセスであり、忍耐を要する学習曲線があります。

3. ユーティリティ業界への機械学習の統合を試みる際によく見られる間違いは何ですか?

ユーティリティに特有のものではありませんが、あまりにも速く進み、データの品質やシンプルな品質チェックを怠ることです。これに加えて、機械学習は何らかの形で多くのグループで実践されています。課題は、チーム全体で最良の開発プラクティスを統合することです。これはモデルのトラッキングや実験の持続性を意味します。

4. 機械学習の将来で最もワクワクすることは何ですか?

私は10年以上これをやっていますが、なぜかまだ初心者のように感じます。私は平均的なメンバーと呼ばれるのがラッキーなチームの一部であることに感謝しています。私の感覚では、次の10年以上はデータエンジニアリングにより焦点を当て、機械学習によってカバーされるユースケースの数がさらに増えるでしょう。


🤗 MLディレクターのインサイト第1弾に参加していただきありがとうございます。引き続き、SaaS、金融、およびeコマースのMLディレクターからのさらなるインサイトをお楽しみにしてください。

エリック・ゴリンコ、ニコラス・ベルタニョーリ、ネイサン・カヒル、アリナ・ザレ、リー・タン、アーチ・ミトラに素晴らしいインサイトと参加をいただき、大きな感謝を申し上げます。私たちは、それぞれの継続的な成功を見守り、すべての段階で応援しています。 🎉

最後に、Hugging Face Experts と一緒に ML ロードマップを加速させたい場合は、 hf.co/support をご覧ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

OpenAIのCEOであるSam Altman氏:AIの力が証明されるにつれて、仕事に関するリスクが生じる

OpenAIのCEOであるSam Altmanは、特に彼の作品であるChatGPTに関するAIの潜在的な危険性について公言してきました。最近のイ...

機械学習

ヴェクタラは、AI言語モデルの「幻覚」をベンチマーク化し、対処するための画期的なオープンソースモデルを立ち上げます

急速に進化するGenerative AI(GenAI)領域での責任追及を促進する前例のない取り組みとして、Vectaraはオープンソースの幻覚...

データサイエンス

「PyTorchでのSoft Nearest Neighbor Lossの実装方法」

表現学習は、深層ニューラルネットワークによって与えられたデータセット内の最も顕著な特徴を学習するタスクです通常は教師...

機械学習

「LoRAアダプターにダイブ」

「大規模言語モデル(LLM)は世界中で大流行しています過去の1年間では、彼らができることにおいて莫大な進歩を目撃してきま...

データサイエンス

「データ管理におけるメタデータの役割」

「メタデータは現代のデータ管理において中心的な役割を果たし、統合、品質、セキュリティに不可欠であり、デジタルトランス...

データサイエンス

拡散モデルの利点と制約

拡散モデルは、非常にリアルな映像を通じて生成型AIを進化させますが、計算ニーズと倫理面に制約がありますその能力と課題を...