機械学習インサイトのディレクター[Part 2 SaaSエディション]

'Machine Learning Insight Director [Part 2 SaaS Edition]'

もしもあなたやあなたのチームがMLソリューションの構築に興味があるなら、今すぐhf.co/supportを訪れてください！

👋 マシンラーニングインサイトの第2弾へようこそ。第1弾はこちらをご覧ください。

マシンラーニングディレクターは、さまざまな役割と責任の視点を持つAIテーブルで特別な立場にあります。彼らのMLフレームワーク、エンジニアリング、アーキテクチャ、実世界の応用および問題解決に関する豊富な知識は、MLの現状に深い洞察を提供します。例えば、あるディレクターは、新しいトランスフォーマースピーチテクノロジーの使用により、チームのエラーレートを30％減少させ、単純な思考が多くの計算能力を節約するのに役立つことに気付くでしょう。

SalesforceやZoomInfoのディレクターが現在のマシンラーニングの状況についてどう考えているのか、彼らの最大の課題は何か、そして彼らが最も興奮していることは何か、気になりませんか？それでは、すぐに知ることができます！

この第2弾のSaaSに焦点を当てたインストールでは、ヘルスケアの教科書の著者であり、MLの才能を育成する非営利団体を設立した深層学習の専門家、チェス愛好家のサイバーセキュリティ専門家、リードリコール後のバービーのブランド評判の監視の必要性からビジネスを起こした起業家、そして自身の4人の子供がMLモデルと同じ間違いをするのを見るのが楽しいと感じる特許および学術論文の著者が登場します。

🚀 SaaSのトップマシンラーニングディレクターに会って、彼らがマシンラーニングについてどう考えているか聞いてみましょう：

Omar Rahman – Salesforceでのマシンラーニングディレクター

経歴：オマーは、サイバーセキュリティチームの一環として、MLとデータエンジニアのチームをリードし、MLを防御的なセキュリティ目的で活用しています。以前、オマーはAdobeやSAPでデータサイエンスとMLエンジニアリングのチームをリードし、マーケティングクラウドや調達アプリケーションにインテリジェントな機能をもたらしていました。オマーはアリゾナ州立大学で電気工学の修士号を取得しています。

おもしろい事実：オマーはチェスをすることが大好きで、自由な時間にAIの卒業生を指導しています。

Salesforce：世界トップの顧客関係管理ソフトウェア。

1. MLはSaaSにどのようにポジティブな影響を与えていますか？

MLはSaaSの提供に多くの利点をもたらしています。

a. アプリケーション内の自動化の改善：たとえば、サービスリクエストの文脈を理解し、組織内の適切なチームにルーティングするためにNLP（自然言語処理）を使用するサービスチケットルーター。

b. コードの複雑さの削減：ルールベースのシステムは、新しいルールが追加されると使いにくくなり、メンテナンスコストが増加します。例えば、以前のルールベースのシステムと比較して、MLベースの言語翻訳システムは、より正確で堅牢でありながら、はるかに少ない行数のコードで構築されています。

c. コスト削減につながるより良い予測結果。より正確に予測できることは、供給チェーンのバックオーダーの削減やストレージコストの削減など、コスト削減に役立ちます。

2. SaaS内での最大のMLの課題は何ですか？

a. MLアプリケーションの製品化には、モデルを持つだけでは十分ではありません。モデルを利用して結果を提供し、データの統計の変化を検出し、適応するなど、MLシステムの展開と保守にはかなりのオーバーヘッドが発生します。

b. 多くの大企業では、データがしばしば分断され、適切に管理されていないため、データの統合、前処理、データクリーニングなどにかなりの時間が費やされ、MLベースのアプリケーションを作成するために必要な時間と労力がかかります。

3. SaaSにMLを統合しようとする際に人々がよく見る一般的な間違いは何ですか？

ビジネスの文脈や解決すべき問題に十分に焦点を当てず、最新のアルゴリズムや新しく公開されたライブラリを使おうとすることです。単純な伝統的なML技術で多くのことが達成されることがあります。

4. MLの将来について一番ワクワクしていることは何ですか？

一般的な人工知能の機能が適切に構築・管理されれば、人類を想像以上の方法で変革する可能性があります。私の希望は、医療と交通の分野で大きな進展を見ることです。放射線学におけるAIの恩恵はすでに見られ、人的手段を節約することでより複雑なタスクに集中することができるようになりました。自動運転車やトラックはすでに交通部門を変革しています。

Cao (Danica) Xiao – Amplitude の機械学習シニアディレクター

背景：Cao (Danica) Xiao は、Amplitude のデータサイエンスと機械学習のシニアディレクター兼データサイエンスと機械学習の責任者です。彼女のチームは、マルチソースのユーザーデータに基づいて、デジタル製品の分析と最適化に関する重要なビジネス課題を解決するための自己学習型の機械学習モデルと製品の開発・展開に焦点を当てています。さらに、彼女はリーディングな CS 学会で発表された 95 以上の論文を持つ情熱的な機械学習研究者でもあります。彼女はまた、機械学習のロードマップ作成、チームビルディング、メンタリングにおける豊富な経験を持つテクノロジーリーダーでもあります。

Amplitude に入社する前は、Cao (Danica) は IQVIA の Analytics Center of Excellence のグローバル機械学習責任者でした。それ以前には、IBM Research の研究スタッフおよび MIT-IBM Watson AI Lab の研究リードでした。彼女はワシントン大学シアトル校で機械学習の博士号を取得しました。最近では、医療のためのディープラーニングに関する教科書の共著者としても活動し、機械学習の才能を育成する非営利団体を設立しました。

おもしろい事実： Cao は猫好きで、シンガプーラの女の子とブリティッシュショートヘアの男の子の2匹の猫の飼い主です。

Amplitude：カスタマーがより良い製品を作るのを支援するクラウドベースの製品分析プラットフォーム。

1. SaaS において機械学習がどのようなポジティブな影響をもたらしているか

機械学習は、巨大でノイズの多い機械生成またはユーザー生成のデータを、個人化、予測、推薦などのあらゆるビジネスの質問の答えに変える、ゲームチェンジングな役割を果たしています。これにより、SaaS を介して業界のさまざまな領域に影響を与えることができます。

2. SaaS 内の最大の機械学習の課題は何ですか

より広範な業界のユースケースをカバーするための機械学習モデルトレーニング用のデータの不足です。すべての業界の一般的な解決策であるにもかかわらず、ビジネスから生じる業界固有のニーズを扱う方法、または ML モデルの品質に影響を与えるドメインの変化の問題を解決する必要があります。

3. SaaS プロダクトに機械学習を統合しようとする際によく見られる間違いは何ですか

ビジネスの成功に重要なビジネス知識や他の人間の要素をユーザーに組み込む柔軟性を与えないことです。たとえば、セルフサーブの製品推薦では、ユーザーが推薦製品の多様性を制御できると良いでしょう。

4. 機械学習の将来について一番ワクワクしていることは何ですか

機械学習は非常に成功を収めています。また、現在の制約（データの不足、ドメインの変化、ドメイン知識の統合など）に対応するために急速に進化しています。

さらに多くの機械学習技術がビジネスや顧客のニーズを解決するために適用されるでしょう。たとえば、ユーザーが機械学習モデルの出力を理解し信頼できるようにする解釈可能な機械学習、異なるビジネスの意思決定をした場合の代替結果を見積もるための対事実的な予測などです。

Raphael Cohen – ZoomInfo の機械学習ディレクター

背景：Raphael は、健康記録と遺伝子に関する理解の分野で博士号を持ち、20 の学術論文を執筆し、8 つの特許を取得しています。Raphael はまた、NLP、音声、医療、営業、顧客の経路、IT のバックグラウンドを持つデータサイエンスと研究のリーダーでもあります。

おもしろい事実： Raphael には4人の子供がおり、彼らが学び、彼のいくつかの機械学習モデルと同じ間違いをするのを見ることを楽しんでいます。

ZoomInfo：世界最大のビジネスデータベースに裏打ちされたインテリジェントな営業およびマーケティングテクノロジー。

1. SaaS において機械学習がどのようなポジティブな影響をもたらしているか

機械学習は、会話データの転記を容易にし、人々が新しい洞察や理解を得るのを支援しています。人々は今では、話した内容、要約された目標、まとめ、話した人、最良の質問をした人、次のステップなどを簡単に確認できます。これは、電子メールやビデオ会議などの多くのインタラクションに非常に役立つものです（これらは今まで以上に一般的です）。

Chorus.aiを使用すると、会話をリアルタイムで記録しながら転写することができます。これにはWave2Vecというアルゴリズムを使用しています。🤗 Hugging Faceは最近、トレーニング用に作成された独自のWave2Vecバージョンをリリースしました。この新世代のトランスフォーマースピーチ技術は非常に強力で、私たちのエラーレートを30%減らしました。

会話を転写した後、内容を調べることができます – これがNLPの役割であり、Hugging Face Transformersに大いに依存しています。これにより、録音やメールの中に約20のトピックカテゴリを描写することができます。例えば、価格設定、契約締結、次のステップなどについて話し合っているかどうか、これらのトピックはメールで送信されるか話し合われるため、会話をすべて振り返ることなくその情報を抽出することが容易になりました。

これにより、人々は仕事をより良くすることができます。

2. SaaS内での最大のMLの課題は何ですか？

最大の課題は、いつMLを利用すべきかを理解することです。

MLでどの問題を解決できるのか、どの問題を解決すべきでないのかを理解することが重要です。多くの場合、MLモデルでブレークスルーを達成することがありますが、計算量の軽いヒューリスティックモデルの方が問題を解決するのに適しています。

これが強力なAI戦略の重要性です。最終的な製品がどのように機能し、どの効率性を持っているかを理解することです。

また、低い環境/計算リソースでMLモデルを本番環境に組み込む方法も問題です。これには誰もが苦労しています。モデルを効率的な方法で本番環境に保持する方法を見つけることは難しいです。

Wav2Vecフレームワークに移行したときの素晴らしい例です。これにより、会話の音声を15秒のセグメントに分割し、この巨大なモデルに供給する必要がありました。この過程で、無音のセグメントをモデルに多く供給していることがわかりました。誰かが現れない場合や、1人が別の人を待っている場合に一般的です。

非常に軽量なモデルを追加して、無音のセグメントをこの大規模で複雑なMLモデルに送信しないようにすれば、多くの計算能力/エネルギーを節約することができます。これは、エンジニアが他のより簡単な方法を考えてモデルの製作を加速し、リソースを節約する機会がある例です。

3. SaaSにMLを統合しようとする際によく見られる間違いは何ですか？

私の解決策は最も優れた解決策なのでしょうか？これをより効率的に分割して解決するためのより良い方法はあるでしょうか？

話者を特定する際、私たちはMLの方法を直接使用しましたが、ビデオ会議プロバイダのデータと比べると正確さに欠けていました。

その後、会議プロバイダのメタデータから話者を特定し、それにスマートな埋め込みモデルを重ねることが最良の方法であることを学びました。この学習カーブの間に貴重な時間を失いました。私たちは、より効率的に進展するために投資すべき他のデータソースがあることを理解するために、この大規模なMLソリューションを使用すべきではありませんでした。

固定観念にとらわれず、他の誰かが作成したものを受け入れて、これをより良くする方法を考えるべきです。問題をより良く理解することで、どこでよりスマートになれるでしょうか？

4. MLの将来について一番ワクワクしていることは何ですか？

私たちはまた、別の革命の真っ只中にいると思っています。Wave2Vecモデルによるエラーレートの30%の低下を見たとき、驚きました。長年にわたって1%ずつしか減らせなかったのに、わずか3ヶ月でこのような大幅な改善を見ました。学界では、大きな進歩が起こっています。これらの事前学習済みモデルにより、以前は想像もできなかったことが可能になっています。これは非常に興奮します！

私たちはまた、NLPから他の領域（音声やビジョンなど）に技術が進出し、それらをパワーアップするのを見ています。

また、モデルの生成についても非常に興奮しています！最近、Bria.aiという会社と協力して、驚くべきGANを使用して画像を生成しました。ストック写真を取り、例えば「メガネを外す」「メガネを追加する」「髪を追加する」と言って異なる写真に変換することができます。アイデアは、これをデータ生成に使用できることです。会議で笑顔でない人の画像を取得し、笑顔に変えることで、笑顔検出のためのデータセットを構築することができます。これは画期的です。1つの画像を100枚に変換することができます。サービス業界内での強力な応用が考えられます。

最後の考えはありますか？

–モデルを本番環境に導入することは難しいです。データサイエンスチームにはエンジニアリングが必要です。エンジニアはAIチームの一員であるべきです。これは将来的に重要な構造的な転換になります。

Martin Ostrovsky Repustate Inc.の創業者/CEO兼機械学習ディレクター

背景：マーティンはAI、機械学習、自然言語処理に情熱を持ち、開発と改善を担当するクロスファンクショナルチームの指導を通じてRepustateのすべての製品の戦略と成功を導いています。彼はRepustateのグローバルテキスト分析API、感情分析、ディープサーチ、固有表現抽出ソリューションの戦略、ロードマップ、機能定義を設定しています。彼はYork大学でコンピュータサイエンスの学士号を取得し、SchulichビジネススクールでMBAを取得しました。

おもしろい事実：私が最初に使用したMLのアプリケーションはバービーのおもちゃでした。私のSchulichビジネススクールの教授が、バービーがおもちゃのリコールによりブランドの評判を監視する必要があると言いました。各ソーシャル投稿やオンライン記事を手動で確認するための人々を雇うことは非効率で無効に思えました。そこで、すべてのソーシャルメディアやオンラインチャンネルから人々が彼らについてどう考えているかを監視するための機械学習アルゴリズムを作成することを提案しました。そのアルゴリズムはシームレスに動作しました。そして、それが私が自分の会社の名前をRepustate（「repu」tationの「state」）とするきっかけとなりました。🤖

Repustate：企業向けのテキスト分析サービスのリーディングプロバイダー。

1. お気に入りのMLビジネスアプリケーションは何ですか？

私のお気に入りのMLアプリケーションはサイバーセキュリティです。

サイバーセキュリティは、データに関していかなる企業（政府または非政府）にとっても最も重要な部分です。機械学習は、サイバー脅威を特定し、サイバー犯罪（サイバーブリーリングを含む）との戦いを支援し、セキュリティ侵害へのより迅速な対応を可能にします。MLアルゴリズムは、ユーザーデータに基づいて最も可能性の高い脆弱性と潜在的なマルウェアやスパイウェアアプリケーションを迅速に分析できます。エンドポイントの入力パターンの歪みを検出し、潜在的なデータ侵害として識別できます。

2. 最も大きなMLの課題は何ですか？

最大のMLの課題はアラビア語の音声からテキストへの変換です。アラビア語を解読できるシステムはかなりありますが、正確性に欠けています。アラビア語は26カ国の公用語であり、ネイティブスピーカーは2億4700万人、非ネイティブスピーカーは2900万人います。アラビア語は豊かな語彙と多くの方言を持つ複雑な言語です。

正確な洞察を得るためには、センチメントマイニングツールはアラビア語のデータを直接読む必要があります。それ以外の場合、アラビア語の翻訳では微妙なニュアンスが失われてしまいます。テキストを英語や他の言語に翻訳すると、アラビア語の単語の意味が完全に変わることさえあります。そのため、アルゴリズムはアラビア語のデータセットでトレーニングされ、専用のアラビア語の品詞タガーを使用する必要があります。これらの課題のため、多くの企業は現在でも正確なアラビア語の音声からテキストへの翻訳を提供できません。

3. MLを統合しようとする際によく見られる間違いは何ですか？

企業がMLを統合しようとする際に最もよく見られる間違いは、トレーニングデータセットに十分なデータがないことです。ほとんどのMLモデルは、良いデータと不十分なデータを区別することができません。そのため、トレーニングデータセットは関連性があると見なされ、ほとんどの場合、結果を決定するための前例として使用されます。この課題は、小規模またはVoAGIサイズの企業に限定されるものではありません。大企業も同じ課題を抱えています。

MLプロセスに関係なく、企業はトレーニングデータセットが望ましい結果のために信頼性があり、包括的であり、一貫性のあるものであることを確保するために、機械学習の早い段階に人間の要素を組み込む必要があります。

ただし、企業は正確で包括的かつ一貫したトレーニングデータの徹底的なレビューによって、成功する機械学習プロジェクトのための必要な基盤を作ることができます。

4. 次の5〜10年でMLが最も大きな影響を与えると思われる分野はどこですか？

次の5〜10年で、MLは医療セクターの変革に最も大きな影響を与えるでしょう。

ネットワーク化された病院とつながったケア：

予測ケアにより、コマンドセンターは臨床データと位置データを分析し、リアルタイムで医療ネットワーク全体の供給と需要を監視する準備が整っています。機械学習により、医療従事者は高リスク患者をより迅速かつ効率的に発見することができ、システム内のボトルネックを解消することができます。感染症の拡散をより早くチェックすることができ、流行病を管理するためのより良い対策を取ることができます。特に遺伝病に関しては、リスクのある患者をより正確に特定することができます。

スタッフと患者の体験の向上：

予測医療ネットワークは、待ち時間の短縮、スタッフの業務フローの改善、増大する管理の負担の軽減が期待されています。すべての患者、診断、手順から学ぶことにより、機械学習は病院スタッフと患者に適応する体験を創造することが期待されています。これにより、健康の結果が改善され、医療従事者の不足や過労が軽減され、システムが財政的に持続可能になります。

🤗 MLディレクターのインサイト第2弾にご参加いただき、ありがとうございます。今後もファイナンス、ヘルスケア、eコマースのMLディレクターからのさらなるインサイトにご期待ください。

Omar Rahman、Cao (Danica) Xiao、Raphael Cohen、Martin Ostrovskyには、素晴らしいインサイトとご参加いただき、大きな感謝を申し上げます。各々の継続的な成功を見守り、応援していきます。🎉

もしあなたやチームがHugging Face Expertsと共にMLのロードマップを加速させたい場合は、hf.co/supportをご覧いただき、詳細をご確認ください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

機械学習インサイトのディレクター[Part 2 SaaSエディション]

Omar Rahman – Salesforceでのマシンラーニングディレクター

1. MLはSaaSにどのようにポジティブな影響を与えていますか？

2. SaaS内での最大のMLの課題は何ですか？

3. SaaSにMLを統合しようとする際に人々がよく見る一般的な間違いは何ですか？

4. MLの将来について一番ワクワクしていることは何ですか？

Cao (Danica) Xiao – Amplitude の機械学習シニアディレクター

1. SaaS において機械学習がどのようなポジティブな影響をもたらしているか

2. SaaS 内の最大の機械学習の課題は何ですか

3. SaaS プロダクトに機械学習を統合しようとする際によく見られる間違いは何ですか

4. 機械学習の将来について一番ワクワクしていることは何ですか

Raphael Cohen – ZoomInfo の機械学習ディレクター

1. SaaS において機械学習がどのようなポジティブな影響をもたらしているか

2. SaaS内での最大のMLの課題は何ですか？

3. SaaSにMLを統合しようとする際によく見られる間違いは何ですか？

4. MLの将来について一番ワクワクしていることは何ですか？

最後の考えはありますか？

Martin Ostrovsky Repustate Inc.の創業者/CEO兼機械学習ディレクター

1. お気に入りのMLビジネスアプリケーションは何ですか？

2. 最も大きなMLの課題は何ですか？

3. MLを統合しようとする際によく見られる間違いは何ですか？

4. 次の5〜10年でMLが最も大きな影響を与えると思われる分野はどこですか？

Was this article helpful?

Gradio 3.0 がリリースされました！

学生アンバサダープログラムの応募受付が開始されました！

機械学習

Midjourney v5.2の新しいズームアウト機能の使い方（最良の例）

「LeNetのマスタリング：アーキテクチャの洞察と実践的な実装」

「AIガバナンスにおけるステークホルダー分析の包括的ガイド（パート2）」

なぜ包括的な画像セットが私たちにより良い製品作りを助けるのか

ChatGPT Vislaプラグインを使用してビデオを作成する方法

インディアナ大学の研究者たちは、「Brainoware」という最先端の人工知能技術を発表しましたこの技術は、脳器官のようなオルガノイドとシリコンチップからインスピレーションを受けています