マシンラーニングエンジニアは、実際に何をしているのでしょうか?
マシンラーニングエンジニアは何をしているのか?
「Machine Learning Engineer」という言葉は、私たちの分野に何か新しい意味を持っているのでしょうか?もしそうなら、それは何を意味するのでしょうか?
もちろん、このタイトルはトリックの質問です。データサイエンティストの前に、Machine Learning Engineerというタイトルは、私たちの職業市場でトレンドとなっていますが、このタイトルの意味や含むべき機能やスキルについては合意がありません。私は、DS/MLの仕事市場に新しく参入する人々がこれを解読するのが困難だと想像しています(経験豊富な人でもです!)。だから、話す人によってどのような意味を持つかについて話しましょう。
先日友人とこれについて話していたとき、私は「MACHINE LEARNINGエンジニア」または「machine learning ENGINEER」という表現で話しました。基本的に、私が見てきた限りでは、このタイトルの下での役割や期待は、次のいずれかのキャンプで広範なソフトウェアエンジニアリングのスキルを期待しているか、少なくともMLについての経験や理解があるか、またはMLの経験、特にディープラーニングや生成モデルについての経験を期待しており、必要に応じて関数を書けると良いというものです。
- A. ソフトウェアエンジニアリングのスキルを広範に期待し、少しのMLの経験または少なくともMLについての理解を求める、または
- B. MLの経験を強く期待し、ディープラーニングや生成AIを含むことが多く、必要な場合には関数を書くことができる能力も求める。
前者のグループは、以前の年に単に「ソフトウェアエンジニア」と呼ばれていたかもしれませんし、後者のグループは、私がキャリアをスタートさせた頃には「データサイエンティスト」としてゆったりと分類されていたかもしれません(ただし、生成AIは当時はまだゲームの一部ではありませんでした)。
これは、私たちの職業の発展における興味深いパターンを反映しています。私たちは、役割を明確に区別し、役割のスキルセット(または責任)を明確に示すような分類を作ることが得意ではありませんでした。これは、急速に変化し続ける若い分野なので、これは驚くべきことではありません!これは常にData Scientistのタイトルにも当てはまりました。長い間、Data Analystよりも技術的に優れたスキルを持つ人々を区別するためのものでした。一部の人々は、Data Scientistを、非構造化または非整理データを扱える人々として言及していましたが、私が見ている限り、それは定義の要素としてはなくなっています。
- RecList 2.0 オープンソースによるMLモデルの体系的なテストシステム
- 「HaystackにおけるRAGパイプラインの拡張 DiversityRankerとLostInTheMiddleRankerの紹介」
- 「NVIDIA H100 Tensor Core GPUを使用した新しいMicrosoft Azure仮想マシンシリーズが一般利用可能になりました」
私は強く、MLEの成長は、SWEタイプの人材を採用している人々が、MLモデルの使い方を知っている候補者を得られないことにイライラしていたためであり、データサイエンティストを採用している人々は、モデル作成のスキルセットを持ったモデラーが必要なのに分析専門家を得ていたため、双方から交差し、各スキルセットの重要性について内部で意見の相違が生じた新しいタイトルが形成されたのだと考えています。したがって、私たちは新しい分野での新たな分割を考える必要があります。
この分野の分割は、この種の困難に対する反応として非常に自然なものであると思われますが、候補者と分野に対してこれが何を意味するのかについて一点指摘したいと思います。新しい分割が起こり、キャリアパスに新たな分岐点があるときには、通常、それぞれのルートにステータスと特権が与えられ、それは主にそれぞれの方向の給与で検出できます。データサイエンスの分野が教育機会などで形式化されるにつれ、人々はより簡単な経路でこのキャリアに進むことができるようになりました。これには、広範な社会において不利な立場にある人々やマージナライズされた人々も含まれます。私は、データサイエンティストのピンクカラー効果のリスクにさらされていると考えています。
(要するに、ピンクカラー効果とは、特に女性が特定の分野で労働者の大部分を占め、それによって役職の給与や社会的地位が系統的に低下する現象のことです。獣医学が一般的な例です。逆に、1960年代と1970年代初頭には女性がコンピュータプログラマーの中で優勢であり、男性がその分野でより代表的になったときには、彼らの給与と威信が上昇しました。)
これは実際に起こっているのでしょうか?私は真実を知りません。HarnhamやBurtch Worksなどの業界レポートやLinkedInなどの求人情報を閲覧するなど、産業報告からの個別の証拠しか見ていませんが、Data ScientistとML Engineerの間で給与の差が生じ始めているように思えます。私は確かに、5年前よりも多くの若い女性、POC、異なる性自認や性的指向の人々とデータサイエンティストの役割で出会います。
研究者がこの給与の変化が統計的に有意なものであるかどうか、そしてもしそうである場合、それが私の疑念するように労働者の人口統計に変化をもたらしているかどうかを調査できるといいなと思います。
それにもかかわらず、この分野で採用を行う人々に対する課題は、より一流で「技術的」な採用(例:今は機械学習エンジニア)が男性や社会的に有利な人々によって主導されることを許さないことです。また、能力に関係なく、データサイエンティストの採用が他の分野での人々が押し込められるような低い地位の変種になることも避けましょう。もちろん、それぞれの役割に対してビジネス価値に見合った報酬を提供してください。ただし、そのことが各役割に対して考慮する人々の人種・民族の構成に影響を与えないようにしましょう。現在の常に進化し続けるゲームの段階では、それが私たちにできる最低限のことです。
私の作品はwww.stephaniekirmer.comで見つけることができます。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- SIGGRAPH特別講演:NVIDIAのCEOがLAショーに生成AIをもたらす
- 「音のシンフォニーを解読する:音楽工学のためのオーディオ信号処理」
- 「データリテラシーのあるワークフォースを構築するための4つの重要なポイント」 1. データリテラシーの重要性を理解する:データリテラシーの重要性を従業員に説明し、データの価値とビジネスへの影響を強調します 2. データスキルの獲得を促進する:従業員にデータスキルを獲得するためのトレーニングやリソースを提供し、データの分析や解釈能力を向上させます 3. データ文化を醸成する:データに基づいた意思決定やデータの共有を奨励し、従業員がデータを活用する習慣を養成します 4. データセキュリティに対する意識を高める:データセキュリティの重要性を従業員に啓発し、データの保護とプライバシーの確保についての最善の方法を教育します
- データサイエンスのインタビューのためのA/Bテストのマスタリング:A/Bテストの概要
- データオブザーバビリティの先駆け:データ、コード、インフラストラクチャ、AI
- 「BFS、DFS、ダイクストラ、A*アルゴリズムの普遍的な実装」
- このAI研究は、近くの電話によって記録されたキーストロークを聞くことで、95%の正確さでデータを盗むことができるディープラーニングモデルを紹介しています