データサイエンティストの役割の典型
データサイエンティストの役割の典型
データサイエンスの役割は非常に異なる場合があり、求人広告は常に明確ではありません。あなたはどんな帽子を被りたいですか?
最近のTowards Data Scienceの投稿が好評だったので、データサイエンスの求職者について、実際の仕事のカテゴリについて少し書いてみようと思いました。以前は候補者について話していましたが、今日は実際の仕事が日々どのようなものかについて話したいと思います。
つまり、これは求人広告に明記されていることとは異なる、データサイエンスのプロフェッショナルの実際の仕事内容を説明します。どのような仕事を本当に行っているのか、組織の組織図上でどの位置にいるのか(おおよそ)を説明します。
なぜこれが重要なのか?
求職中のデータサイエンティストは、自分のキャリアのどの段階にいようとも、求人広告や仕事の説明文を読む際に、言外の意味を読み取らなければなりません。求人広告には多くの言葉遣いや婉曲表現が含まれており、日々の仕事内容や成功するために必要なスキルがどのようなものかを判断するのは難しいです。
また、自分がやりたいと思う仕事内容がどのようなものかを知ることも重要です!データサイエンスの幅広い分野の中で、おそらく他の分野よりも好きな部分や、もっと学びたいと思うことがあるでしょう。間違った役割になると、自分のキャリアが望ましくない方向に進んでしまう可能性があります。
- 「AIの新機能:ChatGPTプラグインとインターネットアクセスの最新情報」
- 「ODSC West Data PrimerシリーズでAIの学習を始めましょう」
- Databricks ❤️ Hugging Face 大規模言語モデルのトレーニングとチューニングが最大40%高速化されました
この記事は、求人広告の文言を読み解くのを手助けし、応募と面接に時間を費やす前に仕事内容を正確に知ることができるようにするために役立つことを目指しています。また、文言の裏にある役割が本当に一人で遂行可能なものかどうかを読み解く際にも重要です。後で説明するように、企業によっては1人のデータサイエンティストに多くの業務を一任しようとする場合があり、その役割に採用された人にとっては持続可能で快適ではありません。
求職中のデータサイエンティストは、自分のキャリアのどの段階にいようとも、求人広告や仕事の説明文を読む際に、言外の意味を読み取らなければなりません。… 間違った役割になると、自分のキャリアが望ましくない方向に進んでしまう可能性があります。
注意点
さて、始める前に、読者に対していくつかの注意点を述べておきます。
- 私はほとんどのキャリアをVoAGI規模から非常に小さなテック企業で過ごしており、ビッグテックの個人的な経験はありません。このため、この記事のフィードバックを得るために、このような経験を持つ友人たちに相談しましたが、私の一般的な考えはどこでも当てはまると思います。ただし、間違いがあるかもしれません。
- これらはすべて一般論です。これらの考えが正しいとは思いますが、冗談も含まれています。すべてを真剣に受け止める必要はありませんが、私はこの奇妙な分野について少し笑いを取り入れたいと思っています。
- 後で再度言及しますが、これらはアーキタイプであり、誰かの仕事の説明文の「正確なテキスト」ではありません。アーキタイプは私たちが物事をグループ化するために役立ちますが、実際の生活では例外や融合、その他の特殊なケースが存在するでしょう。
それでは、データサイエンティストのアーキタイプについて話し始めましょう!
アナリティクスのスペシャリスト
私は最も低評価されていて価値が認識されていない役割であるアナリティクスから始めます。あなたは会社が目標を達成しているか、物事が正常に機能しているかを判断するのを助ける存在です。これは非常に重要であり、非常に曖昧で実際には難しいことです。日々行う可能性のあるさまざまな作業があります。ダッシュボードの作成、売り上げや製品の成功などの分析、および内部パフォーマンスの分析(離職率など)などです。一部の人々はあなたの仕事が単なる「ダッシュボードを作ってほしい」と思うかもしれませんが、ダッシュボードを作成する場合でも、ダッシュボードに何を計測すべきか、ダッシュボードが必要なのか、実際の目標と合致するメトリックをどのように計算できるかについて多くの時間を費やすことになるでしょう。
以前の10年で、あなたはオペレーションアナリストやBIスペシャリストと呼ばれていたかもしれません(今でもそう呼ばれることがあります)。変わったデータや奇妙なソースからのデータを処理することが期待されており、多くのSQLを使用します。自然言語処理(NLP)をフィードバックの応答に適用するなど、機械学習をほとんど行わないでしょう。製品の効果を分析する場合、A/Bテストを多く行います。あなたはマーケティング部門や単独の分析部門に所属しているかもしれませんが、ビジネスのあらゆる場所から「数字」を頻繁に求められる可能性があります。
フィーチャービルダー
一方、あなたは製品をより良くするためにここにいます。理想的には、DS/MLの魔法をいくつか持っていることです。おそらく、組み込みの推奨エンジンや検索結果の並べ替えなど、製品内で提案を行うAIを含む製品を提供することを経営陣が望んでいるでしょう。もしあなたが幸運なら、革新的な機能を構築し、製品にクールな要素を追加することができるかもしれませんが、空白のページとあいまいな命令から始めることがうまくいかない場合、これはあなたには向いていないかもしれません。
あなたは顧客や業界について学ぶ必要がありますので、単にクールなだけでなく役に立つものを作る必要があります。顧客の意見を聞き、顧客対応部門と話すべきですが、この役割の人々はしばしばそうしません(これは悪い選択です)。自分自身でA/Bテストを行うか、アナリティクスの専門家に任せるかもしれません。あなたが作ったものが優れているかどうかを評価する際には、アナリティクスの専門家(またはそれと重なる部分)が必要です。あなたはPythonで作業します。おそらく製品部門に所属していますが、よくエンジニアリングと話をします。
インフラビルダー
関連性があると思いますが、これはより適切にはMLエンジニアと呼ばれるでしょう。新しいモデルを取り入れて製品に組み込むためのパイプを作成するよう求められます。たとえば、検索結果が関連度に基づいて並べ替えられるようにしたり、適切な人々に新しいウィジェットを提供したりすることです。モデル自体の作業に関与することもありますが、それほど頻繁ではありません(壊れた場合やページが表示された場合に対応するデータサイエンティストとしては、最も頻繁に呼ばれる種類のデータサイエンティストです)。スケーリングと並列化は重要な要素となり、レイテンシと遅延に対する深い関心を持つ必要があります。
あなたの日常のツールキットにはDocker、製品が書かれている言語、そしてThe Feature Builderが作成したものを製品に組み込むためのPythonが含まれています。何らかの観測ツールも重要です。おそらくエンジニアリング部門に所属しているか、またはデボップスの部門でしょう。
内部専用
大企業になるまでそれほど一般的ではありませんが、あなたは自社の他の部門が使用するためのMLツールを構築している人です。フィーチャービルダーとそれほど変わりませんが、作成するモデルはビジネス内でのみ使用され、業務の改善を図ります。顧客は会社内で働く他の人々であり、財・サービスを提供するために会社にお金を支払う外部の人々ではありません。そのため、外部の顧客についてはあまり詳しく知る必要はありませんが、会社の組織図についてはよく知っているでしょう。
成功するためには、同僚が繰り返し行っている面倒な作業を調べ、自動化したりモデルをトレーニングして代わりに行う必要があります。そうすれば、あなたは非常に人気が出るでしょう。作成したものはオープンソース化され、最終的にAirflowやH3のような製品になるかもしれません。おそらくエンジニアリングの部門に所属しています。
研究者
珍しい存在ですが、純粋な研究を行うために雇われる人です。おそらく学術的な記事を書いて会社のプロフィールを高めるなどの役割が期待されていますが、この役割は自己維持することを期待されていません。この役割はおそらくCEOの特別プロジェクトなどに属しているでしょう。オンラインで読んだ興味深いアイデアについて調査し、その分野で何かをする方法や、会社がその空間で何かを行うことができるかを見つけるよう求められるでしょう。LLMsに関するすべてのSlackの会話にタグ付けされます。この投稿全体で唯一、Ph.D.を求めることが妥当とされる役割です。
ソリューションエンジニア
あなたの会社のためではなく、顧客のためにデータサイエンスの機能を構築します。これにはデータサイエンスのコンサルティングの仕事も含まれますが、データサイエンスに関連するソフトウェアを構築・販売する会社でもよく見られる役割です。顧客が製品を最大限に活用するために専門のDS/MLのスキルが必要な場合、会社にはこのような役割が存在する可能性があります。
あなたの製品やサービスのAIの素晴らしい要素を売り込もうとする時に、Salesは技術的な質問に答えるのが苦手なため、顧客の電話に参加することが期待されます。お客様は、あなたが助けたり作成したりするために、さまざまな種類の奇妙なものを持って来ることができるため、かなり多様なテックスタックのスキルセットが必要です。これは実際には非常に楽しいことです。あなたはThe Feature Builderのように業界を理解する必要があり、顧客に対して洗練された態度と忍耐力を持っている必要があります。顧客との対話に時間を費やすため、おそらくカスタマーサクセス部門や営業部門に所属しているかもしれません。
そして最後に..
全ての人への全て
これは、これらの仕事のさまざまな要素を組み合わせた役割であり、しばしば不規則な方法で組み合わせられています。採用マネージャーは、このことが3つまたは4つの仕事であることに気づいていないか、あるいは1つの給与で全てを行うことができると考えているかもしれません。おそらく、求められる仕事に対して給与が低すぎるでしょう。これは、既存のデータサイエンス機能がない組織や初めてデータサイエンスの担当者を採用している組織でよく見られます。やることによってたくさん学ぶ機会ではありますが、あなたを教えてくれるより技術的に熟練した人はおそらく周りにいないため、あなたのGoogle/StackOverflow/その他の検索スキルは最高レベルである必要があります。自分自身に新しいことを教えることが好きではない場合、この役割は困難で孤立したものになるかもしれません。友人の一人が言ったように、「あなたは会社であなたがやることで最も優れているかもしれませんが、それはあなたがそれらのことに長けているわけではない」ということです。指導や助けがないため、燃え尽き症候群は現実のリスクです。
しかし本当に..
はっきり言っておきますが、ほとんどのDS/MLの仕事は、おそらくこれらの役割の一部を含んでいます。これらはアーキタイプであり、私の仕事の説明ではありません。 (実際に、私自身の仕事はこれらのカテゴリーに完全に当てはまりません。)
はっきり言っておきますが、ほとんどのDS/MLの仕事は、おそらくこれらの役割の一部を含んでいます。
2つの役割の例:
- 製品アナリティクスのデータサイエンティスト:アナリティクスの専門家とThe Feature Builderの組み合わせ。機能を構築し、自分自身の分析を行い、他の機能/作成されているものの分析も行います。
- フルスタックの機械学習データサイエンティスト:The Feature BuilderとThe Infra Builder。モデルだけでなく、そのモデルを世界に提供するためのパイプも構築しています。
1つの役割で3つ以上の異なるアーキタイプを組み合わせる場合、それは広範すぎると主張します。1人の人間がAnalytics Guru、The Feature Builder、The Infra Builderを成功裏にこなすことはできません。それは回すべきプレートが多すぎるからです。会社が小さいほど、余分な役割を果たさなければならない可能性が高くなりますが、これらは異なる機能であり、広範に広がりすぎることができます。
行く前にさらにいくつかの注意点
DS/MLのキャリアで上級職になるにつれて、さまざまな役割を引き受け、”私の仕事は何か”の境界線が曖昧になります。あなたはビジネスのさまざまな部分で役立つ専門知識と経験を身につけ、人々はあなたの考えを聞くために電話をかけるでしょう。
さらに、ここでは戦略や計画についてはほとんど話しませんでしたが、上級職になるとそれらのことにもより関与するようになります。個々の貢献者であっても、あなたの経験には価値があります-おそらく、現在のテーブルにあるアイデアや問題に似たものを以前に見たことがあるでしょう。それに取り組む方法についての意見を述べるべきです。これは上級職の仕事の一部です。
ここでは戦略や計画についてはほとんど話しませんでしたが、上級職になるとそれらのことにもより関与するようになります。
市場に出ている人やこの分野に進出している学生が、自分がどのような状況に身を置いているのかをより明確に理解できるように、この記事が役立つことを願っています。もし野生の中で明らかにひどい「全ての人への全て」の例を見つけた場合は、それを私に送っていただくか、コメントでリンクを投稿してください。おそらく、私たち全員の娯楽のために最悪の例を解析する記事を将来作成できるかもしれません!
私の他の作品はwww.stephaniekirmer.comで見つけることができます。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles