就職を助けることができる5つの珍しいデータサイエンスのスキル

就職をサポートするための5つの珍しいデータサイエンスのスキル

 

機械学習の決定木を作成する方法を知っている場合、おめでとうございます。あなたはChatGPTや他の数千人のデータサイエンティストと同じレベルのコードの専門知識を持っています。あなたが望む仕事に応募している他のデータサイエンティストと競合するためには、プログラミング能力だけでは不十分です。

最近の採用マネージャーの間で興味深いトレンドの1つは、生のコーディング能力だけではもはや十分ではないということです。採用されるためには、言語やフレームワーク、StackOverflowでの検索方法を知るだけでは不十分です。より概念的な理解と、今日のデータサイエンスの状況を把握する必要があります。これには、データガバナンスや倫理など、一部の人々が企業のCEOだけが関心を持つと思っているようなことも含まれます。

知っておくべき多くの技術的・非技術的なデータサイエンスのスキルがありますが、採用が難しい場合、これらの一般的でないデータサイエンスのスキルが就職の足がかりになるかもしれません。

 

1. モデルの可視化

 

以前、データサイエンティストは孤立して暗い地下の地下室でモデルを作成していました。モデルは予測や洞察を作成し、それらは理解していないままCスイートの重役に渡されていました。(少し大げさに言いましたが、それほどでもありません。)

今日では、リーダーシップはデータサイエンティストの成果物をより積極的に理解する役割を果たしています。つまり、データサイエンティストとして、モデルがなぜそれを行うのか、どのように機能するのか、なぜ特定の予測が出てきたのかを説明できる必要があります。

ボスにモデルを実行している実際のコードを表示することもできますが、モデルの動作を視覚的に示すことがずっと役立ちます。たとえば、電気通信会社の顧客の離反を予測するMLモデルを開発したとします。コードのスクリーンショットではなく、フローチャートや決定木のダイアグラムを使用して、モデルが顧客をセグメント化し、離反のリスクがある顧客を特定する方法を視覚的に説明することができます。これにより、モデルのロジックが透明化され、理解しやすくなります。

コードを説明する方法を知ることは、まれなスキルですが、確かに開発に値するものです。コースはまだありませんが、Miroのような無料のツールを使用して、フローチャートを作成して決定木を文書化することをお勧めします。さらに良い方法としては、データサイエンティストではない友人や家族にコードを説明してみることです。少ない専門用語、ほどよいです。

 

2. 特徴エンジニアリング

 

 

多くのデータサイエンティストは、入力データの微妙なニュアンスよりもモデルアルゴリズムに重点を置きがちです。特徴エンジニアリングは、機械学習モデルの性能を向上させるために、特徴(入力変数)の選択、変更、作成を行うプロセスです。

たとえば、不動産価格の予測モデルに取り組んでいる場合、広さ、ベッドルームの数、場所などの基本的な特徴から始めるかもしれません。しかし、特徴エンジニアリングを通じて、より微妙な特徴を作成することができます。最寄りの公共交通駅までの距離を計算したり、物件の年齢を表す特徴を作成したりすることができます。また、犯罪率、学校の評価、施設への近さに基づく「場所の魅力度スコア」という新たな特徴を作成するために既存の特徴を組み合わせることもできます。

これは、技術的な知識だけでなく、深いドメイン知識と創造性が必要なため、まれなスキルです。データと解決すべき問題に本当に理解を持ち、データを創造的に変換してモデリングにより役立つものにする必要があります。

特徴エンジニアリングは、Coursera、edX、Udacityなどのプラットフォームで提供されているより広範な機械学習コースの一部として紹介されることが多いですが、実際のデータで作業し、さまざまな特徴エンジニアリング戦略を試してみることが最も効果的な学び方だと思います。

 

3. データガバナンスの理解

 

以下は仮想の質問です:あなたは医療関連企業のデータサイエンティストです。特定の疾患のリスクがある患者を特定するための予測モデルの開発に取り組んでいます。最も大きな課題は何だと思いますか?

「ETLパイプラインに取り組んでいる」と答えたなら、それは間違いです。あなたの最大の課題は、モデルが効果的であるだけでなく、規制に適合し、倫理的で持続可能であることです。これには、HIPAAやGDPRのような規制に準拠したモデルのために収集するデータが準拠していることを確認することも含まれます。データを使用することが法的に許可される場合、どのように匿名化する必要があり、患者から必要な同意を得る方法、それを得るためにはどのような同意が必要かを知る必要があります。

また、データソース、変換、モデルの意思決定を文書化する必要があります。これにより、非専門家でもモデルを監査できるようになります。この追跡可能性は、規制の遵守だけでなく、将来のモデルの監査と改善にとって重要です。

データガバナンスを学ぶ場所:情報量は多いですが、Global Data Management Communityは素晴らしいリソースの1つです。

 

 

4. 倫理

 

「データサイエンスは統計を理解し、モデルを作成し、傾向を見つけることができるが、実際の倫理的なジレンマを想像することができない」とRedditユーザーのCarlos_tec17は間違って言いました。

法的な遵守に加えて、考慮すべき倫理的な側面があります。作成するモデルが特定のグループへの不平等な扱いを引き起こす可能性のあるバイアスを誤って導入しないようにする必要があります。

Amazonの旧募集モデルの例が倫理の重要性を説明するのに好例です。もしその例を知らなければ、Amazonのデータサイエンティストは、履歴書に基づいて潜在的な採用者を選ぶことができるモデルを作成して、採用プロセスを迅速化しようとしました。しかし、彼らは既存の履歴書のデータでモデルを訓練しましたが、それは非常に男性が優勢でした。彼らの新しいモデルは男性の採用を優遇するバイアスがかかっていました。それは非常に倫理的に問題があります。

データサイエンスの「急いで進めても問題は起きない」という時代は遠い過去のものです。現在、データサイエンティストとして、あなたの判断が人々に実際に影響を与えることを知る必要があります。無知はもはや言い訳になりません。モデルの可能な影響と、その意思決定の根拠を完全に理解する必要があります。

UMichiganは「データサイエンスの倫理」についての役立つコースを提供しています。また、「数値ベース」の科学であるデータサイエンスでも倫理が生じる理由と方法を説明するこの本もお勧めです。

 

5. マーケティング

 

秘訣は、マーケティングの方法をよりよく知っていれば、仕事を見つけるのが簡単になるということです。「マーケット」という言葉の意味は、自分のスキルを売り込む方法を知ることです。マーケティングの能力があれば、自分のスキルを売り込むための履歴書を作成するのがうまくなります。面接官を魅了することができます。そして特にデータサイエンスでは、なぜあなたのモデルとその結果が重要であるかを説明する能力が向上します。

覚えておいてください、あなたのモデルがどれほど優れていても、それを必要とする人々を説得できないのであれば、意味がありません。例えば、製造工場で機器の故障を予測できるモデルを開発したとします。理論的には、そのモデルは企業に数百万ドルの計画外の停止時間を節約する可能性があります。しかし、あなたがCスイートにその事実を伝えることができなければ、あなたのモデルはコンピューター上で無駄になります。

マーケティングのスキルを持つことで、財務上の利益、生産性の向上の可能性、モデルの採用による長期的な利点を強調した魅力的なプレゼンテーションによって、あなたのモデルの価値と必要性を証明することができます。

今日の仕事市場では、データサイエンスの世界で非常に珍しいスキルです。ほとんどのデータサイエンティストは本質的には数値志向の人々です。ほとんどのデータサイエンティストは、最善を尽くし、黙々と働くことが勝利の就職戦略であると信じています。残念ながら、雇ってくれるのはコンピューターではなく、人間です。自分自身、自分のスキル、そして自分の製品をマーケットする能力は、現代の仕事市場で本当のアドバンテージです。

マーケティングを学ぶために、私はいくつかの初心者向けの無料コースをお勧めします。Courseraでは、”Marketing in a Digital World”というコースが提供されています。特に、デジタル世界で引き続き魅力的な製品アイデアを提供するセクションが好きでした。データサイエンスに特化したマーケティングコースはありませんが、データサイエンティストとして自己マーケティングをする方法について解説しているこのブログ記事が気に入りました。

 

最後の考え

 

競争が激しくなっています。労働統計局によると、データサイエンティストの雇用は今後も伸びると予想されていますが、初心者のデータサイエンス志望者は就職が難しい状況に直面しています。これらのRedditの投稿が示すように、ChatGPTとの競争があり、リストラのリスクも存在しています。

求職市場で競争し、際立つためには、単に技術力だけでは足りません。データガバナンス、倫理、モデルの可視化、フィーチャーエンジニアリング、そしてマーケティングスキルは、採用マネージャーに対して考えの深い、力強い、魅力的な候補者にします。

****[Nate Rosidi](https://twitter.com/StrataScratch)****はデータサイエンティストであり、製品戦略の分野でも活動しています。また、アナリティクスの教授として非常勤講師も務め、トップ企業からの実際の面接質問でデータサイエンティストが面接に備えるのを支援するStrataScratchというプラットフォームの創設者でもあります。Twitter:StrataScratchまたはLinkedInで彼とつながってください。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more