「データサイエンスポートフォリオの再考」
Rethinking Data Science Portfolios
簡単に実行できるユーザーフレンドリーなプロジェクトが高複雑度の見せ物よりも優れている理由
技術分野全体で受け継がれてきた誤った信念があります。それは、プロジェクトが複雑であればあるほど、その能力が伝わるというものです。
私は初期のキャリアの間、プロジェクトに複雑さを重ね加えるために数時間を費やしました。技術的なスキルと複雑なアルゴリズムを駆使する能力で潜在的な雇用主に感銘を与えることを期待していました。しかし、時間の経過とともに、このアプローチが非生産的であり、また実際の仕事での成果物の提供方法を誤って表現していることに気づきました。
採用マネージャーとして、さらにポートフォリオの価値を信じる私は、現実のデータサイエンスタスクのより正確な理解を示すために、実行の容易さとユーザーフレンドリーさを強調することを主張します。
目標を複雑にしないでください
私がデータサイエンスのキャリアの1年目頃、私は我々の帰属モデルの基準ウェブトラフィックを計算するためのモデルを構築しなければなりませんでした。この機会を使って自慢しようとしました。ARIMA、Prophetなどの繰り返しを経て、私はランダムフォレストの実装に落ち着きました。
- 「Juliaでスクラッチから作成するゲート付き再帰ニューラルネットワーク」
- 「Great Expectationsを始めよう Pythonにおけるデータ検証ガイド」
- 「データサイエンティストになる夢を諦めなかった8つの理由と、あなたも諦めるべきではない理由」
非技術的な上司と方法論を共有する際、内部の仕組みがブラックボックスだと伝えなければなりませんでした。彼らは白紙の表情で応じました。上司は後で私に声をかけ、1枚のPowerPointスライド(モニターに貼り付ける付箋でもよい)で完全に説明できるものを試してみるように提案しました。自分自身と冗談を言いながら、私はローリングメディアンを試してみました。それは比較的緊密なエラースコアパックの中央に位置していました。
私たちは「調整の更新」とともに上司のもとに戻り、私が言ったのは「ローリング平均」というだけで、誰も疑問を投げかけませんでした。5年と数多くの帰属モデルの繰り返しの後も、その基準計算は再トレーニングやモデルのドリフト監視の必要性もなく、生産環境で使われ続けています。数億ドルの広告費を管理し、探求的なクライアントからの小言もない私たちの仕事の数少ない要素の1つです。
これはポートフォリオの文脈では極端な例のように思えるかもしれませんが、重要なポイントを強調しています。複雑なプロジェクトは容易に取り扱いにくくなり、理解しにくくなり、そのため実行が困難になります。このようなプロジェクトは、あなた自身とあなたの仕事を評価する人々にとっても価値が低下します。
複雑なポートフォリオプロジェクトは技術的な優位性を示すかもしれませんが、実用的なソリューションを作成する能力を反映するわけではありません。
データサイエンスの能力は、複雑さに対処する能力だけではありません。それは分野の原則を理解し、実用的で使いやすいソリューションを簡単に実装および実行できる能力、そして何よりもデータを用いた説得力のあるストーリーテリング能力に関わります。
作業をアクセス可能に保つ
複雑さを追求する中でこれらの基本を見失うことは簡単です。複雑なポートフォリオプロジェクトは技術的な優位性を示すかもしれませんが、ビジネス目標や制約と一致する実用的なソリューションを作成する能力を反映しません。このような複雑さの追求は、現実のデータサイエンスの要求を誤って表現するだけでなく、学問の本質を見落としてしまうかもしれません。それは、データを活用して効果的で理解しやすく、実行可能な洞察を創造することです。
プロジェクトが理解しやすく、実行が簡単であればあるほど、よりアクセスしやすく魅力的になります。
私のチームが最後に採用を行ったとき、私は履歴書にポートフォリオのリンクがたくさんあることに本当にワクワクしました。しかし、その半分以上が1つのJupyterノートブックを含むレポジトリのカップルであり、説明がなく、ノートブック内のマークダウンもコードブロックの1行説明を超えないものでした。私は説明と要件ファイルを持っているほぼすべての人に面接を行いました – 基準は本当に低く設定できます。
アクセスしやすく魅力的なプロジェクトは、潜在的な雇用主にとってあなたのポートフォリオを際立たせるでしょう。はい、GitHubはノートブックの内容を表示しますが、採用マネージャーがあなたの作品を探してリポジトリをクローンし、READMEファイルに従い、あなたのコードを変更することなくすべて実行できる場合、あなたは候補者リストのトップに近づくでしょう。
共同作業のためにコードを示す
上記のすべては、コードの品質と量、複雑さにも適用されます。保守可能で他の人に理解しやすいコードを作成できることは、チーム内での作業能力を示し、プロのソフトウェアエンジニアリングスキルのレベルを明示的に示します。
これにより、コードが孤立したものではなく、他の人がそれと対話する必要があるより大きなエコシステムの一部であることを認識することができます。ユーザーフレンドリーさに焦点を当てることは、純粋な技術的な専門知識を超えた、現実世界のデータサイエンスの成熟度と理解を示すでしょう。
習慣の反省
また、コードから一歩引いて自分の仕事のアプローチを考えることも重要です。私は学校で非常に苦労しました。常に授業の内容は知っていたのに、テストにはうまく対応できませんでした。学校生活は、A評価を取る方法ではなく、賭け金が自分の将来全体であったテストに単に合格する方法になってしまいました。
想像できるかもしれませんが、CEOにできるだけ少ない情報を提供することが大きなボーナスポイントをもたらす状況に飛び込むためには、それはうまく準備されていませんでした。
私たちのほとんどは、できる限り多くの知識を丸暗記することで成功を評価する教育システムで15〜20年を過ごしました。
特に初心者向けのポジションを探している場合、自分の本能に反するプロセスやワークフローに転換する勇気が必要です。結局のところ、私の学校経験に私だけではありません。ほとんどの人は、15〜20年の大半を、できる限り多くの知識を丸暗記することで成功を評価する教育システムで過ごしてきました。
目標に集中する
ポートフォリオは潜在的な雇用主への自己紹介ですが、技術的な能力以上のことを求めています。彼らはあなたの問題解決能力、コミュニケーションスキル、現実世界の問題への理解を見たいと考えています。
採用の際、私は誰と一緒に働くのがどれだけスムーズになるかを最も重視しています。チームの能力は、効果的に問題を共同で解決できる能力によってのみ決まります。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles