アジャイルなデータサイエンスプロジェクト管理を通じてAIコストを制御する

AIコストを抑えるためのアジャイルなデータサイエンスプロジェクト管理

アジャイルデータサイエンス組織の運営のためのブループリント

序論

データサイエンスの世界は複雑であり、予算の制約を超える隠れたコストが存在します。データサイエンティストは、どんな組織にとっても重要な投資です。残念ながら、アイドルなインフラストラクチャのような非効率性があると、データインフラの投資は大幅に無駄になってしまいます。アジャイル手法は解決策を提供し、ワークフローを改善し、時間の浪費を削減します。アジャイルを活用することで、従来のデータサイエンスプロセスが最適化され、適応力が増し、より効率的に価値を提供するようになります。この記事では、これらの隠れたコストについて探求し、アジャイル手法がデータサイエンスのイニシアチブを効果的なコストにする方法を示します。

セクション 1: データサイエンスの隠れたコスト

データサイエンティストは、データを扱う複雑な知識と専門知識を持つ貴重な資源であり、彼らの生産性は極めて重要です。データサイエンティストがイノベーションに時間を費やすことなく、単調な作業に費やす時間が長くなれば、ペイオフなしに経費がかさむことになります。さらに、データサイエンティストが中央のITに制約されないために独自のマシンで作業する傾向があるため、知識の発見が困難になり、車輪の再発明のシナリオにつながることもよくあります。

無駄になる要素はさまざまな形で現れます。ボストンコンサルティンググループの調査によれば、モデルのうち44％しか本番環境に導入されず、データサイエンティストの1日の作業時間のかなりの部分がITセットアップなどの単純作業に無駄になっています。さらに、データサイエンティストが熱心に働いていると、インフラストラクチャのコストも急速に膨らんでいきます。イノベーションから注意を逸らされている間に、データインフラの投資は実際にはアイドルで、常時オンで過剰供給になることがあります。最後に、クラウドへのデータの移動も、AIのデータ規模では高額になります。その結果、クラウドコストは複数のスタック、サイロ、環境を横断して管理が難しくなります。

機械学習、特にGenerative AIでは、膨大な量のクラウドコンピュートと高価なGPUが必要です。例えば2023年、ChatGPTのような有名なモデルは、OpenAIなどの組織に対して1日あたり約70万ドルの計算コストを発生させています（ワシントンポストのSemiAnalysis [1]による）。ある推定によれば、ChatGPTは1000人以上のGPUと数か月の学習が必要でした [2]。

この課題は続いています。データサイエンスのリーダーの約56％が、自分のデータサイエンスプロジェクトを適切にスケーリングするために支援が必要としています（BCG）。例えば、複数のクラウドプラットフォームに分散したデータは、ストレージのコストを高めるだけでなく、チーム間でのデータのアクセスと共有を困難にします。この分断されたアプローチは、予算をさらに圧迫し、データサイエンスライフサイクルにおける協力と効率を損なう可能性があります。これらの足かせをどのようにステップに変えることができるのでしょうか？その答えは、アジャイル手法と構造化されたプロセス設計を受け入れることにあるかもしれません。

セクション 2: プロセス設計とデータサイエンスにおけるアジャイル手法

効率性と適応性が重要な今日、アジャイル手法はデータサイエンスプロジェクトの重要な要素となっています。アジャイルプロセスは適応性、協力、反復的な開発を受け入れており、これらすべてがデータサイエンスライフサイクル全体における費用効率に大きな影響を与えます。典型的なデータサイエンスプロジェクトは、アジャイルの管理手法の重要な特徴を内在的に持っています。

増分的で反復的な開発 — データサイエンスのプロダクトは増分的に構築されます。一般的に使用されるフレームワークの多くは、厳密に定義されたフェーズを持っています。例えば、CRISP-DMでは、ビジネス理解、データ理解、データ準備、モデリング、評価というフェーズがあります。
価値に焦点を当てる — 予測モデルだけでなく、データサイエンス全般において価値が重要です。モデルの推奨事項や洞察は直接ビジネスの意思決定に影響を与えます。
チームの権限 — データサイエンスチームは、特定のモデル、ツール、フレームワーク、計算リソース、プログラミング言語などを選択することで、最大の生産性を発揮します。
継続的な学習 — これもアジャイルの重要な原則です。モデルの開発を始めるときには特定のビジョンがあり、このビジョンに基づいて製品（モデル、レポートなど）を構築し始めます。最初の反復、またはプロジェクトのあるフェーズ（例：探索的データ分析）の後には、問題についての追加知識を得ることができます。これにより、ビジョンを適応させることも可能になります。

データサイエンスプロジェクトでは、フェーズ間での相互作用がしばしば必要です。例えば、モデルの結果が悪かった場合、より予測力のあるデータを収集するためにデータ収集を再考する必要があります。アジャイル手法はこの循環的な性質を受け入れ、チームに適応とプロセスの改善を許容します。

以下は典型的なデータサイエンスプロジェクトのアジャイルプロセスの概要です：

ビジネスケース：問題と潜在的な影響を定義します。
データの収集と初期分析：データの収集、分析、検証を行います。
モデリング/探索的データ分析：モデルの開発とテストを行います。
運用化：モデルを本番環境に展開します。
モニタリングと分析：モデルを継続的に監視、分析、改善します。

Jiraなどのプロジェクト管理ツールを使用すると、アジャイルな方法論をさまざまな形で適用することができます。データサイエンスプラットフォームが作業単位をプロジェクトで組織化し、ワークフローがタスク、ストーリー、バグなどの子タスクを使用する場合、エピックの問題をプロジェクトにリンクさせることで、開発プロセスと進捗/作業量のトラッキングの両方を効率化することができます。

異なるチームが異なる段階を担当する複雑なプロジェクトの場合、タスクチケットにリンクするプロジェクトを作成することがより効率的かもしれません。各チケットは単一の段階または複数の段階を表し、複雑なワークフローとのより良い整合性を確保します。

セクション3：インフラストラクチャのコストと制御

インフラストラクチャの管理は、データサイエンスにおいて重要な要素ですが、しばしば過小評価されています。データサイエンス環境の設定と管理には複雑な問題があり、リソースの活用度が低い場合には実質的な隠れたコストが発生することがあります。投資が放置され、常にオン状態で過剰に供給されている場合、これらの費用はすぐに積み上がり、貴重なリソースをより生産的な方向に活用する機会を減らします。

特にディープラーニングを含む機械学習モデルには、高性能なGPUやクラウドの計算インスタンスなど、膨大な計算リソースが必要であり、そのコストは膨大です。さらに、商用プラットフォームでは価格が上乗せされることもあります。最新のテクノロジーとコスト制御の必要性をバランスさせる、戦略的なインフラストラクチャ計画と投資手法が求められます。

この問題は財務リソースだけでなく、潜在的な生産性の損失や複数のチームが使用するためにリソースが適切に割り当てられない効率の低下も引き起こします。残念なことに、このような無駄は常に明白ではなく、慎重な追跡と管理が必要です。アジャイル戦略を活用することで、データサイエンスへの投資からより大きな価値を引き出し、潜在的な無駄を生産性とイノベーションに変えることができます。また、データサイエンスの個々のプロジェクトのコスト、リソースの利用状況のモニタリングのための履歴も作成できます。

セクション4：スケーリング、データ管理、アジャイルなワークフロー

データサイエンスプロジェクトのスケーリングは、巨大でしばしば過小評価される作業です。業界の報告によれば、データサイエンスプロジェクトの56%しか実験的段階を超えてビジネス価値を提供することはありません。その主な要因のひとつは、データの保存と管理に関連する費用の急増ですが、ハードウェアやソフトウェアソリューションからもさまざまな費用が発生します。しかし、アジャイルなプラクティスを採用することで、この費用の急増に対応できるかもしれません。

イテレーションの開発とフィードバックループを特徴とするアジャイルなワークフローにより、データサイエンスチームはストレージの非効率性を特定することができます。例えば、データの統合に焦点を当てたイテレーションスプリントを通じて回避できる冗長なデータセットなどです。前回の作業を徐々に構築し、データとコードを再利用することで、アジャイルなワークフローは追加のストレージリソースの必要性を最小限に抑えます。

さらに、バージョン管理やフィーチャーブランチングなどのアジャイルなプラクティスは、効率的なデータ管理を可能にします。適切なバージョン管理により、プロジェクトを以前の状態に戻すことが容易になり、複数の冗長なコピーが不要となり、ストレージの節約につながります。

アジャイルなマインドセットは自動化にも広がります。データ抽出、変換、ローディング（ETL）のための自動化パイプラインのイテレーション開発により、マニュアルによるボトルネックが一つずつ取り除かれ、スケーリングプロセスが加速し、人的労力とエラー修正に関連するコストが大幅に削減されます。

ただし、アジャイルは完全な一サイズフィットオールの解決策ではありませんので、柔軟でフィードバックを取り入れ、必要な変更を行うことが重要です。データサイエンスプロジェクトは多面的かつ複雑であり、一つの方法論に厳密に固執することは運用上の盲点や予期せぬコストを引き起こす可能性があります。

アジャイルメソッドを採用してスケールを拡大することは、ただ速くすることだけではありません。スマートに行うことが重要です。繰り返しの改善、透明性、自動化に焦点を当てることで、コストを抑えながらプロジェクトを成功裏にスケールする可能性が大幅に高まります。

セクション5: 効率性、自動化、およびITの役割

効率性は、データサイエンスの複雑な仕組みをつなぎとめている要素です。効率性がなければ、コストが増大するだけでなく、価値までの時間も増加し、最初にデータサイエンスを採用する競争上の優位性が相殺されます。効率性を向上させる上でしばしば見過ごされる重要な要素の1つは、ITの役割です。

IT部門は従来、システムの完全性とインフラストラクチャの維持に焦点を当ててきましたが、データサイエンスの台頭により彼らの役割は拡大しています。彼らは自動化されたワークフローの確立やアジャイルなプラクティスの導入において重要な役割を果たしており、これはコスト効率に直接的な影響を与えています。

効率性を高める1つの具体的な方法は、エピック（大規模な作業の塊）をプロジェクト（またはデータサイエンスプラットフォームでサポートされる相当の作業単位）にマッピングし、タスク/ストーリーをプロジェクトにマッピングすることです。これはアジャイルな方法論でしばしばサポートされる実践です。この統合は、データサイエンスプロジェクトの複雑さに苦しむチームを導く灯台として機能します。各エピックは複数の小さなタスクやストーリーに分割されることができ、プロジェクトのスコープや役割の割り当てに役立ちます。これにより、透明性だけでなく、説明責任も向上し、効率性が向上します。

自動化されたパイプラインとCI/CD（継続的インテグレーション/継続的デプロイメント）メカニズムも、ITが監督することが多く、効率性をさらに高めます。自動化によって、日常のタスクが迅速に処理され、データサイエンティストの時間がより複雑なタスクやイノベーションに使われるようになります。ここでITの役割が不可欠です。ITはこれらのパイプラインを設定し、保守することで、データサイエンスチームが効率的に作業を行える環境を整えます。

これに加えて、クラウドリソースと計算能力の管理も重要です。機械学習モデルは、時間とコストのかかる強力な計算を必要とします。ここでITは、アジャイルな計画と現在のスプリントのタスクに基づいてリソースを適切に割り当てることができます。これにより、計算能力の無駄を避け、必要なリソースのみを利用することでコストを削減します。

要するに、ITの役割は進化し、データサイエンスにおけるアジャイルなプラクティスの実施を支援する役割を果たしています。アジャイルなプラクティスと自動化をデータサイエンスチーム全体で行うことで、ITはデータサイエンスのアジャイルフレームワークを支える柱となります。

セクション6: ビジネス戦略と競争上の優位性への広範な影響

データサイエンスがますます成熟していくにつれ、それはビジネス戦略のより価値のある中核要素となり、大きな競争上の優位性を提供する可能性があります。アジャイルな方法論を使用することで、データサイエンスチームはこの影響を増幅させることができ、データサイエンスを運用ツールから戦略的資産に昇華させることができます。

ビジネス戦略の観点では、アジリティは市場の変化に対する適応性と迅速な対応力と同等です。データサイエンスプロジェクトにアジャイルなプロセスが組み込まれた組織は、より容易に方向転換やスケーリングを行い、競合他社に先行することができます。例えば、複雑なプロジェクトを管理可能な「エピック」または「タスクチケット」に分割することは、エグゼクティブレベルの意思決定者が複雑なデータサイエンスプロジェクトの軌跡を把握し、リソースをより適切に割り当てるのに役立ちます。

さらに、アジャイルなプラクティスは持続的な改善とイノベーションの文化を育むものです。各スプリントの終わりには、チームが進捗状況を見直し、将来のスプリントを適応させます。この反復プロセスは、失敗が罰せられるのではなく学びの機会と見なされる環境を育みます。データサイエンスのような不確実性と複雑性に満ちた領域で、この文化は強力な競争上の優位性となります。

さらに、アジャイルなプロセスはリスク管理に役立ちます。データサイエンスを活用して市場空間を制覇しようとする組織にとって、リスク管理は重要な優先事項です。アジャイルの反復的な性質とフィードバックへの重視により、リスクはプロセスの早い段階で特定されます。これにより、タイムリーな緩和策が可能となり、プロジェクトが予定通り完了するだけでなく、期待される品質基準にも適合することが保証されます。

これらの原則に重点を置くことで、企業は価値の新たな次元を開拓し、収益向上と各分野のリーダーとしてのポジショニングを実現することができます。

セクション7: アジャイルなプロセスを使用したモデル開発プロセスの簡単なチュートリアル

データサイエンスプロジェクトの複雑さを乗り越えることは困難な場合があります、特に機械学習モデルの構築が関わる場合です。このステップバイステップのガイドに従って、Jiraの統合のようなアジャイルな方法論を使用してモデル開発プロセスを構築してください。この目標は、プロセスを分かりやすくし、データサイエンスチームがより効率的かつ効果的に作業できるようにすることです。

ステップ1：プロジェクトの範囲と目的を定義する

どんなプロジェクトに取り組む前に、以下の質問に答えてアジャイルプロジェクトの基準を作りましょう：

解決しようとしている問題は何ですか？
成功の指標は何ですか？

ステップ2：イテレーションサイクルまたはスプリントに分割する

プロジェクトをより小さな管理可能な部分、つまりスプリントに分割しましょう。これはプロジェクトの複雑さとチームのタスクに慣れる度合いによって2週間から4週間程度かかることがあります。

ステップ3：広範なビジネス目標とのリンク（エピックまたはタスクチケットの使用）

データサイエンスプロジェクトがスプリントに分割されていても、広範なビジネス目標との明確な関連性があることを確認しましょう。エピックやタスクチケットを活用してこの関連性を維持し、関係者、特に意思決定者が全体像を把握しやすくしましょう。

ステップ4：役割を割り当ててクロスファンクショナルなチームを作成する

アジャイル手法では、データサイエンティスト、データエンジニア、ビジネスアナリストからなるクロスファンクショナルなチームが重要です。円滑な協力を促進するために、役割と責任を早期に割り当てましょう。

ステップ5：アジャイルプロジェクト管理ツールを活用する

Jiraなどのツールは進捗状況の追跡に非常に役立ちます。これらのプラットフォームを使用してタスクの効率的な割り当てとスプリントの進行状況を監視しましょう。

ステップ6：コラボレーションと常時フィードバックを促進する

オープンなコミュニケーションと常時フィードバックの文化が重要です。チームメンバーに自分の意見や懸念を述べるように励み、必要に応じてプロジェクトを適応させることができるようにしましょう。

ステップ7：進捗を監視し、必要に応じて適応する

アジャイルプロジェクト管理ツールを使用することで、プロジェクトの進捗状況を簡単に監視することができます。計画通りに進まない場合でも、アジャイル手法を活用して迅速に適応することができます。現在のスプリントで必要な修正を行うか、次のスプリントでそれに対応する計画を立てましょう。

ステップ8：振り返りと得た教訓で結論づける

各スプリントの後、またはプロジェクトの終了時に、チームで振り返りのミーティングを行いましょう。良かった点、改善すべき点、将来のスプリントやプロジェクトでの改善策について話し合います。

結論

データサイエンスと機械学習がビジネス戦略を推進し競争優位を確保する上でますます重要な役割を果たす世界において、コスト管理と効率の向上は過小評価できません。アジャイル手法の採用は、これらの課題に果敢に取り組むための堅牢なフレームワークを提供します。

データサイエンス能力を拡大するにあたり、適切に実施されたアジャイル手法が組織にもたらす重要なコストメリットについて考えてみてください。

アジャイル手法についてさらに掘り下げたり、実践的なトレーニングに取り組んだりすることで、データサイエンスの道を進む中でより良い結果を得ることができるでしょう。適切な実践を行えば、データサイエンスプロジェクトは単なるコストセンターではなく、広範なビジネス目標に貢献する貴重な資産となるでしょう。

参考文献

[1] Will Oremus, AI chatbots lose money every time you use them. That is a problem., The Washington Post, June 2023, last accessed 30 August 2023, https://www.washingtonpost.com/technology/2023/06/05/chatgpt-hidden-cost-gpu-compute/

[2] Andrej Karpathy, State of GPT, Microsoft BUILD, May 23, 2023, https://www.youtube.com/watch?v=bZQun8Y4L2A

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

agileData scienceJiraMLOpsTips And Tricks

Was this article helpful?

93 out of 132 found this helpful