クラウドインスタンスのスタートアップスクリプトの構築

クラウドインスタンスのスタートアップスクリプトの作成方法

初回起動と再起動の区別

初期の探索フェーズの後、多くの機械学習タスクは通常、画像にパッケージ化され、オンプレミスまたはクラウドサーバーに展開されます。これにより、データサイエンティスト、データ、ソフトウェア、クラウドエンジニアなどからなる開発チーム全体の参加を得て、MLOpsパイプラインのオペレーショナリゼーションをサポートするインフラの構築を迅速に行うことができます。

サンプル図。機械学習タスクをサーバーに展開する典型的なディアグラム(VM = 仮想マシン)。画像は著者によるもの

スタートアップスクリプトは、クラウドサーバーインスタンスの起動時に自動的に設定や他のタスクを実行するために使用されます。これは、AWS EC2ではユーザーデータGoogle Cloud EngineではスタートアップスクリプトAzure Virtual Machineではカスタムスクリプト拡張として知られています。スタートアップスクリプト内の内容は、インストール、メタデータ設定、環境変数などの形式で提供されることがあります。主な目的は、各インスタンスがいつでもアプリケーションまたは隣接するサービスを提供するために常に設定されていることです。

私たちが書くすべてのスクリプトと同様に、それらをきちんとした構造で一元的に作成してテンプレートとして再利用できるようにする必要があります。これにより、プロジェクト内の複数のインスタンスで複数のアプリケーションを管理する際に便利です。以下のセクションでは、その方法を説明します。

始める前に、この投稿がデータサイエンスチームのどの役割を対象にしているか尋ねるかもしれません。答えは、状況によります。成熟したチーム(そして豊富な予算を持つ)の会社では、クラウドやDevOpsエンジニアが展開に責任を持っています。他の場合は、役割が曖昧であり、データサイエンティストや機械学習エンジニアがこれを含む一般化された役割を果たす場合もあります。

後のセクションはAWS EC2のユーザーデータに特化していますが、同じコンセプトを使用して他のプロバイダーに簡単に適応できます。

1) 初回起動と再起動のスタートアップスクリプト

インスタンスの初回起動時にスタートアップスクリプトを使用するのは直感的ですが、再起動する必要があるのはどうしてでしょうか?オンデマンドインスタンスを使用しており、それが本番環境ではない場合(例:開発、ステージング、SIT、UAT)、週末やオフィス外の時間に稼働している必要はほとんどありません…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more