クラウドファーストデータサイエンス:データの分析とモデリングのための現代的なアプローチ
クラウドファーストデータサイエンス:現代的なアプローチによるデータの分析とモデリング
データサイエンスワークフローの各ステップでクラウドを活用するためのガイド
データサイエンスは、データの利用方法を改善するために、最新の先端技術を利用する、急速に成長している産業の一つです。しかし、データサイエンスで働いたことがあるなら、いつかはExcelシートを眺めている自分に出くわすこともあるでしょう。Excelには問題はありませんが、これは最新の産業で働く際に使うようなツールではありません。
多くの組織は、モダンなクラウドインフラを活用し始めていますが、まだ十分に活用できているとは言えません。多くのデータサイエンティストは、クラウドデータウェアハウスからデータを引っ張ってきて、それをローカルシステムでモデルのトレーニングに使うことになるでしょう。それも悪いことではありませんが、もしデータサイエンスワークフロー全体をクラウドに持ち込むことができたら?まさにそれが可能です!
データクリーニングからモデルの展開まで、ワークフローをモダナイズするために利用できるクラウドベースのツールがあります。この記事では、データサイエンスワークフローの各ステップを説明し、それをクラウドに移行する方法を実例を交えて紹介します。すでにワークフローの一部をモダナイズしている場合は、必要な部分だけ読んでください。しかし、100%クラウドデータサイエンス体験をしたい場合は、読み続けてください!
クラウド上でのデータ収集と保存
- 「Amazon SageMaker Canvasを使用したノーコードでSalesforce Data CloudでのMLの民主化」
- 「Amazon SageMaker Data Wranglerを使用して、生成型AIのデータ準備をシンプルにする」
- クラウド移行のマスタリング:成功させるためのベストプラクティス
おそらくすでにクラウド上でデータを保存する利点についてはご存知かと思いますが、もしまだ聞いたことがない場合は:それはかなり素晴らしいです!クラウド上にデータを保存することで、インターネット接続がある場所からいつでもデータにアクセスでき、他のクラウドサービスと簡単に統合でき、必要に応じてストレージ容量を拡張し、復旧用のバックアップを作成し、その他多くの役立つ機能を利用できます。
データウェアハウス、データレイク、またはオブジェクトストレージが必要かどうかにかかわらず、他のアプリケーションに展開するためにデータはどこかに保存する必要があります。クラウドデータストレージを提供する多くのサービスがありますが、より人気のあるものには次のようなものがあります:
- AWS S3
- Azure Blob Storage
- Google Cloud Storage
- Hadoop
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles