クラウドファーストデータサイエンス:データの分析とモデリングのための現代的なアプローチ

クラウドファーストデータサイエンス:現代的なアプローチによるデータの分析とモデリング

データサイエンスワークフローの各ステップでクラウドを活用するためのガイド

写真:Myriams-Fotos、Piaxabayで撮影

データサイエンスは、データの利用方法を改善するために、最新の先端技術を利用する、急速に成長している産業の一つです。しかし、データサイエンスで働いたことがあるなら、いつかはExcelシートを眺めている自分に出くわすこともあるでしょう。Excelには問題はありませんが、これは最新の産業で働く際に使うようなツールではありません。

多くの組織は、モダンなクラウドインフラを活用し始めていますが、まだ十分に活用できているとは言えません。多くのデータサイエンティストは、クラウドデータウェアハウスからデータを引っ張ってきて、それをローカルシステムでモデルのトレーニングに使うことになるでしょう。それも悪いことではありませんが、もしデータサイエンスワークフロー全体をクラウドに持ち込むことができたら?まさにそれが可能です!

データクリーニングからモデルの展開まで、ワークフローをモダナイズするために利用できるクラウドベースのツールがあります。この記事では、データサイエンスワークフローの各ステップを説明し、それをクラウドに移行する方法を実例を交えて紹介します。すでにワークフローの一部をモダナイズしている場合は、必要な部分だけ読んでください。しかし、100%クラウドデータサイエンス体験をしたい場合は、読み続けてください!

クラウド上でのデータ収集と保存

おそらくすでにクラウド上でデータを保存する利点についてはご存知かと思いますが、もしまだ聞いたことがない場合は:それはかなり素晴らしいです!クラウド上にデータを保存することで、インターネット接続がある場所からいつでもデータにアクセスでき、他のクラウドサービスと簡単に統合でき、必要に応じてストレージ容量を拡張し、復旧用のバックアップを作成し、その他多くの役立つ機能を利用できます。

データウェアハウス、データレイク、またはオブジェクトストレージが必要かどうかにかかわらず、他のアプリケーションに展開するためにデータはどこかに保存する必要があります。クラウドデータストレージを提供する多くのサービスがありますが、より人気のあるものには次のようなものがあります:

  • AWS S3
  • Azure Blob Storage
  • Google Cloud Storage
  • Hadoop

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more