「データサイエンスにおける予測の無限の可能性」

「美容とファッションにおける魅力の無限の可能性」

実践的な例を通して、データサイエンスにおける予測方法の多様性を発見しましょう

データサイエンスの旅を始めた当初、私の最初の仕事は予測でした。その時、経済計量学の修士課程を修了したばかりでした。私の予測に対する最初の印象は、時間系列の経済計量学のプリズムを通して、部分自己相関と自己相関プロットを描き、ARIMAモデルの正しいパラメーターを手動で決定するというものでした。しかし、今では、これは統計予測の現実の不完全な視点だったと気づきました。私は多くの面で初心者でした。

数々の成功した予測プロジェクトの経験から、予測の領域は古典的な回帰問題とは大きく異なり、統計的な予測以上のさまざまなアプローチが可能であることを学びました。プロジェクト開始時のモデリングの可能性が広がります。

https://www.kaggle.com/c/favorita-grocery-sales-forecasting/overviewのFavorita Grocery Sales Forecasting競技を通じて、予測オプションの多様性を検討してみましょう。これは、さまざまな店舗-商品の組み合わせの売上を16日先まで予測するものです。

データセットの概要

詳細な分析は行いませんが、トレーニングデータの一部のみを使用します。データは、店舗ID、アイテムID、単位販売、日付、プロモーションフラグなどの標準的な構造に従います。

Source : Image by Author

One to many

企業での予測と理論での予測の旅で最初に経験した範囲の変化は次のとおりです:

  • 各時間系列ごとに最適なパラメータを個別の統計モデルで特定するための時間はありません。
  • 小売の時間系列は、プロモーション、地域イベント、国民的イベント、価格など、さまざまな外因性要素に影響を受けます。しかし、ほとんどの統計モデルはこれらの要因を考慮しません。
  • 考慮すべき時間系列は多くあり、各系列を個別に扱うことはほぼ不可能であり…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more