「教師付き機械学習と集合論を通じた現実世界の時系列異常検出」

Real-world time series anomaly detection through supervised machine learning and set theory

シアトルバーク・ギルマン・トレイル

シアトル市のオープンデータを探索する

目次:

I. 問題の設定

II. 時系列データの監視型問題へのリモデリング

III. 監視型モデリングと分析

I. 問題の設定

データはこちらからダウンロードできます: シアトルバーク・ギルマン・トレイル | Kaggle

この問題の本質は、3時間後にトレイル上の総人数が500人を超える異常を検出する必要があるということです。異常は、ペデストリアンと自転車のトレイルの1時間ごとのデータが与えられているため、解決するためには3時間後のデータを予測する必要があります。

II. 時系列データの監視型問題へのリモデリング

では、データの2つのコピーを作成し、データを結合して、0時のデータが同じ行の3時にマッピングされるようにすることができます。

これはどのように行われるのでしょうか。

まず、データを取り込みます:

import pandas as pddf = pd.read_csv(r’/content/burke-gilman-trail-north-of-ne-70th-st-bike-and-ped-counter.csv’)

次に:

# dfをdataframeに変更df = pd.DataFrame(df)

df = df.fillna(0)

これを行った後、4行目から始まるデータのコピーを作成します:

# 4行目から始まるdf2を作成df2 = df[df.index >= 3]df2.head()

次に、両方のデータフレームに1から始まるインデックス列を追加します:

# df1とdf2の両方に番号の列を追加します。最初の行は1、2番目の行は2、以降の行も同様ですdf['index'] = list(range(1, len(df) + 1))df2['index'] = list(range(1, len(df2) + 1))

これを行う理由は、インデックス列で結合するためです。インデックス1はdf2のインデックス1に結合されますが、その行では左側には0時、右側には3時が表示されます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

生成AIのアシストを使用して複雑なSQLクエリを作成する

イントロダクション ChatGPTの登場は、AIの歴史において前例のない瞬間を迎えました。ChatGPTや他の多くの生成型AIツールは、...

AI研究

マイクロソフトAI研究は、分子システムの平衡分布を予測するためにDistributional Graphormer(DiG)という新しいディープラーニングフレームワークを紹介しました

分子の構造はその性質と機能を決定します。そのため、構造予測は分子科学における重要な問題です。アミノ酸配列からタンパク...

AIニュース

「4つのテック巨人 - OpenAI、Google、Microsoft、Anthropicが安全なAIのために結集」

人工知能の世界で最も有名な4社が、先進的なAIモデルの責任ある開発を確保するための強力な業界団体の設立を目指し、連携する...

人工知能

デヴオプスにおけるジェネレーティブAI:ピークなデヴオプスパフォーマンスを実現するスマートな(そして効果的な)方法

ジェネレーティブAIがDevOpsでチームワークを改善し、手続きを迅速化し、よりアジャイルかつ効率的な職場を作り出す方法を調...

機械学習

AIによるテキストメッセージングの変革:自然言語処理技術の詳細な探求

「自然言語処理(NLP)の技術によるテキストメッセージングにおける人工知能(AI)の影響を深く探求し、洞察を得る」

機械学習

エンタープライズAIとは何ですか?

エンタープライズAIの紹介 時間は重要であり、自動化が答えです。退屈で単調なタスク、人間によるミス、競争の混乱、そして最...