「教師付き機械学習と集合論を通じた現実世界の時系列異常検出」

Real-world time series anomaly detection through supervised machine learning and set theory

シアトルバーク・ギルマン・トレイル

シアトル市のオープンデータを探索する

目次:

I. 問題の設定

II. 時系列データの監視型問題へのリモデリング

III. 監視型モデリングと分析

I. 問題の設定

データはこちらからダウンロードできます: シアトルバーク・ギルマン・トレイル | Kaggle

この問題の本質は、3時間後にトレイル上の総人数が500人を超える異常を検出する必要があるということです。異常は、ペデストリアンと自転車のトレイルの1時間ごとのデータが与えられているため、解決するためには3時間後のデータを予測する必要があります。

II. 時系列データの監視型問題へのリモデリング

では、データの2つのコピーを作成し、データを結合して、0時のデータが同じ行の3時にマッピングされるようにすることができます。

これはどのように行われるのでしょうか。

まず、データを取り込みます:

import pandas as pddf = pd.read_csv(r’/content/burke-gilman-trail-north-of-ne-70th-st-bike-and-ped-counter.csv’)

次に:

# dfをdataframeに変更df = pd.DataFrame(df)

df = df.fillna(0)

これを行った後、4行目から始まるデータのコピーを作成します:

# 4行目から始まるdf2を作成df2 = df[df.index >= 3]df2.head()

次に、両方のデータフレームに1から始まるインデックス列を追加します:

# df1とdf2の両方に番号の列を追加します。最初の行は1、2番目の行は2、以降の行も同様ですdf['index'] = list(range(1, len(df) + 1))df2['index'] = list(range(1, len(df2) + 1))

これを行う理由は、インデックス列で結合するためです。インデックス1はdf2のインデックス1に結合されますが、その行では左側には0時、右側には3時が表示されます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

スターバックスのコーヒー代で、自分自身のプライベートChatGPTモデルをトレーニングしよう

スターバックスのカップ1つ分と2時間の時間を費やすことで、自分の訓練済みのオープンソースの大規模モデルを所有することが...

人工知能

偉大さの開放:アレクサンダー大王の創造的AIとの旅 (Idai-sa no kaihō Arekusandā Taio no sōzō-teki AI to no tabi)

「生成型AI(GAI)はコーチングの効果を高めるためにどのように使用できるのか、また生成型AI(GAI)をコーチングツールとし...

データサイエンス

コンテンツモデレーションからゼロショット分類へ

もし、追加情報や文脈がない小さなテキストを分析し、自分自身のデータを定義するために最も妥当なラベルを取得したい場合、...

人工知能

生産性向上のための10の最高のAIツール(決定版リスト)

時間を取り戻したい、同僚を凌駕したい、そして好きなことにもっと時間を費やしたいのであれば、AIツールを使用することは明...

AIニュース

「犯罪者がWormGPT(ダークウェブのChatGPT)を利用する恐ろしい4つの方法」

「WormGPTは、倫理的な制約や制限を持たないダークウェブ上のAIパワードチャットボットです」

データサイエンス

レコメンダーシステムにおけるPrecision@NとRecall@Nの解説

Accuracy Metrics(正解率指標)は、機械学習の全体的なパフォーマンスを評価するための有用な指標であり、データセット内の...