「教師付き機械学習と集合論を通じた現実世界の時系列異常検出」

Real-world time series anomaly detection through supervised machine learning and set theory

シアトルバーク・ギルマン・トレイル

シアトル市のオープンデータを探索する

目次:

I. 問題の設定

II. 時系列データの監視型問題へのリモデリング

III. 監視型モデリングと分析

I. 問題の設定

データはこちらからダウンロードできます: シアトルバーク・ギルマン・トレイル | Kaggle

この問題の本質は、3時間後にトレイル上の総人数が500人を超える異常を検出する必要があるということです。異常は、ペデストリアンと自転車のトレイルの1時間ごとのデータが与えられているため、解決するためには3時間後のデータを予測する必要があります。

II. 時系列データの監視型問題へのリモデリング

では、データの2つのコピーを作成し、データを結合して、0時のデータが同じ行の3時にマッピングされるようにすることができます。

これはどのように行われるのでしょうか。

まず、データを取り込みます:

import pandas as pddf = pd.read_csv(r’/content/burke-gilman-trail-north-of-ne-70th-st-bike-and-ped-counter.csv’)

次に:

# dfをdataframeに変更df = pd.DataFrame(df)

df = df.fillna(0)

これを行った後、4行目から始まるデータのコピーを作成します:

# 4行目から始まるdf2を作成df2 = df[df.index >= 3]df2.head()

次に、両方のデータフレームに1から始まるインデックス列を追加します:

# df1とdf2の両方に番号の列を追加します。最初の行は1、2番目の行は2、以降の行も同様ですdf['index'] = list(range(1, len(df) + 1))df2['index'] = list(range(1, len(df2) + 1))

これを行う理由は、インデックス列で結合するためです。インデックス1はdf2のインデックス1に結合されますが、その行では左側には0時、右側には3時が表示されます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

M42がMed42を導入:医療知識へのアクセス拡大のためのオープンアクセスクリニカル大規模言語モデル(LLM)

M42ヘルスは、アブダビ、UAEに拠点を置き、有望な新しいオープンアクセスの臨床大規模言語モデルであるMed42を発表しました。...

データサイエンス

「表形式データの進化:分析からAIへ」

「表形式データ」とは、行と列に整理されたデータを指しますこれにはCSVファイルやスプレッドシート、関係データベースなどが...

機械学習

『Qwen Large Language Models(LLMs)Seriesについて知っておくべきすべて』

大型言語モデル(LLM)は、登場以来、人工知能(AI)の領域を大きく変えました。これらのモデルは、厳しい推論や問題解決の問...

人工知能

「人工知能のイメージング:GANの複雑さとメカニズムの学術的な考察」

GANは、リアルなデータの作成能力を示しています画像の作成から医薬品の革新まで、さまざまな領域での潜在力を持っています

データサイエンス

大規模な言語モデルについて企業が知っておくべきこと

大規模な言語モデルは、ビジネスコミュニケーション、コンテンツ作成、データ分析を変革しますビジネスにおける主な機能と利...

機械学習

「AIとブロックチェーンの交差点を探る:機会と課題」

今日私たちが見ている世界を変えるAIをブロックチェーンに統合することに関連する機会と課題を探索してください