「IID 初心者のための意味と解釈」

IID初心者の意味と解釈

独立かつ同一分布

写真:Yu Kato on Unsplash

統計学、データ分析、および機械学習のトピックでは、IID(Independent and Identically Distributed)という概念が頻繁に基本的な仮定または条件として現れます。IIDは「独立かつ同一分布」を意味します。IIDのランダム変数またはシーケンスは、統計モデルや機械学習モデルの重要な要素であり、時系列解析にも役割を果たします。

この投稿では、直感的な方法で、サンプリング、モデリング、および予測性の3つの異なる文脈でIIDの概念を説明します。時系列解析と予測性の文脈でRコードを使用したアプリケーションが紹介されます。

サンプリングにおけるIID

表記X ~ IID(μ,σ²)は、平均μと分散σ²を持つ母集団から(X1、…、Xn)を純粋にランダムにサンプリングしていることを表します。

  • Xの各連続する実現値は、前の値や後の値と関連性を示さず、独立しています。
  • Xの各連続する実現値は、同じ分布から同一の平均と分散を持つように得られます。

ある国の個人の年収の分布からサンプル(X1、…、Xn)を収集したとします。

  1. 研究者がX1に男性の収入、X2に女性の収入、X3に男性の収入、そしてX4に女性の収入を選択し、このパターンがXnまで続くとします。これはIIDのサンプリングではありません。なぜなら、サンプリングに予測可能なパターンやシステマティックなパターンが存在するため、独立性の条件に違反しているからです。
  2. 研究者が(X1、…、X500)を最も貧しいグループから選び、次に(X501、…、X1000)を最も裕福なグループから選んだとします。これもIIDのサンプリングではありません。なぜなら、2つのグループが異なる収入分布を持ち、異なる平均と分散を持っているため、同一性の条件に違反しているからです。

モデリングにおけるIID

Yがモデル化または説明したい興味のある変数であるとします。それを次の2つの要素に分解できます。

Y = システマティックな要素 + ノイズ要素

システマティックな要素は、他の要素との基本的な関係によって推進されるYの一部です。それは…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「David Smith、TheVentureCityの最高データオフィサー- インタビューシリーズ」

デビッド・スミス(別名「デビッド・データ」)は、TheVentureCityのチーフデータオフィサーであり、ソフトウェア駆動型のス...

機械学習

「機械学習 vs AI vs ディープラーニング vs ニューラルネットワーク:違いは何ですか?」

テクノロジーの急速な進化は、ビジネスが効率化のために洗練されたアルゴリズムにますます頼ることで、私たちの日常生活を形...

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...

人工知能

ムーバブルインクのCEO兼共同創設者であるヴィヴェク・シャルマ氏についてのインタビュー・シリーズ

ビヴェクは2010年にムーバブルインクを共同設立し、急速な成長を遂げながら、600人以上の従業員を擁し、世界有数の革新的なブ...

人工知能

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、...

データサイエンス

「Adam Ross Nelsonによる自信のあるデータサイエンスについて」

データサイエンスの中で新たな分野が現れ、研究内容が理解しにくい場合は、専門家や先駆者と話すのが最善です最近、私たちは...