「IID 初心者のための意味と解釈」
IID初心者の意味と解釈
独立かつ同一分布
統計学、データ分析、および機械学習のトピックでは、IID(Independent and Identically Distributed)という概念が頻繁に基本的な仮定または条件として現れます。IIDは「独立かつ同一分布」を意味します。IIDのランダム変数またはシーケンスは、統計モデルや機械学習モデルの重要な要素であり、時系列解析にも役割を果たします。
この投稿では、直感的な方法で、サンプリング、モデリング、および予測性の3つの異なる文脈でIIDの概念を説明します。時系列解析と予測性の文脈でRコードを使用したアプリケーションが紹介されます。
サンプリングにおけるIID
表記X ~ IID(μ,σ²)は、平均μと分散σ²を持つ母集団から(X1、…、Xn)を純粋にランダムにサンプリングしていることを表します。
- Xの各連続する実現値は、前の値や後の値と関連性を示さず、独立しています。
- Xの各連続する実現値は、同じ分布から同一の平均と分散を持つように得られます。
例
ある国の個人の年収の分布からサンプル(X1、…、Xn)を収集したとします。
- 研究者がX1に男性の収入、X2に女性の収入、X3に男性の収入、そしてX4に女性の収入を選択し、このパターンがXnまで続くとします。これはIIDのサンプリングではありません。なぜなら、サンプリングに予測可能なパターンやシステマティックなパターンが存在するため、独立性の条件に違反しているからです。
- 研究者が(X1、…、X500)を最も貧しいグループから選び、次に(X501、…、X1000)を最も裕福なグループから選んだとします。これもIIDのサンプリングではありません。なぜなら、2つのグループが異なる収入分布を持ち、異なる平均と分散を持っているため、同一性の条件に違反しているからです。
モデリングにおけるIID
Yがモデル化または説明したい興味のある変数であるとします。それを次の2つの要素に分解できます。
Y = システマティックな要素 + ノイズ要素
システマティックな要素は、他の要素との基本的な関係によって推進されるYの一部です。それは…
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles