「IID 初心者のための意味と解釈」

IID初心者の意味と解釈

独立かつ同一分布

写真:Yu Kato on Unsplash

統計学、データ分析、および機械学習のトピックでは、IID(Independent and Identically Distributed)という概念が頻繁に基本的な仮定または条件として現れます。IIDは「独立かつ同一分布」を意味します。IIDのランダム変数またはシーケンスは、統計モデルや機械学習モデルの重要な要素であり、時系列解析にも役割を果たします。

この投稿では、直感的な方法で、サンプリング、モデリング、および予測性の3つの異なる文脈でIIDの概念を説明します。時系列解析と予測性の文脈でRコードを使用したアプリケーションが紹介されます。

サンプリングにおけるIID

表記X ~ IID(μ,σ²)は、平均μと分散σ²を持つ母集団から(X1、…、Xn)を純粋にランダムにサンプリングしていることを表します。

  • Xの各連続する実現値は、前の値や後の値と関連性を示さず、独立しています。
  • Xの各連続する実現値は、同じ分布から同一の平均と分散を持つように得られます。

ある国の個人の年収の分布からサンプル(X1、…、Xn)を収集したとします。

  1. 研究者がX1に男性の収入、X2に女性の収入、X3に男性の収入、そしてX4に女性の収入を選択し、このパターンがXnまで続くとします。これはIIDのサンプリングではありません。なぜなら、サンプリングに予測可能なパターンやシステマティックなパターンが存在するため、独立性の条件に違反しているからです。
  2. 研究者が(X1、…、X500)を最も貧しいグループから選び、次に(X501、…、X1000)を最も裕福なグループから選んだとします。これもIIDのサンプリングではありません。なぜなら、2つのグループが異なる収入分布を持ち、異なる平均と分散を持っているため、同一性の条件に違反しているからです。

モデリングにおけるIID

Yがモデル化または説明したい興味のある変数であるとします。それを次の2つの要素に分解できます。

Y = システマティックな要素 + ノイズ要素

システマティックな要素は、他の要素との基本的な関係によって推進されるYの一部です。それは…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「ナレ・ヴァンダニャン、Ntropyの共同創設者兼CEO- インタビューシリーズ」

Ntropyの共同創設者兼CEOであるナレ・ヴァンダニアンは、開発者が100ミリ秒未満で超人的な精度で金融取引を解析することを可...

人工知能

キャルレールの最高製品責任者、ライアン・ジョンソンへのインタビューシリーズ

ライアンは、初期のスタートアップからフォーチュン100の組織まで、多様なテクノロジーと製品開発のリーダーシップ経験を15年...

人工知能

「コーネリスネットワークスのソフトウェアエンジニアリング担当副社長、ダグ・フラーラー氏 - インタビューシリーズ」

ソフトウェアエンジニアリングの副社長として、DougはCornelis Networksのソフトウェアスタック全体、Omni-Path Architecture...

人工知能

アーティスの創設者兼CEO、ウィリアム・ウーによるインタビューシリーズ

ウィリアム・ウーは、Artisseの創設者兼CEOであり、ユーザーの好みに基づいて写真を精密に変更する技術を提供していますそれ...

人工知能

「ジンディのCEO兼共同創設者、セリーナ・リー― インタビューシリーズ」

「Celina Leeは、ZindiのCEO兼共同創設者であり、アフリカのデータサイエンティスト向けの最大の専門ネットワークです Celina...

AIニュース

Q&A:ブラジルの政治、アマゾンの人権、AIについてのGabriela Sá Pessoaの見解

ブラジルの社会正義のジャーナリストは、MIT国際研究センターのフェローです