「ベルカーブの向こう側:t-分布の紹介」
Beyond the Bell Curve Introduction to t-Distribution
有名なt-分布の起源、理論、および使用方法を発見する
t-分布とは何ですか?
t-分布は、連続確率分布であり、正規分布に非常に似ていますが、以下の主な違いがあります:
- 重い裾:確率の大部分が極端な値(より高い尖度)に位置しています。つまり、平均から遠い値がより出やすいという意味です。
- 1つのパラメータ:t-分布には、自由度という1つのパラメータしかありません。これは、母集団の分散を知らない場合に使用されます。
t-分布の興味深い事実は、時々「スチューデントのt-分布」と呼ばれることです。これは、t-分布の発明者であるウィリアム・シーリー・ゴセット、英国の統計学者が、匿名性を保つために疑名「スチューデント」を使用して発表したことによるもので、そのため「スチューデントのt-分布」という名前が付けられました。
理論と定義
数学的な直感を構築するために、分布の背後にある理論を見てみましょう。
起源
t-分布の起源は、母集団の分散を知らない状態で正規分布のデータをモデリングするという考えから来ています。
- 「AUCスコアの深い理解:何が重要なのか?」
- 「BERTをゼロからトレーニングする究極のガイド:はじめに」
- 「Matplotlibを使用してリップスティックチャートを作成する方法」 Matplotlibを使用してリップスティックチャートを作成する方法について説明します
例えば、正規分布からn個のデータ点をサンプリングした場合、次のようになります:
ここで:
- x̄はサンプル平均です。
- sはサンプル標準偏差です。
上記の2つの式を組み合わせると、次のようなランダム変数を構築できます:
ここで、μは母集団の平均であり、tはt-分布に属するt統計量です!
詳しい導出はこちらをご覧ください。
確率密度関数
先に述べたように、t-分布は自由度νの1つの値によってパラメータ化され、その確率密度関数は次のようになります:
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles