「T検定とその非母集団対応の使い方」
T検定と非母集団対応の使い方
高校で学んだこのテストを本当に理解していますか?
データサイエンティストとして、統計学の理解は非常に重要です。統計学はこの分野の基礎の一つです。
このシリーズの最初の記事では、さまざまな統計的テストとそれらを使用するべき状況の簡潔で実践的な概要を提供します。情報はバランスをとります-アクセスしにくいほど長くて技術的ではなく、無意味すぎるほど短くありません。
この最初の記事では、一般的によく知られている統計的テストの一つであるt-検定について説明します。それが具体的に何を意味するかは分からなくても、その言葉を耳にしたことがあるかもしれません。この記事の最後までに、このテストがどのように機能し、いつ使用すべきかを理解することができるでしょう。
統計的テストの設計に一般的に不慣れであれば、このシリーズの前置き記事である「統計的テストを実行するために必要な基本概念の入門」を強くお勧めします。
それでは、始めましょう。
t-検定とは何ですか?
t-検定は、異なる2つのデータサンプル間のデータを比較するために使用されます。2つの要素を考慮に入れます:サンプルの平均の差とサンプルデータの変動性です。論理的に考えると、これは理にかなっています-単に平均を比較するだけでは、サンプルが実際に異なるかどうかを判断するのに十分ではありません(平均は非常に似たデータセットでも異なる場合があり、非常に異なるデータセットでも似ている場合があります)。
t-検定は、上記の要素を考慮に入れたt-スコアと呼ばれる統計量を計算します。これはわずかに面倒な式を使用して手動で計算することもできますが、ほぼすべての統計ソフトウェアは自動的に計算してくれます。手動で統計量を計算する場合、それを既存の表から求められる臨界t値と比較することができます(t値が臨界t値よりも大きい場合、p値がテストの所望のレベルよりも小さくなり、サンプル間に統計的に有意な差があることを示します)。再び、統計ソフトウェアは通常、計算されたt値が統計的に有意かどうかを教えてくれます…
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles