統計学において、標本分散は、データの散らばり具合を示す重要な指標です。今回は、標本分散の求め方について詳しく解説します。😊
標本分散は、標本データのばらつき具合を示す量で、以下の式で表されます。
$$S^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2$$
ここで、S^2
は標本分散、n
は標本の数、x_i
は各データポイント、\bar{x}
は標本平均です。
n-1
で割ります。データセット {5, 7, 3, 9, 6}
の標本分散を計算してみましょう。
{5, 7, 3, 9, 6}
\bar{x} = \frac{5+7+3+9+6}{5} = 6
(5-6)^2 + (7-6)^2 + (3-6)^2 + (9-6)^2 + (6-6)^2 = 1 + 1 + 9 + 9 + 0 = 20
S^2 = \frac{20}{5-1} = 5
標本分散と不偏分散には重要な違いがあります。不偏分散は、n
ではなくn-1
で割ることによって母分散を補正します。これは、データのサンプルから得られる分散が、真の母分散を過小評価する傾向があるためです。
標本分散の概念は、スポーツの成績分析や、品質管理、株式市場のリスク評価など、様々な場面で利用されます。📊
標本分散を理解することは、統計学を学ぶ上での基本です。次回は、実データを用いた具体的な統計解析方法について見ていきましょう!