共分散(きょうぶんさん)とは、2つの変数の偏差の積の平均を表す値で、統計学において非常に重要な指標です。😃
共分散は、次のように定義されます:
$$\text{共分散} \, (X, Y) = \frac{1}{n} \sum_{i=1}^{n} (X_i - \overline{X})(Y_i - \overline{Y})$$
ここで:
共分散を求める方法はいくつかありますが、ここでは基本的なステップをご紹介します!
具体的な例を見てみましょう!👀
次のデータセットを考えます:
X: [2, 3, 5, 6, 8]
Y: [1, 4, 5, 6, 8]
1. 平均を計算します:
$\overline{X} = \frac{2 + 3 + 5 + 6 + 8}{5} = 4.8$
$\overline{Y} = \frac{1 + 4 + 5 + 6 + 8}{5} = 4.8$
2. 偏差を計算します:
偏差(X) = [2-4.8, 3-4.8, 5-4.8, 6-4.8, 8-4.8] = [-2.8, -1.8, 0.2, 1.2, 3.2]
偏差(Y) = [1-4.8, 4-4.8, 5-4.8, 6-4.8, 8-4.8] = [-3.8, -0.8, 0.2, 1.2, 3.2]
3. 偏差の積の平均を計算します:
共分散 = $\frac{(-2.8)(-3.8) + (-1.8)(-0.8) + (0.2)(0.2) + (1.2)(1.2) + (3.2)(3.2)}{5}$
この計算を行うと、共分散の値が得られます!結果として、負の値または正の値が得られると、その解釈も重要です。
共分散と相関係数は似ていますが、異なります。🤔
共分散: 大きさと符号の情報を持っている
相関係数: 標準化されており、-1から1の範囲を持つ
次に、Plotly.jsを使って共分散を視覚化してみましょう!
共分散は2つの変数の関係を理解するために非常に重要です。この指標を使って、データ間の相関を探ることができます。
ぜひ、実際に計算してみてください!共分散がどのように使われるのか、わかるようになると面白いですよ!😁