分散 – 統計学入門#6

平均はデータ群がそれを中心に分布していることを示してくれますが、どれくらいのばらつき（幅）をもって分布するかまでは示してくれません。

同じ平均をもつ分布でも、ばらつきの大きい分布と小さな分布では、そのデータの特性に大きな違いがあります。

では、どうやったら、ばらつき具合をうまく表現できるでしょうか？

まず、考えられるのは、各データ値から平均を引いたもの（これを偏差と呼びます）を算術平均するやりかたです。

ところが、平均より大きな値の偏差はプラス（＋）、平均より小さな値の偏差はマイナス（－）になので、偏差の平均はプラスマイナスが相互に打ち消しあって0になってしまいます。

なぜ0になるかというと、偏差の合計が0になるように選んだ点が平均だということなのです。もし、偏差の合計が0でないとすれば、それは重心ではないということを意味します。だから、必ず偏差の合計は0になるのです。

偏差の算術平均ではうまく偏りを表現できないことが分かりました。そこで、平均してもプラスマイナス相互に打ち消すことのないような平均の仕方を採用することにします。

その一つが二乗平均です。

これを分散と呼びます。

階級階級値度数相対度数階級値-平均
10-12 11 1 0.1 -6 36 36 3.6
13-15 14 2 0.2 -3 9 18 1.8
16-18 17 4 0.4 0 0 0 0
19-21 20 2 0.2 3 9 18 1.8
22-24 23 1 0.1 6 36 36 3.6
（合計） 10 1.0 108 10.8
分散の合計を計算してから、度数の合計で割る

分散ｘ相対度数の合計を計算する

これは、平均を求める際に２つの計算の仕方があったのと同様の考え方です。

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル