記述統計
平均と分散を知ればデータのおおよその傾向をつかむことができる。
データの見通しをよくするために、度数分布表やヒストグラムといった道具を使用する。
身長・体重など不確定要素によって決まるデータセットは正規分布となることが多いことが知られている。
正規分布の中でも、平均=0、分散1のものを特に標準正規分布と呼ぶ。
正規分布の中で標準以外のを一般正規分布と呼び、統計量を次のように加工すれば標準正規分布となる。
x’ = (x – x) / s
正規分布では平均から標準偏差1つ分の乖離する区間にデータの約70%が含まれ、標準偏差2つ分乖離する区間にデータの約95%が含まれる。