1つだけサンプリングした場合、母分散が分かっていれば、母平均の区間推定が出来る。
複数サンプリングしてその平均をとると、1個を観測するより母平均に近い値である可能性が大きい。
一般には、母平均の分布は母集団の分布とは形が異なる。ただし、正規分布の場合は、標本平均も正規分布となる。
標本平均の平均は母平均と等しくなり、標準偏差は母標準偏差/(√標本数)となる
つまり、標本数が4なら標準偏差は1/2、標本数が9なら標準偏差は1/3となる。
ここで間違いやすいのは、標本平均の標準偏差という言葉です。
これは、標本の標準偏差ではなく、標本の平均を無限に観測した場合のその分布の標準偏差という意味です。
(注意)なお、「標本平均の平均は母平均と等しくなり、標準偏差は母分散/(√標本数)となる」
という性質自体は正規分布以外でも成立します。
ただ、標本平均が母集団と同じ形(ばらつきは異なる)のままなのが、正規分布と一部の特例だということです。
標本平均を使った区間推定
さきほど、標本1個を使った区間推定を行いました。
今度は、それを標本平均を使ったものに拡大します。
標本平均を使った場合には、標準偏差が1/(√標本数)となる以外は標本1個の場合と考え方は同じです。
標本数が4個になると、標準偏差は1/2、標本数が9個になると、標準偏差は1/3となります。
ということは、95%で値が入る区間は標本数が多くなればなるほど小さくなることが分かります。
また、標本数が大きくなると標本平均のバラツキが小さくなるということは、
標本平均を使った母数の推定区間は標本数が多いほど小さくなることが分かります。
つまり、標本数を多くするとそれだけ精度の高い推定が可能になるということです。
分布についての知識なく、分布を推定する「ノンパラメトリック」という方法がある。