標準誤差と標準偏差のどちらをつかうべきか

実験を何回か繰り返して測定値の平均値を報告するときに、よく棒グラフにバーをつけますが、このバーは標準誤差(SE)にすべきかでしょうか、それとも、標準偏差(SD)にすべきでしょうか?この質問の答えの鍵となるのは、そもそもSDとSEは何を表す量かということを理解することにあります。

 

 

データが正規分布に従って観測されるような場合、平均値±2*標準偏差の範囲にデータが入る確率が95%。データの分布が正規分布に近い時には,標準偏差はデータのバラつき(範囲)を示す指標として非常に有効。標準誤差は標準偏差よりも必ず小さいため,標準誤差を用いてグラフを作成したほうがデータのバラつきが少ないように見え,カッコよくなります.実際,多くの論文で標準誤差が使われているようです。標準誤差を使うのはグラフをカッコ良く見せるためではなく、標準誤差によって母集団の平均値の区間推定を行えるから。

標本平均は,母平均とは違いますが母平均は,どれくらいの幅の中にどれくらいの確からしさで存在していると推定できるのかということが知りたいでしょう.それを叶えてくれるのが,標準誤差なのです。母平均は,95%の確率で標本平均から±2SEの範囲に存在すると言えます。

結局どちらを使えばいいの?標準偏差とはデータのバラつきの指標でした.平均値±2SDの範囲にデータが入る確率が95%ですから,データのバラつきを示したい,あるいは比べたい時は標準偏差を使うべきです.例えばある因子によって,データがバラつかなくなるというようなことを示したい場合などです.一方で,標準誤差とは,母平均の区間推定量でした。平均値±2S Eの範囲に母平均がある確率が95%となるのです.よって,母平均の推定をしたい,あるいは比べたいという時は標準誤差を示せばいいのです.多くの場合,実験によって知りたいのは母平均であるので,多くの論文で標準誤差が示されている。

(参考 http://www.acs.dis.titech.ac.jp/suzuki/sdandse.pdf