信頼区間 (confidence interval)という概念は、なんとなく直感的に明らかなようでいて実はちゃんと説明しろといわれると困るものです。ウェブ上で「信頼区間」をわかりやすく説明してくれている解説サイトをまとめておきます。
まず、信頼区間とは何ではないのか?
「95%信頼区間とは,真の値が入る確率が95%の区間のことです」というような説明をすることがあります。私も,一般のかたに説明するときは,ついそのように言ってしまうことがあります。でも本当は真っ赤なウソです。(奥村晴彦 統計・データ解析 信頼区間って何?)
日本語なので何となく日常用語の意味に当てはめて想像すると、そんな感じかなと思ってしまいます。違うと言われると「えっ!違うの?」と冷や汗が出ます。では、正しくは何なのでしょうか?正確な説明はいきなり聞いても、あまりわかりやすいものではありません。
「95%信頼区間を100回得たならば、そのうち95回はその間に母平均が入っている」(我楽多頓陳館 統計学入門 推定 信頼区間の解釈)
同じことをわかりやすい図で示しているサイトがありました(図を借用するわけにもいかないので、図はリンク先でご覧ください)
サンプルを何度も繰り返して測定すると、得られた信頼区間の特定の割合に未知の母数が含まれることになります。(support.minitab.com 信頼区間とは)
わかりやすい図をソフトウェアRで具体的に描いて説明してくれる次のようなサイトもありました。自分にはここのサイトの説明が一番しっくりきました。
では上記のような条件の場合、信頼区間の正しい解釈とは何でしょう?それはこれです。上記と同様のランダムサンプリングを何度も(例えば100回)行い、そのつど母平均の95%信頼区間を計算した場合、全(100個の)信頼区間のうち95%(95個)の信頼区間は母平均を含んでいる。(PASL 2012-12-03 信頼区間の意味)
R(https://www.r-project.org/)は無料ソフトです。自分でも上記ウェブサイトに紹介されているプログラムを実行してみました。100例中91例でしか95%信頼区間に母平均が入っていませんでしたが、これはたまたまです。回数を増やせば95%になるはずです。それが95%信頼区間という意味ですから。
同様に、図を用いてわかりやすい説明をしているサイト。
信頼区間とは,信頼度という基準で区間幅を推定したとき,同じ条件で標本抽出を何回か繰り返せば,区間内に真値が含まれる回数はこの程度だということを意味する幅を示しています.(「信頼区間」が意味するもの – 数理的思考 – 中川雅央 【知と情報の科学】)
難しい概念を学ぶときには、どんな言葉遣いで説明されるかによっても理解のしやすさがかなり変わってきます。おそらく学習者によっても、あるいは学習段階によっても最適な説明の仕方は異なってくるでしょう。
最後に、統計学入門(東京大学教養学部統計学教室編 東京大学出版会)225ページにある説明を紹介しておきます。この文だけ初めて読んでも理解しやすいかどうかはわかりませんが、上で紹介してきたウェブサイトの説明をいろいろと読んだあとでこの教科書をじっくり読むと、非常にしっくりきました。
区間推定とは真の母数の値θが、ある区間(L,U)に入る確率を1-α(αはθが区間に入らない確率)以上になるように保証する方法であり、
P(L≦θ≦U) ≧ 1-α
となる確率変数L,Uを求めるものである。L,Uはそれぞれ、下側信頼限界、上側信頼限界といわれる。1-αは信頼係数と呼び、区間[L,U]を100(1-α)%信頼区間と呼ぶ。(中略)なお、同一の母集団から抽出した標本でも、標本ごとに信頼区間の推定値は変化する。θは未知であるが決まった定数である。したがって、一つの標本から信頼区間を具体的な数値として推定してやれば、これは信頼区間に含まれるか含まれないかのいずれしかない。すなわち、具体的に数値として計算した現実の信頼区間に対して、”1-αの確率でθを含む”ということはない。信頼区間の意味は、繰り返し多くの異なった標本について信頼区間をここで述べた方法によって何回も計算した場合、θを区間内に含むものの割合が1-αとなるということである。
この教科書でも、よくある誤解に関しても注意がなされていました。
大学の教科書といえば無味乾燥な味気ないものと思いがちですが、この本は統計学の基本をいかに面白さを伝えるか、わかりやすく伝えるかということに相当な情熱がつぎ込まれているのがわかります。