二項分布とは何かをわかりやすく解説

二項分布とは

二項分布とは何かを説明する場合、具体例を出すのが一番わかりやすい。コインをn回投げて、表が出たか裏が出たかを記録するものとする。n回のうち、表がr回出る確率を考えてみよう。

表裏裏表裏表表表表……表裏裏 と言った感じでn個続く。そのうち表がr回出るわけだが、何回めが表になるかを選ぶのが何通りあり得るかというと、nCr通りある。nCrという記号は、n個のものからr個のものを選ぶ選び方の組み合わせの数。これは中学校の数学で習う。n! / r!(n-r)!で計算できる。!は階乗の記号で、5の階乗は5x4x3x2x1といった具合。コインの表が出る確率をpとする。もちろんp=1/2 だが、一般的に話を進めるためにpと書いておく。すると、p^rの確率で表が出て、(1-p)^(n-r)の確率で裏が出るので、表がr回出る確率は、nCr x p^r x (1-p)^(n-r) で求まる。これが二項分布と呼ばれる確率分布。確率分布というのは確率変数がとりえる形のこと。確率変数XがX=rという値を取る確率をP(X=r)と書くことにすると、二項分布は、

P(X=r) = nCr x p^r x (1-p)^(n-r)

と書ける。

二項分布に従う確率変数の積率母関数

確率変数Xが上で説明した二項分布にしたがうときの、積率母関数を求めてみよう。そもそも積率母関数の定義は何だったかを思い出すと、

積率母関数Mx(t) = E[e^tX] でした。E[中身」は、期待値を表します。確率変数の期待値の定義は、確率変数とそれを実現する確率との積を全ての確率変数に関して足しあげたもののことです。それらを踏まえると、1-p = q と書くことにして

積率母関数Mx(t) = E[e^tX]= Σ(x=0からnまで)e^tx nCx p^x q^(n-x)

= Σ(x=0からnまで)nCx (p e^t)^x q^(n-x)

ここで二項定理(二項展開)を思い出すと、(x + y)^n = Σ(r=0からnまで) nCr x^r y^(n-r) で、これと同じ形が上の式に現れているので、

積率母関数Mx(t) = (pe^t + q)^n

となる。なぜ積率母関数なるものを考えたかというと、便利な公式があって、積率母関数を微分してt=0と置いたものは、期待値E[X]になっているからです。また分散V[X]も積率母関数の2階微分でt=0としたものから、積率母関数の1階微分でt=0とおいたものの2乗を差し引いたものになります。つまり、期待値と分散が比較的簡単にわかってしまうんですね。

参考図書

  1. 松本・宮原『数理統計入門』第3章重要な確率分布(1)二項分布(19ページ)