実験をしたときに、何か薬や遺伝子破壊の効果があったかどうかを検討するときに、実験群と対照群との間で平均値に差があるかどうかを調べるためにt検定を行います。t検定は、データに基づいて検定統計量Tがt分布に従うことを利用します。
t分布の形は正規分布に似ていますが、ちょっと違います。しかし自由度nを無限大にしたときに、正規分布になります。下の図で点線が正規分布ですが、自由度n=100のときにほぼ重なっていることがわかります。自由度=1のとき、一番裾が持ち上がっています。
上のグラフを描くのに使ったpythonのコードは以下の通りです。
import matplotlib.pyplot as plt
from scipy.special import gamma
import mathdef tdistribution(t,n):#t分布の式
f = (gamma((n+1)/2)/(math.sqrt(math.pi*n)*gamma(n/2))) * (pow(1+t**2/n, -(n+1)/2))
return fdef normaldistribution(t):#正規分布の式
sigma=1
mu=0
return (1/(sigma*math.sqrt(2*math.pi))) * np.exp( -(t-mu)**2 /(2*sigma**2) )#確率変数x
x = np.arange(-5,5,0.01)#t分布および比較のための正規分布のグラフの描画
plt.plot(x, tdistribution(x,1), ‘r-‘)#自由度1
plt.plot(x, tdistribution(x,2), ‘g-‘)#自由度2
plt.plot(x, tdistribution(x,5), ‘b-‘)#自由度5
plt.plot(x, tdistribution(x,100), ‘r-‘)#自由度100
plt.plot(x, normaldistribution(x), ‘k–‘)#正規分布
plt.title(“t-distribution degree of freedom=1,2,5,100, dotted line:normal distribution”)
上のコードでは関数defの中身はインデントが必要ですが、ワードの引用句の中でうまくタブやスペースが使えなくて、左端に来てしまっています。インデントをつけないと正しく実行されません。
t分布の確率密度関数の式は、『準一級対応 統計学実践ワークブック』の46ページの式(6.13)を参照しました。
キーワード:t分布 知能指数 分布 貯蓄額 分布 t分布表 エクセル t分布 カイ二乗分布 t分布とは わかりやすく t分布 区間推定 中国 農業 分布 痛点 分布 t分布 正規分布 違い