如果容量為n的所有可能樣本均來自正态分布總體(均值為μ),并且對每個樣本都計算出随機變量T的值t,則t值有一個連續型概率分布,稱為t分布。
t分布的概率密度函數
t分布是一個分布族,其确切形狀由一個被稱為自由度v的參數決定,其中,v = n - 1 (n為樣本大小)每個整數自由度對應一個分布。t分布有以下幾個特征:
-
每個分布都是鐘型且關于均值0對稱,并且分布從負無窮到正無窮連續延伸;
-
當自由度無限時,t分布就是标準正态分布。随着自由度越來越小,曲線就越來越平坦;
-
一般認為,自由度小于30時,分布與标準分布相差較大。
在構建置信區間這一節中講到,如果抽樣分布符合正态分布,但由于樣本太小而不能使用期望和方差來求解概率時,我們就需要使用到t分布。當方差和期望不能滿足我們對總體樣本的預估時,就需要找到一個新的标準來代替期望和方差完成預估。這個标準就是标準分(詳見《每天一點統計學——數據變異性的量度》)。
t分布的标準分計算公式如下:
t分布的标準分計算公式
t分布的概率密度函數計算公式如下:
t分布的概率密度函數
如果要構建t分布的置信區間,可使用以下計算公式:
t分布的置信區間
通過查找t分布的概率表,可以計算出t的值:
例子:有一個包含10顆彩虹糖果的樣本,并且樣本均值X拔 = 0.5g,樣本方差s^2 = 0.09。求t的值和平均重量為95%的置信區間。
分析:
(1)使用t分布概率表,首先需要找出尾部的概率值。要求出95%的置信區間,即要在概率表中中查找0.025((1-0.95)/ 2)。樣本容量為10,即自由度為9。我們需要找出(v=9,P=0.025)的交叉值,就是t的值,即t=2.262。
(2)已知X拔=0.5, s^2 = 0.09, t=2.262,n=9,根據t分布的置信區間公式可得出:
P(0.285 <= T <= 0.715) = 0.95
,