在針對連續變量的統計推斷方法中,最常用的有 t 檢驗 和 方差分析 兩種,其中 t 檢驗是最基本的檢驗方法,最初由W.S.Gosset在1908年以筆名“Student”發表的一篇關于 t 分布的論文中提出,開創了利用小樣本計量資料進行統計推斷的先河,打開了統計學的新紀元。
也由此,t檢驗,亦稱 Student t檢驗(Student's t test),主要用于樣本含量較小(例如n<30),總體标準差 σ 未知的正态分布。 t 檢驗是用 t 分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。在醫學統計中,t 檢驗是使用非常頻繁的一類假設檢驗方法,應用條件:
- 樣本量較小時,理論上要求樣本為來自正态分布總體的随機樣本(正态性)
- 當兩小樣本均數比較時,要求兩總體服從正态分布并且總體方差相等(方差齊性)
t檢驗依據資料分析目的和設計類型的不同,可分為:單樣本均數的t檢驗、配對樣本均數t檢驗、兩獨立樣本均數的t檢驗
- 單樣本均數的t檢驗:适用于樣本所在總體均數與已知總體均數的比較
- 配對樣本均數的t檢驗:适用于配對設計的資料
- 兩獨立樣本均數的t檢驗:适用于完全随機設計兩樣本均數的比較,據此推斷他們的總體均數是否相等
單樣本均數 t 檢驗主要适用于樣本所在總體均數與已知均數的比較,推斷單個變量的樣本均值與給定的常數(指定的檢驗值)之間是否存在顯著差異。
其實驗設計:已知一個總體B,現在一個未知總體A中随機抽取一個已知樣本C,問題是總體A與總體B之間是否有差異?我們就用已知樣本C與已知總體B相比較來得出結論。
示例:打開數據。根據調查某市7歲以下兒童血鉛含量的平均水平為80.59μg/L,從工業園區抽取15名7歲以下兒童測量其體内血鉛含量,問工業園區7歲以下兒童平均血鉛含量是否不同于全市平均水平?
1. 建立假設:建立檢驗假設,确定檢驗水準 α
- H0:工業園區兒童的血鉛含量μ與全市血鉛含量 μ0 相等,即 μ=μ0
- H1: μ ≠ μ0
- α = 0.05,即置信區間為95%
2. 檢驗數據是否符合單樣本 t 檢驗的條件
(1)正态分布檢驗
- 打開 非參數檢驗—舊對話框—單樣本K-S檢驗
由下表可知,K -S 檢驗=0.169,P =0.200 > 0.05,血鉛含量符合正态分布。
3. 選擇檢驗方法—單樣本t檢驗
(1) 選擇 分析—比較平均值—單樣本t檢驗
(2) 參數說明
- 檢驗變量:用于從變量列表中選入待檢驗的變量;若選入多個,則他們将對同一個總體均值進行檢驗。
- 檢驗值:用于指定待檢驗的總體均值,默認為0.
- 選項—置信區間百分比:指定樣本均值與總體均值之間的置信區間,默認為95%。
- 選項—缺失值:用于設置缺失值的處理方式。
(3) 輸出結果與說明
- 單樣本統計:給出樣本的統計特征,包括樣本量、平均值、标準差等。
- 單樣本檢驗:給出T檢驗的結果,包括檢驗的總體均值=80.59,t統計量=2.185,顯著性p=0.046<0.05,因此拒絕H0,接受H1,所以認為樣本均數與總體均值之間顯著不同,認為工業園區兒童的血鉛含量μ與全市血鉛含量 μ0 不相等。
(4)語法
T-TEST
/TESTVAL=80.59
/MISSING=ANALYSIS
/VARIABLES=xqhl
/CRITERIA=CI(.95).