當我們想要比較兩組數據是否有差異時,往往首先想到計算出兩組數據的均值,從而比較兩組數據的差異,然而這些參數隻能反映樣本的特征,不能直接反映總體的分布特征。單獨使用這些參數比較兩組數據是否有差異時往往會産生較大的誤差,因此統計學家們常使用T檢驗來檢驗兩組數據是否有差異。t檢驗(Student’s tese)主要适用于樣本量較少,總體标準差σ未知的正态分布。T檢驗根據研究方法和性質的不同分為單樣本t檢驗、配對樣本t檢驗以及獨立樣本t檢驗,亦有在數據方差不齊時使用的t’檢驗,本文首先介紹比較常用的兩獨立樣本t檢驗(Two-sample t-test)。
抽取縣醫院4月份骨科和婦産科住院病人各10人,統計他們的住院天數,如表-1所示,我們雖然可以通過直接觀察數據或者計算平均數比較發現骨科病人的住院天數大于婦産科病人,但是這樣并不能解釋這種差異是否是由于抽樣誤差所造成的,因此我們需要使用更加科學的統計學方法進行分析。
表-1 骨科、婦産科病人住院天數
科室 |
病人住院天數 | |||||||||
骨科 |
12 |
10 |
11 |
13 |
12 |
11 |
14 |
8 |
11 |
9 |
婦産科 |
6 |
7 |
8 |
5 |
5 |
3 |
6 |
5 |
7 |
7 |
這裡首先,我們列出解題思路:
(1)建立檢驗假設,确定檢驗水準
H0:μ1=μ2,婦産科和骨科病人住院時間的總體均數相同
H1:μ1≠μ2,婦産科和骨科病人住院時間的總體均數不同
(2)計算檢驗統計量:這裡我們使用SPSS統計分析軟件對這組數據進行t檢驗,将統計數字導入SPSS後設定相應參數,得出如表-2、表-3所示結果,表-2中給出了兩組病人住院天數的标準差、平均值等數據,表-3首先對兩組數據進行了方差齊性檢驗,萊文方差等同性檢驗顯示兩組數據的P值為0.659,明顯大于0.05的界限,表明可以認為兩組數據方差齊,方差齊時使用表-3第一列t檢驗結果,可觀察到t檢驗的P值小于0.001。
(3)根據P值,作出推斷結論:兩獨立樣本t檢驗的自由度為18,P<0.05,按照α=0.05的水平拒絕H0,接受H1,兩組差異有統計學意義,可以認為骨科和婦産科病人的平均住院天數存在差異。
兩組樣本的整體分布符合t檢驗是使用兩獨立樣本T檢驗的必要條件,除此之外,兩組數據的總體方差σ1餘σ2必須一緻或相近,即兩組數據必須有方差齊性(Homogeneity of variance),兩組樣本方差不齊時可以使用變換變量法,或采用t’檢驗或非參數檢驗方法進行分析。
【參考文獻】
李康,賀賈.醫學統計學(第六版)[M].人民衛生出版社,2013.62-63.
備注:本文章于2022年5月13日22:00使用paperyy進行查重,查重率21.8%,由于文章内容較少且涉及到一些常用統計學概念,故查重率稍高。
,