我經常被問到這樣的問題:“做假設檢驗時,需要的樣本量是多少”, “我的實驗究竟需要多少樣本才有意義呢?”,這類問題可以通過功效與樣本量計算來解決。
什麼是功效?
所有檢驗都不可能盡善盡美,總存在這樣的可能,即當原假設 (H0) 實際為真時您會根據檢驗結果否定原假設(I 型錯誤),或當原假設實際為假時您根據檢驗結果未能否定 H0(II 型錯誤)。這是因為為了估計總體均值,您必須使用随機樣本,而這些随機樣本都是随機抽取的。
第II類錯誤(被坑)的概率為β,而1- β我們稱之為功效。II類錯誤是如果有個人有罪,而錯誤地判他無罪,所以“功效”就可以理解為,如果他實際上确實有罪,而且法官正确地判斷他有罪的概率。
假設檢驗的功效受到檢驗的樣本數量、差值、數據變異性和顯著性水平的影響。
案例分析
一種鎮定劑中的活性成分的目标含量為365mg/ml,每批鎮靜劑在使用前都要進行檢測,以發現明顯偏離目标的情況。
數據收集:從6個不同批次中随機抽取6個樣品,測量其中的有效成分含量。
- 描述性統計分析
注意:不能直接從描述性統計量中得到偏離目标含量365mg/ml的結論,即使樣本均值确實不是365mg/ml.
- 單樣本t檢驗
單樣本t檢驗的結果顯示P>0.05,故不拒絕原假設,換句話說,沒有足夠的證據拒絕有效成分含量均值為365mg/ml。
- 功效與樣本量的計算
在這裡,我不得不對上面的對話框做一些解釋(我親愛的客戶朋友經常對此有疑問)。
差值
差值是在檢測總體參數的假設值與實際值時您想得到的最小差值,看不懂,沒關系,我們舉個例子。在上面的對話框中我輸入的差值為-2.5和2.5,為什麼呢?因為在這裡我認為,如果有效成分含量偏離目标值2.5mg/ml時,我就認為是有顯著偏離,當然這裡的偏離可以偏大(2.5),也可以偏小(-2.5)。
标準差
在功效和樣本數量分析中使用的标準差取決于您是否已收集了數據。
1) 尚未收集數據:請使用總體标準差的估計值。您的估計值應以相關研究、設計規範、試驗研究、學科知識或相似信息為基礎。
2) 如果您已經收集并分析了數據,則使用下表所示的分析結果所提供的值。
Minitab結果如下:
結果顯示,當樣本量隻有6個時,這時候的檢驗功效隻有0.54,或者說犯第二類錯誤的概率高達0.46。功效太低,當前沒有顯著差異的結論很可能是樣本量不足導緻。
如果對于此分析,我想功效不低于0.9,那麼這時候我該抽取多少樣本量呢?
Minitab結果顯示,要想功效不低于0.9,那麼這時候我們需要再抽6個樣本,一共12個樣本才行。
- 再來一次單樣本t檢驗
現在,又再抽了6個樣本,一共12個樣本,再來做一次假設檢驗。
這時候我們發現,當樣本量增加到12時,P<0.05,故拒絕原假設,得到有顯著偏離目标值的結論。
- 小結
檢驗所需樣本量的多少取決于你願意承擔多大犯錯誤的風險,所以,當你以後分析糾結樣本量夠不夠時,請嘗試先做個功效和樣本量的計算。
如果檢驗的功效低,則您可能無法檢測到效應并錯誤地得出不存在任何效應的結論。另外,也要注意如果檢驗的功效太高,則很小的效應或不需要關注的效應看上去都可能會很顯著。
- 思考
如何提高假設檢驗的功效?
,