- 确定原假設和被擇假設,和是相反的對立面
例如小明本來是90斤,現在他想看看他這個月是胖了、瘦了還是沒變;
此時H0就是=90,H1就是≠90,≠90就分為>90和<90,此時就是雙側檢驗
step2- 在原假設H0成立的條件下,根據我們需要檢驗的量構造一個分布(标準正态分布、t分布,F、分布、x^2分布)
例如:在H0 : W = 90的條件下,W~N(90,4),服從一個均值為90,方差為4的正态分布。W為小明的體重
此時雖然服從于正态分布,但不是比标準正态分布,此時進行标準化,
而對于稱為統計量,統計量中隻能包含我們要檢驗的這個變量,記為Z,并且Z服從于一個标準正态分布
step3- 畫出這個分布的概率密度圖
- 給一個置信水平β(相信(接收)原假設H0成立的概率),一般取β=90%,95%,99%,其中95%用的最多
在H0處理的條件下,我們構造的~N(0,1),且Z有95%的可能性的區間位于[-1.96,1.96]
概率密度函數
概率密度函數pdf(probality desinty function)離散型随機變量
X |
1 |
2 |
3 |
P |
0.1 |
0.2 |
0.7 |
對于變量的每一個取值都有一個取值概率與其對應
連續型随機變量:X分布在[a,b]之間,,此時f(x)就是pdf
概率密度函數可以理解為X在某處發生的概率強度,且有如下的性質:
probability density function
舉個例子:X在[-1,1]上均勻分布(每一個位置都是有可能發生的),也就是說f(x)是一條直線
那麼我們可以計算出直線x=?
,所以k = 0.5,即函數x = 0.5
标準正态分布概率密度函數
标準正态分布
是個偶函數,
可以計算出,
也就是說95%的置信區間,雙側檢驗的臨界值為-1.96和1.96
累計密度函數(cumulative distribution function)X是服從于概率密度函數為f(x)的分布,記X~f(x)
則
顯然,
- F(-oo) = 0,F( oo) = 1
- 且F(x)遞增
- F(x)是一個就是積分上限函數,F'(x) = f(x)
95%的置信水平下,那麼通過求得的數字在[-1.96,1.96]之間為接受域,在這個區間之外為拒絕域
假設求得的,那就拒絕原假設,小概率事件發生,我們就拒絕原假設
假如我們将置信水平修改為99%,即在[-2.58,2.58]區間内接受原假設,時,我們無法再拒絕原假設。
雙側檢驗有兩塊拒絕域,而單側檢驗隻有一側拒絕域,另一側為接受域
單側檢驗,雙側檢驗的話加上左邊的對稱區間
單側檢驗:
P(x>2) = 1-0.9772 = 0.0228
P值就是單側檢驗的時候,大于統計量的概率
P值 = P(x>2) = 0.0228 < 0.05 ,在95%置信水平下,拒絕H0
P值 = 0.028>0.01,在99%置信水平下,接收H0
雙側檢驗時,P值隻需和α/2比較,>的話就接收,小于拒絕
或者P值改為單側檢驗的兩倍,也可以
比如在95%置信水平下,P(2) = 0.0228,2*0.0028 = 0.0046 < 0.05,拒絕原假設(推薦這種方法,和單側檢驗同意)
,