首页
/
每日頭條
/
科技
/
卡方檢驗成功案例
卡方檢驗成功案例
更新时间:2024-09-12 22:21:05

卡方檢驗成功案例(卡方檢驗原理與應用實例)1

本文簡單介紹卡方檢驗的原理和兩個類型的卡方檢驗實例。

本期推送的另外幾篇文章,來自微信公衆号“amegroups”,長按下方二維碼,關注該公衆号。關注後,回複“卡方檢驗”即可看原文,給出出處,以防止轉載過程中,關鍵信息丢失影響閱讀時,找不到原文。

一、卡方檢驗的作用和原理

1)卡方檢驗的作用:簡單來說就是檢驗實際的數據分布情況與理論的分布情況是否相同的假設檢驗方法。怎麼理解這句話呢,拿一個群體的身高來說,理論上身高低于1米5的占10%,高于2.0的占10%,中間的占80%,現在我們抽取了這個群體中的一群人,那麼對應這三個身高段的人數的比例關系是不是1:8:1呢?卡方分析就是解決這類問題。

2)卡方檢驗的原理:上面已經提到卡方檢驗是檢驗實際的分布于理論的分布時候一緻的檢驗,那麼用什麼統計量來衡量呢!統計學家引入了如下的公式:

卡方檢驗成功案例(卡方檢驗原理與應用實例)2

Ai為i水平的觀察頻數,Ei為i水平的期望頻數,n為總頻數,pi為i水平的期望頻率。i水平的期望頻數Ti等于總頻數n×i水平的期望概率pi,k為單元格數。當n比較大時,χ2統計量近似服從k-1(計算Ei時用到的參數個數)個自由度的卡方分布。和參數檢驗的判斷标準一樣,這個統計量有一個相伴概率p。零假設是理論分布與實際分布是一緻的,所以如果P小于0.05,那麼就拒絕原假設,認為理論和實際分布不一緻。

二、适合性卡方測驗

所謂适合性檢驗就是檢驗一個樣本的分布是否符合某個分布的一種假設檢驗方法。比如說檢驗數據是否正态分布,是否成二項分布或者平均分布等等。拿正态分布來說吧!請看下圖

卡方檢驗成功案例(卡方檢驗原理與應用實例)3

在這個近似标準正态分布的玉米株高的分布中,橫軸代表的是株高的數據,而縱軸代表的是對應株高的頻數,簡單來說,正态曲線上的某點的縱坐标代表的就是這個點對應的橫軸坐标顯示株高的玉米有多少株。隻不過正态分布曲線上顯示的是頻率值,而頻率=該組株數/總的株數,所以分布曲線不會變,隻不過縱坐标由頻數變為頻率。這也解釋了昨天推送的《如何判斷數據是否符合正态分布》中用帶正态曲線的直方圖判斷數據是否符合正态分布的原理。

回到本節,當我們要檢驗玉米株高是否符合正态分布時,我們能夠通過計算,計算出當樣本量為600(注意本例株高數據的個案數為600,下載數據資料進行練習過的學員應該知道)時,每個株高下的玉米株數設為E,然後我們已經有實際值 設為A,然後我們帶入上面的公式計算得到卡方統計量,由SPSS輸出相伴概率,我們就能判斷數據是否符合正态分布了。

再說一個例子。

卡方檢驗成功案例(卡方檢驗原理與應用實例)4

這裡假設理論上我們認為車禍每天發生的數量相同,就計算出每天車禍發生的理論發生數為22.8,而實際上每天車禍發生的數目并不是這樣,那麼這種不同是顯著不同于理論分布呢,還是隻是抽樣引起的呢?需要用卡方進行檢驗。我們計算得到卡方統計量和相伴概率,就能夠判斷車禍實際每天發生的數量是就是理論上認為的應該相同了。

下面給出SPSS的操作過程:

1)選擇非參數檢驗下的舊對話框按鈕-點擊卡方檢驗,然後把每天對應的概率輸入期望值對話框。

卡方檢驗成功案例(卡方檢驗原理與應用實例)5

2)或者這種情況之下,因為概率相同,你可以選擇所有類别期望值相同。

3)輸出結果

卡方檢驗成功案例(卡方檢驗原理與應用實例)6

sig值,也就是P值小于0.05,拒絕原假設,說明現實中每天車禍放生的概率明顯不同,我們知道這一結論之後,結合源數據,選擇周二出行可能是比較保險的。然而現實中,我們可能必須每天都要出去,所以時刻注意安全才是保障啊!祝各位一生平安!

三、卡方獨立性檢驗

獨立性檢驗是檢驗兩個變量之間是否獨立的檢驗。通常的源數據格式為excel透視表的形式如:

卡方檢驗成功案例(卡方檢驗原理與應用實例)7

本例檢驗不同員工喜歡的保險方案是否顯著不同,把數據錄入SPSS中:

卡方檢驗成功案例(卡方檢驗原理與應用實例)8

注意錄入數據時,每個單元格表示一個變量信息,要做數據分析,必須保證數據存儲的格式是正确的。

接下來需要做加權處理,把人數進行加權

卡方檢驗成功案例(卡方檢驗原理與應用實例)9

至于為什麼要做加權,因為我們後邊在做交叉表分析時,人數這個變量不會被選入,這樣人數就不能跟随它的類别進入了,因此要加權。

接下來做交叉表分析,裡面會有卡方檢驗的過程:

卡方檢驗成功案例(卡方檢驗原理與應用實例)10

将兩個分類變量分别選入行和列對話框

卡方檢驗成功案例(卡方檢驗原理與應用實例)11

點擊統計量,選中卡方統計量

卡方檢驗成功案例(卡方檢驗原理與應用實例)12

點擊繼續後,點擊确定得到輸出結果

卡方檢驗成功案例(卡方檢驗原理與應用實例)13

可以看到sig大于0.05,接受原假設,因此可以有95%把握認為不同類型員工對保險方案的選擇沒有差别;但是如果考慮置信度為0.1的話,則0.088<0.1,拒絕原假設,因此有90%的把握認為不同類型的員工對保險方案的選擇有差别!這裡看你怎麼選擇置信度了!

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
Copyright 2023-2024 - www.tftnews.com All Rights Reserved