首页
/
每日頭條
/
科技
/
常見的數據分析方法
常見的數據分析方法
更新时间:2024-09-29 15:21:02

從同一批芯片中抽取兩份樣品,一份合格一份不合格,這說明什麼問題呢?直觀感覺可能是該批芯片的不良率太高,但還有一種可能是碰巧抽到了為數不多的不合格品。假設檢驗是一種非常重要而又常用的統計方法,其任務就是确認這份不合格的樣品到底是碰巧抽到的,還是這批芯片真的不良率太高了。

零假設

在刑事案件中,抓獲嫌疑人以後,在審判之前司法人員無法确定嫌疑人是否有罪,這時會對其進行假設,兩種方法如下。

1. 假設嫌疑人有罪,嫌疑人需要提供證據證明自己無罪,如果無法證明,就可以認定其有罪,這叫作有罪推定。

2. 假設嫌疑人無罪,司法人員需要提供證據證明嫌疑人有罪,如果無法證明,就可以認定其無罪,這叫作無罪推定。

兩種原則的優缺點屬于法學家的研究課題,但是在統計學中,假設檢驗的思想和無罪推定原則如出一轍。

先看 3 個假設命題:

™ 20 ~ 30 歲的人的平均記憶能力和 50 ~ 60 歲的人的平均記憶能力沒有差異。

™ 養老院照看老人的效果和子女親自照看老人的效果沒有差異。

™ 每天練習的短跑運動員和一周練習一次的短跑運動員在短跑成績上沒有差異。

這 3 個假設的共同之處在于,無論做哪種選擇,最後的結果都是一樣的,也可以說每種選擇之間是等價的或沒有差異的。

如果想研究 20 ~ 30 歲的人群和 50 ~ 60 歲的人群的記憶能力的差别,在沒有任何其他的信息之前,不能認為二者存在差異。在對事物沒有更多的了解之前,一般先給一個無差異的假設,這就是零假設,也被稱為原假設,就像無罪推定原則,要先給嫌疑人一個無罪的假設。

對一個或多個總體提出零假設,是假設檢驗的起點。除非能夠證明事物之間存在差異,否則要一直假設沒有差異。

背擇假設(對立假設)

零假設是指變量間沒有關系,而備擇假設是指變量間有很明确的關系,是和零假設完全相反的,所以備擇假設也稱為對立假設。例如,在上一節中的 3 個零假設,都會有至少一個相應的對立假設,如表 9-1 所示。

表 9-1 零假設和對立假設

零假設

對立假設

20 ~ 30 歲的人的平均記憶能力和 50 ~ 60歲的人的平均記憶能力沒有差異

20 ~ 30 歲的人的平均記憶能力比 50 ~ 60歲的人的平均記憶能力更強

養老院照看老人的效果和子女親自照看老人的效果沒有差異

養老院照看老人的效果比子女親自照看老人的效果差

每天練習的短跑運動員和一周練習一次的短跑運動員在短跑成績上無差異

每天練習的短跑運動員比一周練習一次的短跑運動員在短跑成績上更好

這 3 個對立假設的共同之處在于,每做一種選擇,就會有不同的結果與之相對應,也可以說每種選擇之間是不等價的或是有差異的。

有差異的關系又可以分為兩種情況,有方向的對立假設和無方向的對立假設。

例如,20 ~ 30 歲的人的平均記憶能力和 50 ~ 60 歲的人的平均記憶能力不同。隻說了兩個群體是不同的,至于怎樣不同并沒有限定,這就是無方向的對立假設。

如果将上述假設加以修改,20 ~ 30 歲的人的平均記憶能力優于 50 ~ 60 歲的人的平均記憶能力。不僅指出兩個群體是不同的,而且還說明了兩個對照群體中誰強誰弱,這就是有方向的對立假設。

假設檢驗流程

以20 ~ 30 歲和 50 ~ 60 歲的人群記憶能力對比為例,如果想知道兩個人群的記憶能力差異,步驟如下。

1.提出零假設,這是基礎,即“20 ~ 30 歲的人的平均記憶能力和 50 ~ 60 歲的人的平均記憶能力沒有差異”。相當于無罪推定。

2.分别從兩個人群中抽樣,得到兩個樣本,同時提出對立假設“20 ~ 30 歲的樣本人群的平均記憶能力比 50 ~ 60 歲的樣本人群的平均記憶能力強”。相當于司法人員對嫌疑人提出有罪指控。

3.證明對立假設是否成立,具體證明方法會在下一節中讨論。如果對立假設成立,零假設就不成立;如果對立假設不成立,那麼零假設就成立。這裡要注意的是,零假設和對立假設是完全相反的結論,是互斥的,隻要其中一個成立,另一個一定是不成立的。相當于司法人員提供證據,證明嫌疑人是否有罪,如果證據充分即可證明其有罪,如果證據不充分,則無法證明其有罪,要維持無罪的假設。

從該流程可以看出零假設和對立假設的區别如下。

1. 零假設是指兩個變量之間無差異,對立假設是指兩個變量之間有差異,兩種假設是互斥的,這是本質區别。

2. 零假設是相對總體而言的,對立假設是相對樣本而言的。先對一個總體做了零假設,然後再從中抽取樣本對其進行對立假設,所以兩種假設的主體是不同的。

常見的數據分析方法(說說數據分析中的假設分析)1

圖 9-1 假設檢驗流程

圖 9-1 展示的邏輯看上去和參數估計有些相像,參數估計是用樣本特征估計總體特征,假設檢驗是用樣本假設檢驗總體假設,都是從樣本出發解決總體問題。

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
暖暖環遊世界通關教程174
暖暖環遊世界通關教程174
暖暖環遊世界4.5.0版本更新了哪些内容?4.5.0版本新增了哪些功能?4.5.0版本更新内容公告,希望這篇文章能夠幫助到大家!遊戲介紹:暖暖環遊世界是一款完美的融合了RPG的換裝遊戲,清新的遊戲風格立馬打動了無數少男少女的心。在這款遊戲中...
2024-09-29
經常玩手機引起腱鞘炎
經常玩手機引起腱鞘炎
剛結束的五一假期,你是怎麼過的?爬山、露營、購物、景點打卡還是在家玩了五天手機?(難怪假期過完别人都是腿酸,而你卻是手酸)如果已經出現雙手拇指屈伸不靈活正常彎曲和提重物時疼痛難忍的情況那麼遺憾地通知你你很可能患上了腱鞘炎腱鞘炎是什麼?腱鞘是...
2024-09-29
安卓手機如何刷root權限
安卓手機如何刷root權限
【Top.5】完美Root精彩點評:有時,其他的root軟件都搞不定的,用它就能成功。比如,山寨安卓手機或許某些安卓平闆。軟件界面也比較簡潔幹淨,還可移除ROOT,還原手機狀态。【Top.4】Root精靈精彩點評:看教程看了好多,也沒Roo...
2024-09-29
上海市科技創新促進條例
上海市科技創新促進條例
近日,《上海市科技創新創業載體管理辦法(試行)》發布,根據《科技企業孵化器管理辦法》(國科發區〔2018〕300号)、《國家衆創空間備案暫行規定》(國科火字〔2017〕120号)和《國家大學科技園管理辦法》(國科發區〔2019〕117号),...
2024-09-29
互聯網有哪個平台
互聯網有哪個平台
說互聯網是“大”将是一個巨大的輕描淡寫。它已成為發生大量活動的中心場所。大多數活動都發生在網站上,那麼有多少?這不是一個簡單的問題要回答。互聯網被稱為“萬維網”是有原因的。世界各地的企業、組織和個人一直在創建網站。這個數字是不斷變化的。最佳...
2024-09-29
Copyright 2023-2024 - www.tftnews.com All Rights Reserved