首页
/
每日頭條
/
生活
/
離散型随機變量的泊松分布
離散型随機變量的泊松分布
更新时间:2025-03-26 08:37:47

離散型随機變量的泊松分布(單變量和多變量高斯分布)1

詳細介紹高斯分布及其與均值、标準差、方差的關系

高斯分布是統計中最重要的概率分布,在機器學習中也很重要。因為很多自然現象,比如人口的身高,血壓,鞋子的尺碼,教育指标,考試成績,還有很多更重要的自然因素都遵循高斯分布。

我相信,你聽說過這個詞,在某種程度上也知道它。如果沒有,也不要擔心。這篇文章将會解釋清楚。我在Coursera的Andrew Ng教授的機器學習課程中發現了一些令人驚歎的視覺效果。他知道如何将一個主題分解成小塊,使它更容易解釋。

他使用了一些可視化方法,讓人們很容易理解高斯分布及其與相關參數(如均值、标準差和方差)的關系。

在這篇文章中,我從他的課程中截取了一些圖像,并在這裡用它來詳細解釋高斯分布。

高斯分布

高斯分布是正态分布的同義詞。它們是一樣的東西。假設,S是一組随機值,其概率分布如下圖所示。

離散型随機變量的泊松分布(單變量和多變量高斯分布)2

這是一個鐘形曲線。如果一個概率分布圖像上面那樣形成一個鐘形曲線,并且該樣本的均值和中位數相同,則該分布稱為正态分布高斯分布

高斯分布由兩個參數:

a.平均數

b.方差

所以,高斯密度在mu或均值處是最高的,離均值越遠,高斯密度就越低。

這是高斯分布的公式:

離散型随機變量的泊松分布(單變量和多變量高斯分布)3

方程左邊是x的概率參數是和的平方。這是鐘形曲線的公式其中平方稱為方差。

高斯分布與平均值和标準差有什麼關系

在這一節中,我将展示一些圖片,讓你們清楚地了解參數和與鐘形曲線的關系。我将展示三幅圖在這三幅圖中mu固定在0處而sigma不同。

注意曲線的形狀和範圍是如何随不同的sigma變化的。

離散型随機變量的泊松分布(單變量和多變量高斯分布)4

這是一組随機數的概率分布mu = 0,而sigma = 1。

在這幅圖中,mu是0,這意味着最大的概率密度是0,sigma是1。表示曲線的寬度是1

注意,曲線的高度大約是0.5,範圍是-4到4(看x軸)。方差的平方是1。

離散型随機變量的泊松分布(單變量和多變量高斯分布)5

這是另一組随機數0,0.5。

因為mu是0,就像之前的圖一樣最大的概率密度是0,sigma是0.5。曲線的寬度是0.5。方差的平方變成0.25。

由于曲線的寬度是前一條曲線的一半,因此高度加倍。範圍改變為-2到2 (x軸),這是前一張圖片的一半。

離散型随機變量的泊松分布(單變量和多變量高斯分布)6

在這幅圖中,sigma= 2 mu= 0。

将其與圖1比較,其中sigma為1。這一次,高度變成了圖1的一半,寬度随着變成兩倍。

方差平方是4,比圖1大4倍。x軸的範圍是-8到8。

離散型随機變量的泊松分布(單變量和多變量高斯分布)7

此示例與前三個示例略有不同。

這裡,我們把mu改為3 sigma = 0.5,如圖2所示。因此,曲線的形狀與圖2完全相同,隻是中心移動到了3。現在最大的密度是3。

上面的四條曲線用不同的參數改變形狀但曲線的面積保持不變。

概率分布的一個重要性質是,曲線下的面積積分為1。

參數計算

假設我們有一系列數據。如何計算mu(均值)和标準差?

mu的計算很簡單。這隻是平均數。把所有數據的總和除以數據的總數。

離散型随機變量的泊松分布(單變量和多變量高斯分布)8

這裡,xi是數據集中的單個值,m是數據的總數。

方差公式為:

離散型随機變量的泊松分布(單變量和多變量高斯分布)9

标準差就是方差的平方根。

多元高斯分布

假設有多組數據,我們需要多元高斯分布。假設我們有兩組數據;x1和x2。

單獨建模p(x1)和p(x2)對于理解兩個數據集的組合效果可能不是一個好主意。在這種情況下,您可能希望将數據集和模型僅結合在一起建立p(x)。

這是計算多元高斯分布概率的公式,

離散型随機變量的泊松分布(單變量和多變量高斯分布)10

多變量高斯分布的可視化表示

在本節中,我們将看到多元高斯分布的可視化表示,以及曲線的形狀如何随mu、sigma以及變量之間的相關性而變化。

從标準正态分布開始

離散型随機變量的泊松分布(單變量和多變量高斯分布)11

該圖表示多元高斯分布的概率分布,其中x1和x2的mu都為零。

請不要被這裡的求和符号搞糊塗了。這是一個單位矩陣,其中對角線上的1是x1和x2的sigma。而非對角線上的零表示x1和x2之間的相關性。在這個例子中x1和x2是不相關的。

這裡的圖片很簡單。在x1和x2方向上,當mu為0時,最大的概率密度為0。

中間的深紅色區域是概率密度最高的區域。在淺紅色、黃色、綠色和青色區域,概率密度繼續降低。深藍色區域是最低的。

改變标準差

離散型随機變量的泊松分布(單變量和多變量高斯分布)12

現在,讓我們看看如果sigma變小一點會發生什麼。x1 x2的sigma都是0.6。

正如我之前提到的,曲線下的面積要積分為1。标準差減小時,曲線範圍減小。同時,曲線的高度變高,以調整區域。

離散型随機變量的泊松分布(單變量和多變量高斯分布)13

相反,當sigma越大,範圍就越大。所以曲線的高度變低了。

看看圖6,曲線和範圍的高度變化幾乎與我之前在單變量高斯分布中顯示的圖相似。

x1和x2的值并不總是相同的。我們來看看這樣的例子。

離散型随機變量的泊松分布(單變量和多變量高斯分布)14

在圖7中,x1的sigma = 0.6, x2的sigma = 1。

x1的範圍變小了,因為标準差變小了。

離散型随機變量的泊松分布(單變量和多變量高斯分布)15

在圖8中,它與前一張圖相反。

x1的sigma是x2的兩倍。

這次x1有更大的範圍。

改變變量之間的相關因素

離散型随機變量的泊松分布(單變量和多變量高斯分布)16

這是一個完全不同的場景。在圖9中,非對角線值不再是零。而是0.5。它表明x1和x2的相關系數為0.5。

x1和x2的範圍是一起增長的因為它們是正相關的。

當x1大時,x2也大當x1小時,x2也小。

離散型随機變量的泊松分布(單變量和多變量高斯分布)17

在圖10中,x1和x2之間的相關性更大,為0.8!

所有的概率都在一個狹窄的區域内。分布也看起來又高又瘦。

在上面所有的圖片中,x1和x2之間的相關性要麼是正的,要麼是零。讓我們看一個相關系數為負的例子。

離散型随機變量的泊松分布(單變量和多變量高斯分布)18

在圖11中,x1和x2的相關性為-0.8。

你可以看到概率又在一個小範圍内了。但是當x1大,x2小,當x1小,x2大。

最後,我們需要檢驗不同均值

我們來看看mu不同時圖像的變化。

離散型随機變量的泊松分布(單變量和多變量高斯分布)19

在圖12中,mu對于x1是0,對于x2是0。5。

看看圖片上的範圍。對于x2,曲線的中心從0開始移動。

中心位置或最高概率分布點現在應該是0.5。

離散型随機變量的泊松分布(單變量和多變量高斯分布)20

在圖13中,mu對于x1 為1.5,對于x2 mu為-0.5。

x1方向上最高概率點是1.5。同時,對于x2方向,最高概率點為-0.5。

總的來說,整個曲線都在移動。

結論

我希望這篇文章對理解高斯分布和它的特征有幫助。我試圖展示和解釋曲線與不同參數之間的關系。希望,當你在統計或機器學習中使用高斯分布時,會簡單得多。

作者:Rashida Nasrin Sucky

deephub翻譯組:孟翔傑

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
敲打膽經的最佳方法(經常敲打gan膽經好處多多)
敲打膽經的最佳方法(經常敲打gan膽經好處多多)
  敲打膽經的好處。   ·白天敲打膽經,沿大腿褲縫線位置,由臀部向膝蓋方向敲打,遇痛點多敲打,重點敲打,打到發熱為止。      ·敲打膽經可促進肝膽排毒,增強免疫力,生發陽氣。   ·睡前敲肝經,肝經在大腿中線褲縫線位置,先敲後推,從腿根到膝蓋,有痛點就多按壓,疏通肝經可以促進睡眠,排毒美容。      ,
2025-03-26
尋找貴州之旅感悟(一次意想不到的旅程)
尋找貴州之旅感悟(一次意想不到的旅程)
  說到貴州你會想到什麼?首先一定是“茅台”,無人不知,無人不曉。茅台名氣之大,“堪稱極品酒中王,賜予茅台國字香”真是國人的驕傲。還有讓人欲罷不能的“老幹媽”哈哈!貴州旅遊也是很發達的,有好多著名的景點“黃果樹瀑布”、“梵淨山”、“荔波小七孔”、“千戶苗寨”、“遵義會議遺址”……等等。      茅台鎮      茅台鎮      千戶苗寨      荔波小...
2025-03-26
最美童音(最美童聲)
最美童音(最美童聲)
  來源:長春日報-長春新聞網本報訊 (記者 畢馨月)28日,“2020首屆吉林長春最美童聲——兒童詩歌進校園”公益朗誦活動組委會傳來好消息,本次活動将于6月1日10時啟動,屆時,中國新聞網App将對啟動儀式進行現場直播,接下來我們就來聊聊關于最美童音?以下内容大家不妨參考一二希望能幫到您!   最美童音   來源:長春日報-長春新聞網   本報訊 (記者 ...
2025-03-26
如懿傳第一場戲就是打周迅(如懿傳演員的那些年)
如懿傳第一場戲就是打周迅(如懿傳演員的那些年)
     1978年,北京電影學院恢複了招生,這一行為被世界權威的《電影手冊》評為20世紀電影史上100個最激動人心的時刻之一。   這一年,對中國電影來說意義太重大了。這一批所招的新生,掀起了中國電影的第五代浪潮!   當年已經22歲的張豐毅,便是這其中的一員。         四十年前,同樣的開學季,這批新生躊躇滿志的踏入了北電的校門,這其中包括導演系的...
2025-03-26
青龍獎林允兒iu同台拿獎(允兒強勢提名影後)
青龍獎林允兒iu同台拿獎(允兒強勢提名影後)
  hello, 大家好。近幾年來,越來越多的藝人開始飲食和全方位發展,尤其是在競争更為激烈的韓國娛樂市場。但是對于偶像歌手轉型做演員這一做法,很多人都是保留看法,不是科班出身,沒有演戲經驗,這是網友們對他們最大的質疑。   但是随着IU、秀智、允兒等人在影視劇作品中展露出精彩表現後,愛豆不能做演員,這個刻闆印象正在被慢慢打破。小編今天盤點了幾位轉型成功的女...
2025-03-26
Copyright 2023-2025 - www.tftnews.com All Rights Reserved