神奇的正态分布源于“加”。
撰文 | 張和持
時隔多年,或許你早就記不得16歲那年夏天高中悶熱的教室,但可能會記得有一天數學老師說着要給大夥看個稀奇——一塊祖傳的高爾頓闆。盡管班上大多數同學都叫不出它的名字,卻也從小到大在科技館、博物館見多了,一點都提不起勁兒。老師一本正經地開始講,這個圖形就是正态分布,它有諸多的性質……午後的時光更加昏沉而緩慢地流逝。
不過,這裡面蘊含的數學可一點都不無聊,讓我們來觀察一下高爾頓闆的結構。
楊輝三角/圖片來源:維基百科
不過這一結論在當時并沒有引起重視,畢竟并不是所有賭徒都能像梅雷一樣交上帕斯卡這樣的朋友。百年之後,拉普拉斯試圖挽救這個定理的人氣,依然沒有成功。為了紀念這對“難兄難弟”,現在人們把這個定理稱為棣莫弗-拉普拉斯定理。
在物理學中,誤差來自于無關因素的微小擾動。這些擾動加起來,就是整體的誤差。這個整體誤差雖然層次不齊,但形狀與正态分布還是大緻吻合的。從那以後,實驗的誤差一般都當作是正态分布。為了紀念高斯的貢獻,也把正态分布稱為高斯分布。
至此,我們已經大概能想象到,正态分布的逼近與這種“加”的性質有關,剩下證明就是數學家的事了。如今,我們把這一系列逼近正态分布的性質稱為“中心極限定理”,結論從最初的二項分布,已經擴展到了任意分布(包括同分布和不同分布)的廣闊天地。就如同上一段中的誤差——即便我們對微觀下的擾動一無所知,也能通過這種極限形式,了解大樣本下的整體行為。
應用這一思想的最為經典的例子當屬統計力學。假如有一大堆粒子,每個都雜亂無章地運動,我們自然無從知曉每一個粒子的運動狀況。不過,如果把每一個粒子的動量當作是一個随機分布的話,那就可以把所有這些分布“加”起來當做整體的動量。如此一來,中心極限定理豈不是大有用處?
的确如此。如果對理想氣體應用中心極限定理,得到的正是大名鼎鼎的麥克斯韋速度分布:
物理學中一般是用玻爾茲曼分布來推導麥克斯韋分布的,但玻爾茲曼分布本身也可以用中心極限定理間接推導出來。之所以說是間接,隻需要看它的形式
這根本不是正态分布。歸根結底,能量的分布在這裡不能相加,但在推導過程中,還是能見到正态分布。具體操作會稍微複雜一些,這裡就不扯遠了。
參考資料
[1] A. I. Khinchin, Mathematical Foundations of Statistical Mechanics
,