首页
/
每日頭條
/
生活
/
mle回歸系數解釋
mle回歸系數解釋
更新时间:2024-10-11 23:18:41

mle回歸系數解釋(最大似然估計MLE入門教程)1

來源:Deephub Imba

本文約1500字,建議閱讀9分鐘

本文解釋了 MLE 的工作原理和方式,以及它與 MAP 等類似方法的不同之處。

mle回歸系數解釋(最大似然估計MLE入門教程)2

什麼是最大似然估計(MLE)

最大似然估計(Maximum Likelihood Estimation)是一種可以生成拟合數據的任何分布的參數的最可能估計的技術。它是一種解決建模和統計中常見問題的方法——将概率分布拟合到數據集。

例如,假設數據來自泊松(λ)分布,在數據分析時需要知道λ參數來理解數據。這時就可以通過計算MLE找到給定數據的最有可能的λ,并将其用作對參數的良好估計。

MLE是用于拟合或估計數據集概率分布的頻率法。這是因為MLE從不計算假設的概率,而貝葉斯解會同時使用數據和假設的概率。MLE假設在計算方法之前,所有的解決方案(分布的參數)都是等可能的,而貝葉斯方法(MAP)不是這樣,它使用了關于分布參數的先驗信息。

MLE之所以有效,是因為它将尋找數據分布的參數視為一個優化問題。通過最大化似然函數,找到了最可能的解。

理解似然函數

顧名思義,最大似然估計是通過最大化似然函數來計算的。(從技術上講,這不是找到它的唯一方法,但這是最直接的方法)。

似然函數是衡量樣本成為觀察到數據的概率。

如果數據集有1-n個獨立同分布的(iid)随機變量,X₁至Xₙ,與觀察到的數據 x₁ 到 xₙ 相關,我們就有似然函數的數學表達式:

mle回歸系數解釋(最大似然估計MLE入門教程)3

這可以很好地概念化似然函數——但是我們如何将其分解為可以從數據中計算出來的東西呢?換句話說,我們怎樣才能找到最大化我們的似然函數的θ,并且确認他是最大化的?

給定:

mle回歸系數解釋(最大似然估計MLE入門教程)4

那麼:

mle回歸系數解釋(最大似然估計MLE入門教程)5

因為所有随機變量作為觀察數據值的概率等于每個随機變量作為每個數據值的概率(因為它們是獨立同分布的)。

最後,如果數據來自的分布具有密度函數 f(x),例如泊松分布:

mle回歸系數解釋(最大似然估計MLE入門教程)6

那麼似然函數表示為:

mle回歸系數解釋(最大似然估計MLE入門教程)7

對于上面的泊松分布的例子,似然函數将是:

mle回歸系數解釋(最大似然估計MLE入門教程)8

總之,似然函數是作為給定分布參數的函數給出的觀測數據的聯合概率。

如何最大化似然函數

現在可以用數學方式表達給定分布的似然函數,但看起來它是一個需要最大化甚至求導數的函數。那麼如何有效地最大化似然函數呢?

取它的對數

雖然似然函數通常難以在數學上最大化,但似然函數的對數通常更容易處理。我們這樣做的理論基礎是:最大化對數似然的值 θ 也最大化似然函數。

泊松分布示例

我們繼續使用上面已經建立的泊松分布作為示例。給定數據集X₁…Xₙ,這是i.i.d.,我們認為它來自泊松(λ)分布,λ的MLE是多少?分布中的λ參數的最大似然估計是什麼?

總結一下,計算MLE的步驟如下:

  1. 求似然函數;
  2. 計算對數似然函數;
  3. 最大化對數似然函數。

首先,我們已經建立了似然函數為:

mle回歸系數解釋(最大似然估計MLE入門教程)9

為了計算對數似然,我們取上述函數的對數。可以通過以下步驟推導:

mle回歸系數解釋(最大似然估計MLE入門教程)10

最後,我們最大化對數似然和簡化,就得到最大似然λ。

mle回歸系數解釋(最大似然估計MLE入門教程)11

我們發現λ的最大似值是x的均值,或給定數據集x₁…xₙ的均值。

可以用MLE做什麼

最直觀的是給定數據集分布參數MLE,可以繼續對數據集應用統計技術,并對數據集的确切分布做出假設。這樣可以使統計分析更強大。除了數據集分布的估計參數外,MLE還有兩個很有用的重要屬性。

1. MLE 是它正在估計的參數的一緻估計量。

參數θ的估計是一緻的,如果:

mle回歸系數解釋(最大似然估計MLE入門教程)12

為什麼會這樣呢?因為大數定律。n很大,估計與θ相差很大的概率很小。

因為MLE是它所估計的參數的一緻估計:

mle回歸系數解釋(最大似然估計MLE入門教程)13

這告訴我們什麼?數據集越大,MLE 估計越準确。

2. MLE 是漸近正态的。

這意味着如果 MLE 估計器正在估計 θ₀(是參數 θ 的真實總體值),那麼随着 n 增加到 ∞:

mle回歸系數解釋(最大似然估計MLE入門教程)14

要查找µ和σ2,可以使用Fisher Information等其他技術,它告訴我們更多關于 MLE 本身的分布。但這超出了本文的範圍。

總結

MLE 是一種技術,可以生成對要拟合數據的任何分布的參數的最可能估計值。估計值是通過最大化數據來自的分布的對數似然函數來計算的。本文解釋了 MLE 的工作原理和方式,以及它與 MAP 等類似方法的不同之處。還解釋了似然函數的定義以及如何推導它。最後還使用了一個從泊松分布計算 MLE 的示例,并解釋了 MLE 的兩個重要屬性,即一緻性和漸近正态性。希望這對任何學習統計和數據科學的人有所幫助!

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
三伏天用什麼排濕氣寒氣最好?
三伏天用什麼排濕氣寒氣最好?
01伏天去濕氣寒氣的辦法:1、少吃甜、膩的食物。如果你身體有濕氣少吃甜膩食物,因為甜膩容易轉化為濕氣。2、别吃生冷食物。3、别喝酒。4、可以多吃姜去寒濕。5、可以多吃綠豆、西瓜、扁豆來去濕寒氣。三伏天是一年中最熱的時候,這段時間也是冬病夏治的好時候,非常适合排除體内的寒濕,伏天去濕氣寒氣的辦法:1、...
2024-10-11
圍棋怎麼下
圍棋怎麼下
圍棋現在比較流行的一種棋牌類型,主要是取決于中國,格狀的棋盤以及黑白二子去進行對弈,同時進行以為地的大小來決定勝負,中國的時候對于圍棋是非常講究的,是一樣樣精通的這樣的說法,是目前世界上最複雜的遊戲,不僅動腦,需要很多講究很多的戰術,而且需要非常透徹地理解圍棋,那麼很多人那堆圍棋怎麼進行下的也是不清...
2024-10-11
日常床墊保養好 優質睡眠不打折
日常床墊保養好 優質睡眠不打折
睡眠是人健康的保證,而睡眠質量的好壞直接體現出身體的好壞,對此很多家庭不惜耗費大量資金選購很好的床墊、床單等床具,希望得到一個優質的睡眠環境,提高睡眠質量。但是花了大價錢購買來的床墊卻不經常打理,這樣的方式不但不會得到優質的睡眠還會對睡眠質量産生負面影響。下面就和小編一起來看看日常床墊保養的方法吧。...
2024-10-11
大型床罩與被套洗滌方法
大型床罩與被套洗滌方法
大型床罩與被套洗滌方法:如果并不肯定床罩與被套可用洗衣機洗,最好的方法是幹洗,以免縮水。但必須先行過水及脫水,這樣便能清除大部分塵垢。清洗後,保持微濕,待晾幹後,便可恢複原狀。
2024-10-11
漲潮退潮時間是怎樣的?
漲潮退潮時間是怎樣的?
如果是規則的半日潮,漲潮、落潮的時間是每12個小時為一個周期潮水進行漲退。可運用公式:最高潮時間=農曆*0.8,算出最高潮時間,再用公式:最低潮時間=最高潮時間+/-6,比如農曆十五或三十,漲潮時間就是12點和零點,落潮時間就是早晚的6點。由于海水的漲潮退潮是受到月球引力影響而産生的一種地理現象,因...
2024-10-11
Copyright 2023-2024 - www.tftnews.com All Rights Reserved