首页
/
每日頭條
/
職場
/
多元線性回歸計算過程
多元線性回歸計算過程
更新时间:2024-12-01 05:13:55
​編輯

然後我們再來看一下,對于之前我們說的,一元一次方程來說,在我們的現實世界中,往往是不能适用的,因為隻考慮一個因素的話,那麼太簡單了,所以我們需要,考慮多個因素,這裡就需要

多元一次方程.這個元就是多個維度,考慮多個因素的意思.

多元線性回歸計算過程(理解回歸多元線性回歸)1

多元線性回歸計算過程(理解回歸多元線性回歸)2

​編輯

可以看到,多元線性回歸,其實就是上面寫的

y = w1*x1 ....wn * xn w0

多元線性回歸計算過程(理解回歸多元線性回歸)3

多元線性回歸計算過程(理解回歸多元線性回歸)4

​編輯

然後這裡要注意,其實這個w0 可以寫成w0*x0,我們假設x0是1

y = w1*x1 ....wn * xn w0 * x0 就寫成了這樣

多元線性回歸計算過程(理解回歸多元線性回歸)5

多元線性回歸計算過程(理解回歸多元線性回歸)6

​編輯

然後這個我們看到其實就是一個,行和列的計算,如果我們把w1...wn寫成行,然後把x0...xn寫成列,那麼上面我們寫的那個:y = w1*x1 ....wn * xn w0 * x0 實際上就是行列的,相乘

也可以寫成 y =wT* x 這樣寫,在數學中叫做transpose,轉置函數,也叫轉換函數,轉換成行列相乘函數.這裡wT指的就是w0到wn,然後x指的就是x0到xn,然後還可以簡寫成:y = seita T * X

這裡seita 符号我又不會打了. y = θ^T * X 這裡的T,也不是這樣寫的,也不是T次方的意思,這裡表示對W,或者說是對θ 進行轉置,因為T是轉置函數,

多元線性回歸計算過程(理解回歸多元線性回歸)7

多元線性回歸計算過程(理解回歸多元線性回歸)8

​編輯

然後我們繼續來看這裡,對于上圖中,左邊的m來說,表示輸入的樣本,所謂的樣本,就是很多的數據,曆史數據,這裡yi表示,第m個樣本的,第i個結果,這裡的yi,表示的是真實的結果.并不是我們之前說的那個yhat y估計,是真實值.這裡要知道y是一列的,然後x是什麼呢?x不是行業不是列,x是一個,行列的矩陣,表示的是,m * x,這樣的行列矩陣,然後如果我們寫一個xi,那麼這個xi,表示,裡面的某一行,也就是針對某個m樣本的,某個x0到xn ,這裡的xi指的就是某個x0到xn.

然後上面我們寫的公式y = W^t * X 這裡是小寫的y,表示預測值,就是yhat ,然後t表示轉置,可以看到,右邊是e bu se lo ε ,這個值,我們就可以用,大寫的Y 也就是輸入的真實的Y值,然後 減去- y小寫的y,去絕對值,就得到了誤差ε了.

然後我們再看上面的值,那個be ta beta(大寫Β,小寫β,中文音譯:貝塔 ) ,這個其實用w來表示,會更專業,w0到wn,這裡用大寫的W,表示權重,為什麼用大寫的W表示,因為:

多元線性回歸計算過程(理解回歸多元線性回歸)9

多元線性回歸計算過程(理解回歸多元線性回歸)10

​編輯

可以看到,這裡y = w1*x1 w2*x2 ....wn*xn w0 *x0..

可以看到這裡W越大,表示權重越大對結果的影響越大對吧.所以w也是重要程度,影響程度這樣.

然後我們再來看,這裡m指的是樣本,那麼m *x0 ...xn,其實就是,y列,其實就是y = m *x 這樣一個矩陣,

那麼就是m *x (也就是y 這一個列)= 那麼m行 * n列(這裡m和x都表示一組數據) 這個行列矩陣 * 要乘以 ,注意這裡需要再理解一下,這裡的m0到mn個樣本, * x0 到xn,這裡整個的這部分合起來,可以理解成,我們之前的那個一元一次方程裡的x,然後,這個行列的矩陣,要乘以一個n行 一列的w0的數據,也就是權重數據,才能得到 y這個預測值.所以,這裡我們說的w,每個w都表示w0到wn,是一個一列n行的數據,一組數據.

這裡有了y值這個真實值這一列,有了輸入的初始的樣本m,yi = mi * xi m0 *x0 這裡就可以獲取到

一組w,這裡一組w,就是m其實就是,但是m是初始的樣本值,w是求出的模型,也就是我們說權重,然後

這裡mi 和 xi 都值得是一組數據這個要清楚,然後,有了這個w以後,我們就可以帶入新的xi,也就是一組x 的值,然後去求出預測值y.得到預測值yi.

多元線性回歸計算過程(理解回歸多元線性回歸)11

多元線性回歸計算過程(理解回歸多元線性回歸)12

​編輯

然後我們再來看,我們的公式,y = se ta T* X 或者寫成 = WT *X ,這裡的

w指的是一個m行一列的數據,同樣x是m行 n列的數據,得到的是一個y 這個預測值,是

m行 一列的預測值,然後和m行 一列的真實的Y 去減去然後獲得絕對值,得到一個,m行 一列的

誤差列 e bu se lo.

多元線性回歸計算過程(理解回歸多元線性回歸)13

多元線性回歸計算過程(理解回歸多元線性回歸)14

​編輯

然後其實我們這裡要做的就是,要把現有的得到這個e bu se lo 這個列,拿到,然後

把拿到的值進行 平方,然後加起來,∑,然後再去除以 m的 行數 ,也就是我們輸入的樣本數量,得到

平均值,這個值就是截距...就是挨着線性最近的那個誤差值.通過我們不斷得到w權重,帶入,得到

不同的這個值,獲取最小的這個值,對應的一組w就可以了.我們找到就是這一組w.權重.也叫模型.

多元線性回歸計算過程(理解回歸多元線性回歸)15

多元線性回歸計算過程(理解回歸多元線性回歸)16

​編輯

首先我們看,這裡數據首先是包含,x,y的數據,然後,得到的值,y如果是連續的那麼我們需要處理的是,回歸問題,

如果y是離散的,我們需要解決的是分類問題.

多元線性回歸計算過程(理解回歸多元線性回歸)17

多元線性回歸計算過程(理解回歸多元線性回歸)18

​編輯

之前也說過這個案例了,這裡要說的就是,自然規律,高斯分布,我們要做的就是,找到貼近高斯分布,也就是正态分布的,這個權重w.

多元線性回歸計算過程(理解回歸多元線性回歸)19

多元線性回歸計算過程(理解回歸多元線性回歸)20

​編輯

然後我們再來看,這裡,有個最大似然估計,這個是什麼意思,最大似然估計是一種統計方法,它用來求一個樣本的相關概率密度函數的參數,也就是說,對于我們的數據集,我們可能會有很多個正太分布,

那麼我們要找到,符合我們數據集的是哪一個正太分布,這個時候我們就需要用到這個,最大似然估計.

因為我們知道,如果我們找到了一個正态分布的密度函數,我們要獲取密度最大的,也就是相關性最大的這個正太分布.

舉個例子,我們有兩個正太分布,一個是踢足球的人員的正态分布,可以看到上面左邊的那個,這個正太分布,身高可以看到,範圍廣一些,1.6到1.9 是,另一個是打籃球人的正太分布,可以看到這個身高是1.8到2.26 ,這個正太分布就比較的高,比較廋對吧,也就是大部分數據,都集中在u均值的左右了...數據密集.所以如果有一個人是1.7,或者1.8 ,那麼我們通過最大似然估計,能得到,第一個正太分布,比較符合規律,我們就把這個人放到第一個正太分布裡.

實際上,我們說,如果我們有一個u值,也就是均值,并且我們還有一個 标準差,這個标準差表示的是數據的離散程度,或者說方差是表示離散程度,方差越大,那麼正太分布越扁平,離散程度高,越小離散程度越小.

方差是實際值與期望值之差平方的平均值,而标準差是方差平方根。标準差,也稱均方差,是各數據偏離平均數的距離的平均數,它是離均差平方和平均後的方根,用σ表示。标準差是方差的算術平方根。标準差能反映一個數據集的離散程度.

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
ui工作面試實操
ui工作面試實操
英國人力培訓專家吉爾伯特有一個非常有名的定律:工作中最大的問題就是沒人跟你說該如何去做,這一定律估計戳穿了不少上班族的内心吧?仔細回想一下,在很小的時候,父母會告訴我們什麼事該怎麼做,上學後遇到難題,老師會教我們怎樣解題,但一旦你離開學校,...
2024-12-01
沒找到新工作能不能自己交社保
沒找到新工作能不能自己交社保
辭職後有必要自己交社保嗎?相信這是很多“裸辭”的朋友很關心的問題,是否需要交社保就要先了解下社保斷繳的影響。社保斷繳後你的社保待遇就停止享受了,影響最大的是醫療。簡單點說,斷繳期間,你住院的費用就得全部自己掏錢了。還有一些城市社保繳納和購房...
2024-12-01
育雛雞的生理特點和育雛方式
育雛雞的生理特點和育雛方式
導語:每天更新養殖小知識,如果您在養殖過程中,有養殖問題,可以上方關注我,下方評論,點擊我的頭像私信我,免費獲得終身的技術指導!育雛前要做好,哪幾種的育雛工作1.要有一個育雛的計劃2.育雛舍和設備的準備。【育雛舍要通風合理,光線明亮、地勢高...
2024-12-01
面試真題及答案分析
面試真題及答案分析
面試真題及答案分析?很多今年參加春招的同學都在表示今年的招聘季太難太卷啦,我來為大家科普一下關于面試真題及答案分析?下面希望有你要的答案,我們一起來看看吧!面試真題及答案分析很多今年參加春招的同學都在表示今年的招聘季太難太卷啦!!!因為疫情...
2024-12-01
劉永好四川富豪
劉永好四川富豪
誰是最慘的?2020年3月12日,美利車金融公司員工劉勇(化名)乘坐貨梯,偷偷“溜進”位于北京綠地中心20層的辦公室收拾東西。劉勇告訴時間财經,他收拾東西是準備離職。之所以乘坐貨梯,是因為“公司被物業拉黑,大門不讓進”。在此之前,當大部分同...
2024-12-01
Copyright 2023-2024 - www.tftnews.com All Rights Reserved