首页
/
每日頭條
/
職場
/
多元線性回歸計算過程
多元線性回歸計算過程
更新时间:2025-04-02 07:16:35
​編輯

然後我們再來看一下,對于之前我們說的,一元一次方程來說,在我們的現實世界中,往往是不能适用的,因為隻考慮一個因素的話,那麼太簡單了,所以我們需要,考慮多個因素,這裡就需要

多元一次方程.這個元就是多個維度,考慮多個因素的意思.

多元線性回歸計算過程(理解回歸多元線性回歸)1

多元線性回歸計算過程(理解回歸多元線性回歸)2

​編輯

可以看到,多元線性回歸,其實就是上面寫的

y = w1*x1 ....wn * xn w0

多元線性回歸計算過程(理解回歸多元線性回歸)3

多元線性回歸計算過程(理解回歸多元線性回歸)4

​編輯

然後這裡要注意,其實這個w0 可以寫成w0*x0,我們假設x0是1

y = w1*x1 ....wn * xn w0 * x0 就寫成了這樣

多元線性回歸計算過程(理解回歸多元線性回歸)5

多元線性回歸計算過程(理解回歸多元線性回歸)6

​編輯

然後這個我們看到其實就是一個,行和列的計算,如果我們把w1...wn寫成行,然後把x0...xn寫成列,那麼上面我們寫的那個:y = w1*x1 ....wn * xn w0 * x0 實際上就是行列的,相乘

也可以寫成 y =wT* x 這樣寫,在數學中叫做transpose,轉置函數,也叫轉換函數,轉換成行列相乘函數.這裡wT指的就是w0到wn,然後x指的就是x0到xn,然後還可以簡寫成:y = seita T * X

這裡seita 符号我又不會打了. y = θ^T * X 這裡的T,也不是這樣寫的,也不是T次方的意思,這裡表示對W,或者說是對θ 進行轉置,因為T是轉置函數,

多元線性回歸計算過程(理解回歸多元線性回歸)7

多元線性回歸計算過程(理解回歸多元線性回歸)8

​編輯

然後我們繼續來看這裡,對于上圖中,左邊的m來說,表示輸入的樣本,所謂的樣本,就是很多的數據,曆史數據,這裡yi表示,第m個樣本的,第i個結果,這裡的yi,表示的是真實的結果.并不是我們之前說的那個yhat y估計,是真實值.這裡要知道y是一列的,然後x是什麼呢?x不是行業不是列,x是一個,行列的矩陣,表示的是,m * x,這樣的行列矩陣,然後如果我們寫一個xi,那麼這個xi,表示,裡面的某一行,也就是針對某個m樣本的,某個x0到xn ,這裡的xi指的就是某個x0到xn.

然後上面我們寫的公式y = W^t * X 這裡是小寫的y,表示預測值,就是yhat ,然後t表示轉置,可以看到,右邊是e bu se lo ε ,這個值,我們就可以用,大寫的Y 也就是輸入的真實的Y值,然後 減去- y小寫的y,去絕對值,就得到了誤差ε了.

然後我們再看上面的值,那個be ta beta(大寫Β,小寫β,中文音譯:貝塔 ) ,這個其實用w來表示,會更專業,w0到wn,這裡用大寫的W,表示權重,為什麼用大寫的W表示,因為:

多元線性回歸計算過程(理解回歸多元線性回歸)9

多元線性回歸計算過程(理解回歸多元線性回歸)10

​編輯

可以看到,這裡y = w1*x1 w2*x2 ....wn*xn w0 *x0..

可以看到這裡W越大,表示權重越大對結果的影響越大對吧.所以w也是重要程度,影響程度這樣.

然後我們再來看,這裡m指的是樣本,那麼m *x0 ...xn,其實就是,y列,其實就是y = m *x 這樣一個矩陣,

那麼就是m *x (也就是y 這一個列)= 那麼m行 * n列(這裡m和x都表示一組數據) 這個行列矩陣 * 要乘以 ,注意這裡需要再理解一下,這裡的m0到mn個樣本, * x0 到xn,這裡整個的這部分合起來,可以理解成,我們之前的那個一元一次方程裡的x,然後,這個行列的矩陣,要乘以一個n行 一列的w0的數據,也就是權重數據,才能得到 y這個預測值.所以,這裡我們說的w,每個w都表示w0到wn,是一個一列n行的數據,一組數據.

這裡有了y值這個真實值這一列,有了輸入的初始的樣本m,yi = mi * xi m0 *x0 這裡就可以獲取到

一組w,這裡一組w,就是m其實就是,但是m是初始的樣本值,w是求出的模型,也就是我們說權重,然後

這裡mi 和 xi 都值得是一組數據這個要清楚,然後,有了這個w以後,我們就可以帶入新的xi,也就是一組x 的值,然後去求出預測值y.得到預測值yi.

多元線性回歸計算過程(理解回歸多元線性回歸)11

多元線性回歸計算過程(理解回歸多元線性回歸)12

​編輯

然後我們再來看,我們的公式,y = se ta T* X 或者寫成 = WT *X ,這裡的

w指的是一個m行一列的數據,同樣x是m行 n列的數據,得到的是一個y 這個預測值,是

m行 一列的預測值,然後和m行 一列的真實的Y 去減去然後獲得絕對值,得到一個,m行 一列的

誤差列 e bu se lo.

多元線性回歸計算過程(理解回歸多元線性回歸)13

多元線性回歸計算過程(理解回歸多元線性回歸)14

​編輯

然後其實我們這裡要做的就是,要把現有的得到這個e bu se lo 這個列,拿到,然後

把拿到的值進行 平方,然後加起來,∑,然後再去除以 m的 行數 ,也就是我們輸入的樣本數量,得到

平均值,這個值就是截距...就是挨着線性最近的那個誤差值.通過我們不斷得到w權重,帶入,得到

不同的這個值,獲取最小的這個值,對應的一組w就可以了.我們找到就是這一組w.權重.也叫模型.

多元線性回歸計算過程(理解回歸多元線性回歸)15

多元線性回歸計算過程(理解回歸多元線性回歸)16

​編輯

首先我們看,這裡數據首先是包含,x,y的數據,然後,得到的值,y如果是連續的那麼我們需要處理的是,回歸問題,

如果y是離散的,我們需要解決的是分類問題.

多元線性回歸計算過程(理解回歸多元線性回歸)17

多元線性回歸計算過程(理解回歸多元線性回歸)18

​編輯

之前也說過這個案例了,這裡要說的就是,自然規律,高斯分布,我們要做的就是,找到貼近高斯分布,也就是正态分布的,這個權重w.

多元線性回歸計算過程(理解回歸多元線性回歸)19

多元線性回歸計算過程(理解回歸多元線性回歸)20

​編輯

然後我們再來看,這裡,有個最大似然估計,這個是什麼意思,最大似然估計是一種統計方法,它用來求一個樣本的相關概率密度函數的參數,也就是說,對于我們的數據集,我們可能會有很多個正太分布,

那麼我們要找到,符合我們數據集的是哪一個正太分布,這個時候我們就需要用到這個,最大似然估計.

因為我們知道,如果我們找到了一個正态分布的密度函數,我們要獲取密度最大的,也就是相關性最大的這個正太分布.

舉個例子,我們有兩個正太分布,一個是踢足球的人員的正态分布,可以看到上面左邊的那個,這個正太分布,身高可以看到,範圍廣一些,1.6到1.9 是,另一個是打籃球人的正太分布,可以看到這個身高是1.8到2.26 ,這個正太分布就比較的高,比較廋對吧,也就是大部分數據,都集中在u均值的左右了...數據密集.所以如果有一個人是1.7,或者1.8 ,那麼我們通過最大似然估計,能得到,第一個正太分布,比較符合規律,我們就把這個人放到第一個正太分布裡.

實際上,我們說,如果我們有一個u值,也就是均值,并且我們還有一個 标準差,這個标準差表示的是數據的離散程度,或者說方差是表示離散程度,方差越大,那麼正太分布越扁平,離散程度高,越小離散程度越小.

方差是實際值與期望值之差平方的平均值,而标準差是方差平方根。标準差,也稱均方差,是各數據偏離平均數的距離的平均數,它是離均差平方和平均後的方根,用σ表示。标準差是方差的算術平方根。标準差能反映一個數據集的離散程度.

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
審計工作底稿和保管期限(審計工作底稿的組成要素及歸檔期限)
審計工作底稿和保管期限(審計工作底稿的組成要素及歸檔期限)
  審計工作底稿指審計人員對制定的審計計劃、實施的審計程序、獲取的相關審計證據,以及得出的審計結論做出的記錄。   審計工作底稿可以以紙質、電子或其他介質形式存在。   審計工作底稿通常包括總體審計策略、具體審計計劃、分析表、問題備忘錄、重大事項概要、詢證函回函、管理層聲明書、核對表、有關重大事項的往來信件(包括電子郵件),以及對被審計單位文件記錄的摘要或複...
2025-04-02
焦作雲台山工作人員(雲台山人張甜甜)
焦作雲台山工作人員(雲台山人張甜甜)
  她叫張甜甜   在講解員的崗位上已默默工作了10年   用真誠的服務感動每一位遊客   讓我們來看看她的日常......      迎着朝陽起床洗漱,把宿舍整理幹淨   畫個美美的淡妝            和同事們一起吃早餐,元氣滿滿         一日之計在于晨,開始一天的工作               檢查話筒音響、安全帶、車内巡視      ...
2025-04-02
江美儀說的降頭是誰(同盟被爆出幕後大老闆不是江美儀)
江美儀說的降頭是誰(同盟被爆出幕後大老闆不是江美儀)
  昨天最新一集《同盟》播出,幕後大boss露面,是由江美儀飾演的今天,然而有人爆出大boss竟是另有其人!你覺得究竟是誰呢?      有人說是易先生。這個猜測并不是沒有道理,畢竟保護令小姐多年,令小姐的一切他都最清楚。      羅樂林你們覺得可能性大嗎,反正他一出場我第一感覺是他。但是他除了操控警局,好像沒有操控媒體和廉政署的權利了吧!      也有...
2025-04-02
遊戲主播電競選手雙男主文(原耽推文:主播撿到一隻電競大神然後主播就去打職業了)
遊戲主播電競選手雙男主文(原耽推文:主播撿到一隻電競大神然後主播就去打職業了)
  啦啦啦,小女又來啦!!!   親愛的小仙女們,歡迎來到小女的小小天地,小女,一個小甜文愛好者,緻力于看遍好看的小說,把自己看到的好看的推薦給小仙女們,人送外号“人肉排雷機”(其實是自封的)。   喜歡小女這種負責任分享小說,不用等着别人排雷的小仙女可以關注小女呀,每天都有小說看!不用放屁股等踢啦!   ——————☞☜——————      《撿到一隻電...
2025-04-02
魯迅每月300大洋相當于現在多少錢(魯迅每月的工資是350塊大洋)
魯迅每月300大洋相當于現在多少錢(魯迅每月的工資是350塊大洋)
  對于一份工作的好壞,人們最關心的往往是工資,然後才是工作環境、晉升途徑、企業文化等,這也就是為什麼一些互聯網企業推行殘酷的996制度,但還是被很多人趨之若鹜,高工資是這些企業吸引優秀求職者的重要方式。民國時期,高校教師也是一個非常受人歡迎的職業,主要原因是人們普遍尊重教師,并給予了他們很高的待遇。   人們很推崇的思想家、文學家和教師魯迅,他當時的工資是...
2025-04-02
Copyright 2023-2025 - www.tftnews.com All Rights Reserved