然後我們再來看一下,對于之前我們說的,一元一次方程來說,在我們的現實世界中,往往是不能适用的,因為隻考慮一個因素的話,那麼太簡單了,所以我們需要,考慮多個因素,這裡就需要
多元一次方程.這個元就是多個維度,考慮多個因素的意思.
編輯
可以看到,多元線性回歸,其實就是上面寫的
y = w1*x1 ....wn * xn w0
編輯
然後這裡要注意,其實這個w0 可以寫成w0*x0,我們假設x0是1
y = w1*x1 ....wn * xn w0 * x0 就寫成了這樣
編輯
然後這個我們看到其實就是一個,行和列的計算,如果我們把w1...wn寫成行,然後把x0...xn寫成列,那麼上面我們寫的那個:y = w1*x1 ....wn * xn w0 * x0 實際上就是行列的,相乘
也可以寫成 y =wT* x 這樣寫,在數學中叫做transpose,轉置函數,也叫轉換函數,轉換成行列相乘函數.這裡wT指的就是w0到wn,然後x指的就是x0到xn,然後還可以簡寫成:y = seita T * X
這裡seita 符号我又不會打了. y = θ^T * X 這裡的T,也不是這樣寫的,也不是T次方的意思,這裡表示對W,或者說是對θ 進行轉置,因為T是轉置函數,
編輯
然後我們繼續來看這裡,對于上圖中,左邊的m來說,表示輸入的樣本,所謂的樣本,就是很多的數據,曆史數據,這裡yi表示,第m個樣本的,第i個結果,這裡的yi,表示的是真實的結果.并不是我們之前說的那個yhat y估計,是真實值.這裡要知道y是一列的,然後x是什麼呢?x不是行業不是列,x是一個,行列的矩陣,表示的是,m * x,這樣的行列矩陣,然後如果我們寫一個xi,那麼這個xi,表示,裡面的某一行,也就是針對某個m樣本的,某個x0到xn ,這裡的xi指的就是某個x0到xn.
然後上面我們寫的公式y = W^t * X 這裡是小寫的y,表示預測值,就是yhat ,然後t表示轉置,可以看到,右邊是e bu se lo ε ,這個值,我們就可以用,大寫的Y 也就是輸入的真實的Y值,然後 減去- y小寫的y,去絕對值,就得到了誤差ε了.
然後我們再看上面的值,那個be ta beta(大寫Β,小寫β,中文音譯:貝塔 ) ,這個其實用w來表示,會更專業,w0到wn,這裡用大寫的W,表示權重,為什麼用大寫的W表示,因為:
編輯
可以看到,這裡y = w1*x1 w2*x2 ....wn*xn w0 *x0..
可以看到這裡W越大,表示權重越大對結果的影響越大對吧.所以w也是重要程度,影響程度這樣.
然後我們再來看,這裡m指的是樣本,那麼m *x0 ...xn,其實就是,y列,其實就是y = m *x 這樣一個矩陣,
那麼就是m *x (也就是y 這一個列)= 那麼m行 * n列(這裡m和x都表示一組數據) 這個行列矩陣 * 要乘以 ,注意這裡需要再理解一下,這裡的m0到mn個樣本, * x0 到xn,這裡整個的這部分合起來,可以理解成,我們之前的那個一元一次方程裡的x,然後,這個行列的矩陣,要乘以一個n行 一列的w0的數據,也就是權重數據,才能得到 y這個預測值.所以,這裡我們說的w,每個w都表示w0到wn,是一個一列n行的數據,一組數據.
這裡有了y值這個真實值這一列,有了輸入的初始的樣本m,yi = mi * xi m0 *x0 這裡就可以獲取到
一組w,這裡一組w,就是m其實就是,但是m是初始的樣本值,w是求出的模型,也就是我們說權重,然後
這裡mi 和 xi 都值得是一組數據這個要清楚,然後,有了這個w以後,我們就可以帶入新的xi,也就是一組x 的值,然後去求出預測值y.得到預測值yi.
編輯
然後我們再來看,我們的公式,y = se ta T* X 或者寫成 = WT *X ,這裡的
w指的是一個m行一列的數據,同樣x是m行 n列的數據,得到的是一個y 這個預測值,是
m行 一列的預測值,然後和m行 一列的真實的Y 去減去然後獲得絕對值,得到一個,m行 一列的
誤差列 e bu se lo.
編輯
然後其實我們這裡要做的就是,要把現有的得到這個e bu se lo 這個列,拿到,然後
把拿到的值進行 平方,然後加起來,∑,然後再去除以 m的 行數 ,也就是我們輸入的樣本數量,得到
平均值,這個值就是截距...就是挨着線性最近的那個誤差值.通過我們不斷得到w權重,帶入,得到
不同的這個值,獲取最小的這個值,對應的一組w就可以了.我們找到就是這一組w.權重.也叫模型.
編輯
首先我們看,這裡數據首先是包含,x,y的數據,然後,得到的值,y如果是連續的那麼我們需要處理的是,回歸問題,
如果y是離散的,我們需要解決的是分類問題.
編輯
之前也說過這個案例了,這裡要說的就是,自然規律,高斯分布,我們要做的就是,找到貼近高斯分布,也就是正态分布的,這個權重w.
編輯
然後我們再來看,這裡,有個最大似然估計,這個是什麼意思,最大似然估計是一種統計方法,它用來求一個樣本的相關概率密度函數的參數,也就是說,對于我們的數據集,我們可能會有很多個正太分布,
那麼我們要找到,符合我們數據集的是哪一個正太分布,這個時候我們就需要用到這個,最大似然估計.
因為我們知道,如果我們找到了一個正态分布的密度函數,我們要獲取密度最大的,也就是相關性最大的這個正太分布.
舉個例子,我們有兩個正太分布,一個是踢足球的人員的正态分布,可以看到上面左邊的那個,這個正太分布,身高可以看到,範圍廣一些,1.6到1.9 是,另一個是打籃球人的正太分布,可以看到這個身高是1.8到2.26 ,這個正太分布就比較的高,比較廋對吧,也就是大部分數據,都集中在u均值的左右了...數據密集.所以如果有一個人是1.7,或者1.8 ,那麼我們通過最大似然估計,能得到,第一個正太分布,比較符合規律,我們就把這個人放到第一個正太分布裡.
實際上,我們說,如果我們有一個u值,也就是均值,并且我們還有一個 标準差,這個标準差表示的是數據的離散程度,或者說方差是表示離散程度,方差越大,那麼正太分布越扁平,離散程度高,越小離散程度越小.
方差是實際值與期望值之差平方的平均值,而标準差是方差平方根。标準差,也稱均方差,是各數據偏離平均數的距離的平均數,它是離均差平方和平均後的方根,用σ表示。标準差是方差的算術平方根。标準差能反映一個數據集的離散程度.
,