首页
/
每日頭條
/
寵物
/
機器學習其實就是數學嗎
機器學習其實就是數學嗎
更新时间:2024-08-31 14:18:32

科學無國界

我們是知識的搬運工

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)1

福利時間

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)2

今天我們将送出三本由圖靈新知提供的優質科普書籍《生命是什麼》

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)3

《生命是什麼》是浙江大學教授、科普作家、“文津圖書獎”“吳大猷金獎”“菠蘿化學獎”““全球華語科幻星雲獎 ”得主王立銘最新科普力作。本書通過生動的文筆和有趣有料的生物學故事,揭開了生命科學神秘的面紗,不僅生動地解讀了生命的定義及奧秘,而且詳細地追溯了生命的起源和演化,展現了人類探索生命奧秘的偉大曆程,講述了科學家在揭示生命奧秘過程中的重要發現。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)4

隻要你認真閱讀下面的這篇文章,思考文末提出的問題,嚴格按照 互動:你的答案 的格式在評論區留言,就有機會獲得獎品!

作者: Chris Budd

翻譯:Aprilis

審校:Nothing

最近人工智能方面最重要的發展之一就是機器學習了。它主要着眼于智能,而不是傳統計算機程序意義上指定機器做什麼東西,也就是說機器自己可以學習,這樣它就可以直接從經驗(或者數據)中學會如何處理複雜的任務。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)5

即使是很簡單的機器學習算法也能區分照片上的貓和狗

伴随着計算機速度的提高和算法的進步,機器學習的發展也非常迅速。從中衍生的算法已經對我們的生活造成了深刻的影響,而且有時候比人類做得更好。那麼問題來了,機器學習到底是如何工作的?

從經驗中學

在一個機器學習系統中,計算機通過自己給自己編代碼來完成一個任務,它一般是由基于這個任務的大量的數據來訓練的。其中很大一部分涉及識别這些任務中的模式,然後根據這些模式做出決策。舉一個(有點吓人)的例子,假設你的公司想要招聘一個新員工。你做了廣告,然後有1000個人想來應聘,他們每個人都發了一份簡曆。你需要篩選這些簡曆,但是1000份簡曆也太多了吧,所以你就想訓練一個機器來做這件事。 為了保證這件事有一定的可行性,假設你有以前招聘時收到的簡曆。每一份簡曆都有被錄用或沒有被錄用的記錄。你把這些簡曆的一半用來訓練機器,讓它發現這些簡曆是否被成功錄用的模式。因此,如果你給機器一份簡曆,它就能知道這份簡曆是否可以被錄用。訓練完機器,你用另一半的簡曆來做測試。假設成功率很高,你就會相信機器可以勝任篩選簡曆的工作了。在上述的每一個階段,都沒有人的幹預。這樣的一個過程,以現在的計算機的能力是完全可以做到的。

基本要點

為了讓機器學習的過程更加透明化,我們用開發可識别手寫數字的機器的非常具體的例子來考慮模式識别的問題。這樣的機器應該能夠做到:不管一個手寫的數字寫得怎麼樣,它都能識别出來。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)6

即使對人類來說,手寫的數字都能難得像密文一樣

數字識别有兩個階段。首先,我們把圖像掃描進機器,然後從數字圖像中提取重要的數據信息。這通常使用主成分分析(PCA)的統計方法,它可以自動提取一個圖像的主要特征,比如高度和寬度,再比如圖像中的交叉的點的個數,等等。這個過程與找一個矩陣的特征值和特征向量緊密相關,和谷歌用于在網絡上搜索信息的過程也很像。

第二,我們要訓練機器利用這些提取的信息來學習辨别數字。完成這個過程的一個很普遍的方法就是神經網絡。這個技術基于我們對大腦如何工作的認識。第一步是,創造大量的“神經元”并把它們互相連接。這些神經元可以互相發送信息。第二步,讓神經網絡去求解大量的結果已知的問題。通過這個過程,它就“學會”了神經元之間應該如何連接,所以它就能成功地識别數據中哪些模式可以産生正确的結果。

這種神經網絡的早期例子是稱為感知器的單層系統,它可以模拟單個神經元。 感知器的概念是Frank Rosenblatt在1962年提出的。感知器的典型結構如下所示。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)7

感知器有n個輸入,從X1,X2到Xn,每個輸入都乘以一個權重因子Wi再相加,和為

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)8

如果這個結果比某個臨界值C大,就返回1,否則,就返回0。

就是說,當

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)9

就返回1,而

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)10

就返回0。

在我們的例子中,Xi就是提取的圖像的特征,決策就是 這個數字是3還是4。訓練感知器的過程包括找到合适的權重因子wi和臨界值C使得感知器識别到正确的數字。要做到這一點,需要謹慎使用基于統計的數學優化算法。

一個例子

舉個例子,設想我們隻從圖像中提取兩個特征X1,X2,X1可以是圖像中直線的數目,X2是圖像中交叉點的數目。每個手寫的數字3和4都有這兩個值,這樣就可以在坐标中表示出來。由于數字“3”中沒有直線也沒有交叉的點,所以就可能對應接近坐标(0,0)的點。而數字“4”中有三條直線和一個交叉的點,所以它在坐标中對應(3,1)附近的點。 這樣一來,感知器中計算的和就是

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)11

對一個給定的w1,w2和C,令方程等于0就決定了一條直線l。如果,使用圖像來訓練機器,感知器設法找到w1,w2和C的值使得l可以把3和4對應的點全部分開,如下圖所示,這樣它就可以有很大概率可以正确識别一個新的圖像中的數字是3還是4。如果存在這樣的一條直線l,這樣的數據就叫做線性可區分。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)12

設想紅色的點來自圖像中的數字“3”,藍色的點來自數字“4”。如果算法使用C=2, X1=X2=1,這樣加權和等于0對應的直線如圖所示。對于藍色的點來說,它對應的加權和大于0,對于紅色的點來說,其對應的加權和小于0,所以算法總能給出正确的結果。

如果數據點不能被一條直線分開——如果數據不是線性可區分的——你可以在更高的維度上做這件事并希望在更高的維度上它們是線性可區分的。一個非常簡單的例子,你可以把點畫到屏幕以外的地方,畫在三維的空間中。當然了,實際上通常都會使用更複雜的辦法。另外,如果你從圖像中提取的特征不隻是兩個,也可以在更高的維度上使用相同的辦法。 感知器的方法在區分貓和狗方面也适用。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)13

這些圖演示了随着可獲得的數據的增加,算法如何更新直線的選擇(也就是,常數C和W1,W2

神經網絡和深度學習

簡單的感知器可以被訓練做很多簡單的任務,但很快就達到它的極限了。很明顯,通過将許多感知器耦合在一起可以實現更多,但這種發展必須等待更強大的計算機的出現。 當感知層連接在一起産生神經網絡時,取得了重大突破。 這種神經網絡的典型結構如下所示。 在這種情況下,輸入組合以觸發第一層感知器。 這些輸出組合起來觸發下一層,最後這些組合起來給出輸出。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)14

層數越多,就可以擁有“更深層次”的網絡。 然後通過為上面的每個連接分配權重來訓練這樣的網絡。 這個過程有點類似于大腦加強或減弱神經通路的方式。 深度學習描述了訓練這種神經網絡的過程。

由于新的數學優化算法的發展,結合廣泛的(谷歌的DeepMind更廣泛)計算機能力,現在已經可以做到。 在為網絡找到合适的權重Wi的過程結束時,你會有一個黑盒子,它可以非常快速地運行并且可以做決策。

不同的方法

現在我們再來關注學習過程的更多細節。對于一個神經網絡來說有很多不同類型。 在有監管學習中,由網絡的使用者預先提供一組示例輸入和輸出對。然後,學習方法要找到一個神經網絡,該網絡提供與示例匹配的輸出。将神經網絡的輸出與示例的輸出進行比較的常用方法是找出正确輸出和實際輸出之間的均方誤差。然後訓練網絡以使該誤差最小化。它的一個非常标準的應用是在統計學中的曲線拟合,但它也同樣适用于手寫識别和其他模式識别問題。 在強化學習中,數據不是由用戶預先給出的,而是由神經網絡控制的機器與環境的相互作用及時産生的。在每個時間點,機器對環境執行動作,該動作産生觀察以及該動作的成本。訓練網絡使它可以選擇最小化總成本的動作。在許多方面,這個過程類似于人類(尤其是幼兒)的學習方式。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)15

為了學習下象棋,alpha zero 和自己下了700000局

近年來,機器學習的數學算法取得了很大進展。 卷積神經網絡(CNN)是這些方法的一個令人興奮的新的擴展,同時它也非常重要。它将圖像處理技術與深度神經網絡相結合。 它們可用于人臉識别,甚至可用于檢測情緒。 它們現在被用于許多其他應用,包括醫學診斷。 為了學習如何順利下棋,AlphaZero使用了深度卷積神經網絡。 這是使用強化方法訓練的,機器與自己進行了700,000場比賽,時間超過24小時。 通用蒙特卡羅樹搜索(MCTS)算法用于分配權重。 在學習如何玩将棋和圍棋時,也使用了類似的方法,并且在每種情況下都達到了相同的水平。令人印象深刻! 随着更快的訓練算法和越來越多的數據的推動,誕生了更複雜、更深層次的網絡,這讓機器學習進展迅猛。 但讓機器去做可能改變生命的決定(例如醫療診斷)是否安全而且符合倫理道德?

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)16

互動問題

【互動問題:讓機器去做可能改變生命的決定(例如醫療診斷)是否安全而且符合倫理道德?】

請大家嚴格按照 互動:問題答案的格式在評論區留言參與互動,格式不符合要求者無效。

截止到本周四中午12點,精選留言點贊數前三名的朋友将獲得我們送出的圖書一本。

機器學習其實就是數學嗎(機器學習是如何區分貓和狗的)17

編輯:loulou

近期熱門文章Top10

↓ 點擊标題即可查看 ↓

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
布偶貓為什麼突然打噴嚏不停
布偶貓為什麼突然打噴嚏不停
貓打噴嚏的原因有很多,可能是因為粉塵、灰塵、小飛蟲進入鼻子或者過敏等,所以貓咪打噴嚏不一定是因為感冒,如果貓咪打噴嚏後還出現咳嗽、流鼻涕、流淚等症狀,那麼貓咪可能是感冒了。下面和爪爪博士一起來看看吧。不是。貓打噴嚏的原因有很多,常見的就包括...
2024-08-31
給貓貓洗澡水弄到了眼睛裡
給貓貓洗澡水弄到了眼睛裡
給貓貓洗澡水弄到了眼睛裡?給貓貓洗澡,水弄到眼睛裡不用太擔心,因為一般情況下弄到眼裡水或者是其他東西,眼睛會刺激出現淚液分泌,然後把進入眼内的東西沖洗出來,水或者淚液會通過淚小點的虹吸作用進入鼻淚管流入鼻腔,不會出現其他問題的,接下來我們就...
2024-08-31
怎樣設置自己的光貓變成橋接模式
怎樣設置自己的光貓變成橋接模式
今天我們來聊聊到底要不要把光貓改成橋接模式,運營商送的光貓有兩種模式,一種是路由模式,一種是橋接模式。對于家庭用戶來說到底改那種模式呢?兩種模式有何區别呢?以及如何設置?如果你不了解的話可以先點贊收藏,讀完之後你就明白了其中的緣由。目前家庭...
2024-08-31
逆天改命系列動漫
逆天改命系列動漫
自Z世代成為主流消費群體之後,各大汽車品牌都在想盡腦汁的出圈造勢,其中不乏拿車名來做文章的品牌。最明顯的一個例子就是,某自主品牌旗下的新車不是貓、就是狗,要不就是咖啡。相比之下,星途即将上市的新車-淩雲顯得更有韻味,有着中國漢字文化的風采。...
2024-08-31
雙11美妝大數據總結
雙11美妝大數據總結
一年一度的雙十一來襲,美妝品牌又開啟了一場馬拉松式的耐力長跑,還遠未到沖刺的終點,不少美妝品牌就以驚人的爆發力赢在了起點。行至第十三個年頭,雙十一早已從最初的“光棍節”,逐漸演變為深入人心的“全民狂歡購物節”,其遊戲規則也越來越多樣化、複雜...
2024-08-31
Copyright 2023-2024 - www.tftnews.com All Rights Reserved