首页
/
每日頭條
/
科技
/
如何為機器學習選擇最佳顯卡
如何為機器學習選擇最佳顯卡
更新时间:2024-07-28 18:07:49

#頭号周刊#

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)1

在處理機器學習時,特别是在處理深度學習和神經網絡時,最好使用顯卡來處理,而不是CPU。在神經網絡方面,即使是低端的GPU也會勝過CPU。

但是你應該買哪種GPU呢?有很多種選擇,本文将盡量考慮各種相關因素,以便您可以根據您的預算和特定的建模要求做出合适的選擇。

為什麼 GPU 比 CPU 更适合機器學習?

CPU(中央處理器)是計算機的主力,重要的是它非常靈活。它可以處理來自各種程序和硬件的指令,而且處理速度非常快。為了在這種多任務環境中表現出色,CPU 具有少量靈活且快速地處理單元(也稱為内核)。

GPU(圖形處理器)更加專業,在多任務處理方面沒有那麼靈活。它旨在并行執行大量複雜的數學計算,從而提高吞吐量。這是通過擁有更多數量的更簡單的核心來實現的,有時是數千個,這樣就可以一次處理許多計算。

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)2

并行執行多個計算的要求非常适合以下情況:

  • 圖形渲染——移動的圖形對象需要不斷計算其軌迹,這需要大量不斷重複的并行數學計算。
  • 機器和深度學習——大量的矩陣/張量計算,可以通過 GPU 并行處理。
  • 可以拆分為并行運行的任何類型的數學計算。

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)3

張量處理單元 (TPU)

随着人工智能和機器/深度學習的蓬勃發展,現在甚至出現了更專門的處理核,稱為張量核心。當執行張量/矩陣計算時,它們更快更有效。這正是機器/深度學習所涉及的數學類型所需要的。

盡管有專用的TPU,但一些最新的GPU也包括許多張量核心,您将在本文後面看到這一點。

Nvidia與AMD

答案肯定是:英偉達(Nvidia)

你可以使用AMD的GPU進行機器/深度學習,但Nvidia的GPU具有更高的兼容性,并且通常還可以更好地集成到TensorFlow和PyTorch等工具中。

如果嘗試使用一個帶有TensorFlow的AMD GPU需要使用額外的工具(ROCm),這往往有點繁瑣,有時還隻能使用不太最新的TensorFlow/PyTorch版本。

這種情況可能會在未來有所改善,但如果你想要一個好的體驗,最好堅持使用Nvidia。

GPU特性

選擇一個适合你預算的GPU,同時也能夠完成你想要的機器學習任務,基本上歸結為四個主要因素的平衡:

  1. GPU有多少RAM?
  2. GPU 有多少個CUDA或Tensor核心?
  3. 該卡使用什麼芯片架構?
  4. 您的功耗要求是什麼(如果有的話)?
顯卡内存

答案是,越多越好!

這實際上取決于你機器學習模型是什麼,以及這些模型有多大。例如,如果你正在處理圖像、視頻或音頻,那麼根據定義,你将處理大量的數據,而GPU RAM将是一個非常重要的考慮因素。當然也有辦法解決内存不足的問題(例如調整batch size)。

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)4

作為一般經驗法則,我建議如下:

4GB:隻要您不處理過于複雜的模型或大量圖像、視頻或音頻,這在大多數情況下都可以很好地工作。如

8GB:您可以在不達到 RAM 限制的情況下完成大多數任務,但是對于包含圖像、視頻或音頻的更複雜的模型,您會遇到問題。

12GB:我認為這是最佳的,您可以處理大多數較大的模型,包含處理圖像、視頻或音頻的模型。

12GB :越多越好,您将能夠處理更大的數據集和更大的batch sizes。然而,超過12GB則價格會很高。

一般來說,如果價格相同,最好選擇内存更大、速度更慢的卡。記住,GPU的優勢是高吞吐量,這在很大程度上依賴于可用的RAM來通過GPU提供數據。

CUDA核心和張量核心

實際上,應該首先考慮其他項,如RAM和芯片架構,然後再從選擇中查看CUDA/張量核心數量最高的顯卡。

對于機器/深度學習,張量核心比CUDA核心更好(更快、更有效)。這是因為它們是為機器/深度學習領域所需的計算而精确設計的。

事實上,CUDA核的速度已經足夠快了。如果你能得到一張包含張量核心的卡片,這是一個很好的加分點,隻是不要太糾結于它。

總結一下:

  • CUDA核心:這些是顯卡上的物理處理器,通常有數千個。
  • CUDA 11: 數字可能會發生變化,但這是指為使顯卡工作而安裝的軟件/驅動程序。定期發布新版本,它可以像任何其他軟件一樣安裝。
  • CUDA generation (or compute capability):這描述了顯卡的能力。這在硬件中是固定的,因此隻能通過升級到新卡來更改。它以數字和代号區分。示例:3.x [Kepler]、5.x [Maxwell]、6.x [Pascal]、7.x [Turing] 和 8.x [Ampere]。
芯片架構

這實際上比你想象的更重要。正如我之前提到的,我們基本上已經抛棄了AMD,我們隻能選擇英偉達。

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)5

最主要的是要注意芯片組的“Compute Capability(計算能力)”,有時被稱為“CUDA generation”。這對每張卡都是固定的,所以一旦你買了這張卡,你就隻能使用這張卡的計算能力了。

如果您的GPU具有 7.x (Turing) 或更高的計算能力,則可以使用混合精度訓練。這基本上是 RTX 20 系列或更新版本,或者是服務器上的 RTX、“T”或“A”系列。

在考慮使用新顯卡時,混合精度訓練如此具有優勢的主要原因是它降低了 RAM 使用率,因此通過使用稍新的顯卡,您的 RAM 需求會降低。

如果您的RAM要求特别高,但沒有足夠的錢購買高端卡,那麼您可能會在二手市場上選擇較舊型号的GPU。

一個典型的例子是 Tesla K80,它有4992 個CUDA核心和24GB 的 RAM。它最初在 2014 年的零售價約為7000.00美元。目前也就3000RMB左右。

但是,有一個相當大的缺點。K80 的計算能力為 3.7 (Kepler),從 CUDA 11 起已棄用(當前的 CUDA 版本為 11)。這意味着該卡無法在未來版本的 CUDA 驅動程序中使用。

消費顯卡與專業顯卡

Nvidia基本上把他們的分成兩部分。一種是消費類顯卡,另一種是針對工作站/服務器的顯卡(即專業顯卡)。

這兩個部分之間有明顯的區别,但需要記住的是,在相同規格(RAM、CUDA核心、架構)下,消費顯卡通常會更便宜,專業卡一般會有更好的質量和較低的功耗。

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)6

對于高端專業卡,你會注意到它們有很多RAM(例如RTX A6000有48GB, A100有80GB),這是因為它們通常直接針對3D建模、渲染和機器學習/深度學習專業市場,這些市場需要大的RAM。

總而言之,普通學習可以選擇消費類顯卡,畢竟價格便宜也好購買。

推薦

請記住,如果你真的有很高的預算,你應該看看專業卡系列,比如 Nvidia A系列卡,它的成本可能高達數千美元。

低預算

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)7

中等預算

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)8

高預算

如何為機器學習選擇最佳顯卡(如何為機器學習選擇最佳顯卡)9

其他

如果你覺得買顯卡不适合你,你可以使用GPU雲服務器(騰訊、阿裡等均提供)。

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
如何取消文檔保護密碼
如何取消文檔保護密碼
演示機型:華為MateBookX系統版本:win10APP版本:word20161、雙擊需要取消加密的Word文檔,打開該文檔。2、在彈出的密碼輸入框中輸入加密文檔的密碼,點擊确定進入該文檔界面。3、點擊文檔上方工具欄中的安全選項,進入安全設置頁面。4、在菜單欄中選擇文檔加密選項,進入密碼設置界面。5、選擇彈出對話框左側的密碼加密選項,進入密碼設置界面。6、在密碼設置界面将打開權限下方的三個對話框
2024-07-28
如何給孩子介紹常見恐龍
如何給孩子介紹常見恐龍
第一、霸王龍,這是所有恐龍中體型最大的,而且也是攻擊力最高的一種恐龍,要告訴孩子雖然霸王龍很強大,但是要學會與其它恐龍的和平相處。第二、三角龍,這是體重比較大的一種恐龍,而且三角龍是一種食草的恐龍,要讓孩子知道,雖然三角龍看着比較兇猛,但是實際上是比較溫順的。第三、翼龍,這是所有恐龍中唯一會飛的恐龍,而且體型相對于其它恐龍比較小巧,嘴型和鳥類相似,要讓孩子知道恐龍并不是隻在地面。第四、包頭龍,這種
2024-07-28
oppor9s跟oppor9sk有什麼區别
oppor9s跟oppor9sk有什麼區别
1、區别是外觀設計功能等方面不同。R9sk采用JDI屏,R9s采用AMOLED屏,JDI屏具有透光性好、色彩還原真實。屏幕顯示更加清晰。R9是前置1600萬像素,後置1300萬像素R9s的處理器是高通625,R9的是聯發科p10的處理器,R9s是固版态指紋解鎖,R9是物理按壓。2、供應鍊對R9s單款屏幕供應數量有限,因此在這款手機上,OPPO精選采用了AMOLED屏和JDI屏兩款屏幕。采用JDI屏
2024-07-28
微頭條怎麼發視頻
微頭條怎麼發視頻
1、在我們的手機裡面打開軟件,點擊登錄進去。2、進去之後,點擊中間的+”。3、點擊彈出框之後,選擇視頻”。4、進去之後,選擇導入視頻,也可以直接錄視頻。5、選擇要導入的視頻,點擊發布。
2024-07-28
筏釣鲫魚技巧
筏釣鲫魚技巧
1、釣具的基本配置。在筏釣中,我們通常會使用1.6米到2.4米的筏竿。總的來說,筏釣對釣竿的要求并不高,唯一需要注意一下的是竿稍的質量必須過硬,因為筏竿的竿稍上有大量導線環,容易對竿稍産生磨損,如果竿稍質量差,就會出現斷竿的危險。2、在水庫釣鲫魚時,我們一般會使用蚯蚓餌、紅蟲餌等活餌,而活餌在上鈎時需要注意一些技巧。3、用筏竿釣魚最大的優勢,就是可以主動搜索魚群,而非被動等待魚上鈎,這也是讓衆多釣
2024-07-28
Copyright 2023-2024 - www.tftnews.com All Rights Reserved