GPU和CPU的區別

GPU CPU 圖像處理技術 linux內核學習 2018-12-10

看了好多，覺得下面這個介紹才是我想要的以及能看明白的，CPU和GPU的設計區別CPU和GPU之所以大不相同，是由於其設計目標的不同，它們分別針對了兩種不同的應用場景。CPU需要很強的通用性來處理各種不同的數據類型，同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常複雜。而GPU面對的則是類型高度統一的、相互無依賴的大規模數據和不需要被打斷的純淨的計算環境。

於是CPU和GPU就呈現出非常不同的架構（示意圖）：

圖片來自nVidia CUDA文檔。

其中綠色的是計算單元，橙紅色的是存儲單元，橙黃色的是控制單元。GPU採用了數量眾多的計算單元和超長的流水線，但只有非常簡單的控制邏輯並省去了Cache。而CPU不僅被Cache佔據了大量空間，而且還有有複雜的控制邏輯和諸多優化電路，相比之下計算能力只是CPU很小的一部分

從上圖可以看出：

Cache, local memory： CPU > GPU

Threads(線程數): GPU > CPU

Registers: GPU > CPU

多寄存器可以支持非常多的Thread,thread需要用到register,thread數目大，register也必須得跟著很大才行。SIMD Unit(單指令多數據流,以同步方式，在同一時間內執行同一條指令):

GPU > CPU。

CPU 基於低延時的設計：

CPU有強大的ALU（算術運算單元）,它可以在很少的時鐘週期內完成算術計算。當今的CPU可以達到64bit 雙精度。執行雙精度浮點源算的加法和乘法只需要1～3個時鐘週期。CPU的時鐘週期的頻率是非常高的，達到1.532～3gigahertz(千兆HZ, 10的9次方).大的緩存也可以降低延時。保存很多的數據放在緩存裡面，當需要訪問的這些數據，只要在之前訪問過的，如今直接在緩存裡面取即可。複雜的邏輯控制單元。當程序含有多個分支的時候，它通過提供分支預測的能力來降低延時。數據轉發。當一些指令依賴前面的指令結果時，數據轉發的邏輯控制單元決定這些指令在pipeline中的位置並且儘可能快的轉發一個指令的結果給後續的指令。這些動作需要很多的對比電路單元和轉發電路單元。

GPU是基於大的吞吐量設計。

GPU的特點是有很多的ALU和很少的cache. 緩存的目的不是保存後面需要訪問的數據的，這點和CPU不同，而是為thread提高服務的。如果有很多線程需要訪問同一個相同的數據，緩存會合並這些訪問，然後再去訪問dram（因為需要訪問的數據保存在dram中而不是cache裡面），獲取數據後cache會轉發這個數據給對應的線程，這個時候是數據轉發的角色。但是由於需要訪問dram，自然會帶來延時的問題。

GPU的控制單元（左邊黃色區域塊）可以把多個的訪問合併成少的訪問。

GPU的雖然有dram延時，卻有非常多的ALU和非常多的thread. 為啦平衡內存延時的問題，我們可以中充分利用多的ALU的特性達到一個非常大的吞吐量的效果。儘可能多的分配多的Threads.通常來看GPU ALU會有非常重的pipeline就是因為這樣。

所以與CPU擅長邏輯控制，串行的運算。和通用類型數據運算不同，GPU擅長的是大規模併發計算，這也正是密碼破解等所需要的。所以GPU除了圖像處理，也越來越多的參與到計算當中來。

GPU的工作大部分就是這樣，計算量大，但沒什麼技術含量，而且要重複很多很多次。就像你有個工作需要算幾億次一百以內加減乘除一樣，最好的辦法就是僱上幾十個小學生一起算，一人算一部分，反正這些計算也沒什麼技術含量，純粹體力活而已。而CPU就像老教授，積分微分都會算，就是工資高，一個老教授資頂二十個小學生，你要是富士康你僱哪個？GPU就是這樣，用很多簡單的計算單元去完成大量的計算任務，純粹的人海戰術。這種策略基於一個前提，就是小學生A和小學生B的工作沒有什麼依賴性，是互相獨立的。很多涉及到大量計算的問題基本都有這種特性，比如你說的破解密碼，挖礦和很多圖形學的計算。這些計算可以分解為多個相同的簡單小任務，每個任務就可以分給一個小學生去做。但還有一些任務涉及到“流”的問題。比如你去相親，雙方看著順眼才能繼續發展。總不能你這邊還沒見面呢，那邊找人把證都給領了。這種比較複雜的問題都是CPU來做的。

總而言之，CPU和GPU因為最初用來處理的任務就不同，所以設計上有不小的區別。而某些任務和GPU最初用來解決的問題比較相似，所以用GPU來算了。GPU的運算速度取決於僱了多少小學生，CPU的運算速度取決於請了多麼厲害的教授。教授處理複雜任務的能力是碾壓小學生的，但是對於沒那麼複雜的任務，還是頂不住人多。當然現在的GPU也能做一些稍微複雜的工作了，相當於升級成初中生高中生的水平。但還需要CPU來把數據喂到嘴邊才能開始幹活，究竟還是靠CPU來管的。

什麼類型的程序適合在GPU上運行？

（1）計算密集型的程序。所謂計算密集型(Compute-intensive)的程序，就是其大部分運行時間花在了寄存器運算上，寄存器的速度和處理器的速度相當，從寄存器讀寫數據幾乎沒有延時。可以做一下對比，讀內存的延遲大概是幾百個時鐘週期；讀硬盤的速度就不說了，即便是SSD, 也實在是太慢了。

（2）易於並行的程序。GPU其實是一種SIMD(Single Instruction Multiple Data)架構，他有成百上千個核，每一個核在同一時間最好能做同樣的事情。

簡言之，CPU就是全能型，而GPU就是暴力型；

相關推薦

'華為品牌、後置三攝、GPU加速，這款手機降價三百，真香'

"大家好，眾所周知，華為將在9.19日發佈Mate30系列手機了，對於“花粉”來說，又是一場盛宴。目前的華為，所有的先進科技優先用於P和Mate系列，所以被人們所熟知是理所當然的。而對於華為的低端手機，我們不是很熟悉了。今天作者在某東商城上看到，華為暢享9S正在搞促銷，15...

華為公司華為榮耀 GPU 原汁原味的德系SUV 華為Mate 技術中央處理器硬件耳機 2019-09-19

'手機運存真的越大越好嗎？4GB、6GB和8GB到底有什麼區別'

"在選機這件事情上，很多人都把目光集中在硬件配置上，覺得處理器越強勢越好，電池容量越大越好，手機像素越高越好。不可否認，強悍的硬件配置對體驗感有著至關重要的影響。01說到體驗感，手機運存的大小也會對其產生一定影響。可能在很多人的認知裡，手機運存越大越好，8GB肯定比6BG、...

一加手機越南硬件 Android GPU 中央處理器軟件 2019-09-18

'AMD的顯卡和CPU，這款掌機很任性，擁有手機的身材和電腦的性能'

" SMACH Z在TGS 2019（東京電玩展）帶來一款新的產品，是一款掌上游戲機，但不同於索尼的PSP和任天堂Switch。該掌機是完全將PC硬件融入到了掌機中，相比普通的PC產品可以說非常的輕便，而且主攻遊戲方面！新款的SMACH Z 將搭載AMD Ryzen E...

掌上游戲機超微半導體操作系統硬件中央處理器電子遊戲機眾籌任天堂索尼 Steam Windows 微軟 Linux ARM 電腦 Windows 10 電子遊戲東京電玩展 Android Xbox PlayStation Portable X86 GPU 獨立遊戲 2019-09-17

'PhotoShop吃CPU還是顯卡？PS對電腦配置的要求知識科普'

"Photoshop是Adobe公司旗下最為出名的圖像處理軟件之一，不過用戶認為Photoshop屬於製圖設計類，應該是以顯卡為主，將預算大頭都用來選擇一張好顯卡上，這樣做法是對還是錯呢？那麼PhotoShop吃CPU還是顯卡？下面裝機之家分享一下PS對電腦配置的要求知識科...

中央處理器 Photoshop 電腦固態硬盤軟件圖像處理硬件平面設計 Adobe Systems 設計英特爾 2019-09-17

'麒麟990 5G打造業界最強GPU'

" 手機芯片代表世界芯片的最高水平，因為它不僅需要強大的計算、存儲信息處理能力，同時還需要執行復雜的任務，需要整合各種功能，體積還得小，功耗還要低。這是目前人類芯片要求最複雜的芯片，手機芯片能做好，很大程度上，為做好一切芯片奠定了基礎。2019年9月6日，華為消費者業務CE...

我的第一部5G手機 GPU 智能手機華為手機華為公司人工智能中央處理器硬件軟件通信原汁原味的德系SUV 餘承東 IFA CES PowerPoint 2019-09-15

'iPhone7P手機刷機意外斷電，導致無法激活進系統，幸好不是CPU'

"接修客戶一臺iPhone7P，描述的故障是刷機過程中沒電關機了，重刷一直卡在百分之十九處。刷機之前可以正常使用，系統升級斷電之後出現的，電路應該沒問題，有可能是刷機意外斷電導致CPU底層數據出錯。拆下硬盤重寫底層，上電故障依舊，看來不是底層數據的問題。硬盤可以正常讀取，並...

中央處理器 GPU 蘋果公司 2019-09-14

'英特爾：GPU是公司第二重要的產品'

"來源：內容來自「快科技」，謝謝。提到Intel，大家都知道這是全球最大的高性能處理器公司，旗下有酷睿及至強等CPU品牌，佔據了全球80%以上的X86 CPU份額，在服務器CPU上的份額更是高達95%以上。這幾年中，Intel實際上也不是單純的CPU公司了，先後巨資收購了F...

英特爾 GPU 中央處理器英偉達 Xeon 超微半導體技術人生第一份工作雲計算 Altera Intel Core 驅動之家 X86 2019-09-12

'決定手機流暢度到底是看CPU還是運行內存，你知道麼？'

"自1876年電話發明以來，從最早的有線電話到無線手機，人類通訊史發生了翻天覆地的變化，而智能手機的到來更是改變了我們的生活，如今手機的功能愈發完善，用戶可以在手機上進行各種操作，甚至完成以前電腦上才能操作的工作，不僅如此，各種軟件、功能、遊戲等大型軟件的興起讓用戶對手機的...

中央處理器智能手機 iPhone 軟件 Android GPU 高通華為公司三星集團電腦人生第一份工作 2019-09-11

'詳解：華為麒麟980和驍龍845哪個好？麒麟980和970有什麼區別？'

"摘要：相信大家都知道，麒麟980是華為海思科技最新發布的旗艦處理器，採用7nm工藝製程，麒麟980和驍龍845哪個好？驍龍845處理器是一款10nm製程的處理器，與麒麟980處理器其實並不算同代，但是在驍龍855出來之前，肯定會將這兩款處理器進行對比的，還有麒麟980和9...

華為海思華為手機華為公司 GPU 人工智能中央處理器我的第一部5G手機技術 ARM 設計高通運營商通信文章 Android 讀書 2019-09-10

'華為麒麟990：首款7nm旗艦5G芯片比快更快，16核GPU笑傲江湖'

"【新智元導讀】剛剛，華為消費者BG CEO餘承東在2019德國IFA上揭曉了 “史上最強芯片” 麒麟 990 5G，這是業界首個集成了5G基帶的SoC商用芯片，集成103億晶體管，採用7nm+EUV工藝，毫無疑問是世界最強大的5G SoC！世界首個集成了5G基帶的SoC ...

我的第一部5G手機 GPU 華為公司技術餘承東人工智能中央處理器笑傲江湖硬件設計我想靜靜 IFA 三星集團原汁原味的德系SUV PowerPoint 單鏡頭反光相機高通通信 2019-09-09

'最良心千元機！紅米Note8與榮耀Play3區別，同999元差在哪？'

"新機的發佈一代接一代！回顧到去年6月，榮耀系首款主打遊戲性能的手機榮耀Play亮相，該機憑藉首發的GPU Turbo技術以及下放千元檔位的麒麟970，一經發布就獲得了不錯的市場反響。然而隨著時間的推移，榮耀4號連續帶來兩款新品分別是榮耀20S和榮耀Play3。本來以為新機...

紅米手機華為榮耀照相機 GPU 技術中央處理器我的第一部5G手機高通 2019-09-09

'國人驕傲！麒麟990發佈，真正的5G，16核GPU最強AI，馬上能買到'

"時隔一年，麒麟980在德國IFA國際電子消費展會上發佈期待已久的麒麟990，全球業內人士見證國產最強移動芯片的誕生，高通和三星獵戶座處理器對比，有多個參數領先，麒麟990問世，搭載990的產品也在不久就能買到。可能手機發布多了，連處理器也將有兩個版本：一個支持5G一個不支...

我的第一部5G手機 GPU 華為公司人工智能高通三星集團餘承東原汁原味的德系SUV 蘋果公司 IFA 2019-09-09

'5分鐘內看懂機器學習和深度學習的區別'

"在本文中，我們將研究深度學習和機器學習之間的差異。我們將逐一瞭解它們，然後討論他們在各個方面的不同之處。除了深度學習和機器學習的比較外，我們還將研究他們未來的趨勢和走向。深度學習 VS 機器學習深度學習與機器學習簡介一、什麼是機器學習？通常，為了實現人工智能，我們使用機器...

人工智能算法自然語言處理技術信息檢索 GPU 人生第一份工作市場營銷隨機森林 2019-09-09

'從4核到6核再到8核5GHz 酷睿九代CPU能效有什麼變化？'

"筆記本電腦應該考慮續航嗎？提到這個問題，筆記本玩家可能要分裂了，面向商務市場的筆記本顯然會把續航作為第二甚至第一選擇，至少也要支撐8小時工作時間，還得輕薄、便攜，這又進一步壓縮了電池空間。遊戲本玩家似乎不太注重續航，即便很多遊戲本空間夠大，可以塞入更大的電池，但是沒有幾款...

Intel Core 中央處理器筆記本電腦電腦英特爾技術 GPU 設計臺式電腦 2019-09-07

'顯示器sRGB，AdobeRGB，NTSC，DCI-P3色域有什麼區別。科普貼'

"本文由什麼值得買用戶原創：測評薈首先來說一下什麼是色域：色域是對一種顏色進行編碼的方法，也指一個技術系統能夠產生的顏色的總和。簡單來說就是在色彩中能覆蓋到的面積。色域又被稱作“色彩空間”（英文名：colorspace），之所以大多數人都說色域而不說色彩空間是因為“域”是...

Adobe Systems Photoshop 軟件電腦操作系統最in買手君圖像處理彩通工程師惠普公司平面設計數學技術英特爾 2019-09-06

'格芯起訴臺積電侵犯16項專利，蘋果處理器英偉達GPU等均涉及其中'

"8月27日消息，據外媒報道，全球第二大晶圓代工大廠商格芯(GlobalFoundries)已對全球第一大晶圓代工廠臺積電(TSMC)提起了專利侵權訴訟，指控臺積電生產的芯片侵犯了其在美國和德國持有的16項專利。當地時間週一，格芯在美國華盛頓向ITC提起專利侵權訴訟，並在美...

臺灣積體電路製造公司英偉達 GPU 技術超微半導體 iPhone 安森美成都蘋果公司原汁原味的德系SUV 跳槽那些事兒 Google 格羅方德知識產權聯想集團智能手機投資 2019-09-04

'中國首款車規級自動駕駛芯片發佈：全面開放、算力超GPU 10倍'

"中國首款車規級AI芯片來了。今天（8月30日）在上海人工智能大會期間，邊緣人工智能芯片企業地平線正式宣佈量產中國首款車規級人工智能芯片——征程二代。征程二代是地平線自動駕駛芯片“征程”迭代款，該芯片搭載了地平線自主創新研發的高性能計算架構BPU2.0（Brain Proc...

GPU 無人駕駛技術算法設計 2019世界人工智能大會編譯器人機交互網絡安全工業設計軟件語音識別技術臺灣積體電路製造公司上海 2019-09-04

'一種接口應付CPU、GPU等各種硬件，英特爾公佈oneAPI簡化AI開發'

"曉查發自凹非寺量子位報道 | 公眾號 QbitAIAI開發者最怕什麼？硬件不統一，帶來的開發碎片化問題。現在用於AI開發的硬件，不僅有CPU、GPU，還有FPGA、AI專用計算芯片。不同的硬件需要不同的API，甚至是不同的編程語言。將原來開發的AI程序移植到另外一...

英特爾人工智能中央處理器 GPU 編程語言技術軟件英偉達硬件 Facebook 設計程序員黃仁勳編譯器數學 Twitter 深度學習工程師百度 MATLAB 2019-09-03

'手機運存4GB、6GB和8GB有多大區別？真的越大越好？不要再被坑了'

"很多人在買手機時都會遇到一個問題，就是手機內存和運存的選擇。手機內存有64GB、128GB、256GB，當然內存選擇是越大越好。但是運存有4GB、6GB、8GB到底該怎麼選擇呢？難道也是越大越好嗎？手機運存是什麼？對手機有什麼影響？很多人說選擇大運存的手機，手機流暢度會高...

越南 GPU 中央處理器人生第一份工作 2019-09-03

'深度解析魅族低中高端魅族V8、魅族16Xs、魅族16s Pro的配置區別'

魅族16s Pro 技術中央處理器高通 GPU 人工智能人臉識別電信操作系統最in買手君硬件三星集團軟件 2019-09-03

推薦中...