第一代是CPU，第二代是GPU，第三代是什麼？AI芯片！

GPU CPU 機器學習 Google 互聯網吐槽家 2017-06-12

先是CPU，後來是GPU。接下來是什麼？人工智能芯片怎麼樣？

要是你還沒有聽說過使用深度神經網絡和深度學習來處理從語音識別到實現自動駕駛汽車各項任務的人工智能和機器學習熱潮，那麼恐怕還沒有聽說過谷歌新的Tensor處理單元（TPU）、英特爾的Lake Crest或者Knupath的Hermosa。多家廠商期望提供針對神經網絡的平臺，這些只是其中的幾個代表。

谷歌TPU

TPU含有一個龐大的8位矩陣乘法單元（見圖1）。它實際上優化了DNN所需要的數字處理，因而不需要大型的浮點數字系統。

第一代是CPU，第二代是GPU，第三代是什麼？AI芯片！

圖1：谷歌的TPU有一個龐大的8位矩陣乘法單元，幫助它為深度神經網絡處理數字。

TPU實際上是由傳統主機CPU通過TPU的PCI Express接口來管理的一種協處理器。TPU芯片的運行速度只有700 MHz，不過說到DNN加速，它卻可以擊敗CPU和GPU系統。雖然沒有明確作為一種DNN處理器，但是它可以處理繁重任務，耗電量卻只有40瓦。它有28 MB的板載內存以及4MB內存（表現為32位累加器用來編譯來自矩陣乘法單元的16位結果）。該芯片使用28納米工藝，晶片尺寸約600 平方毫米。《分析Tensor處理單元在數據中心中的性能》（https://drive.google.com/file/d/0Bx4hafXDDq2EMzRNcy1vSUxtcEk/view）一文介紹了更多的技術細節。

TPU板卡（圖2）的執行速度可達到92 TeraOps/s（TOPS）。這比處理同一任務的CPU和GPU快15倍至30倍，每瓦TOPS方面提升30倍至80倍。用來比較系統的軟件是TensorFlow框架。

第一代是CPU，第二代是GPU，第三代是什麼？AI芯片！

圖2：谷歌的TPU模塊旨在將一排排插槽插入到雲數據中心。

要牢記的一個方面是，TPU比較是針對侷限性方面進行的。大多數CPU是64位平臺，GPU可能擁有更寬的字寬。它們還往往針對更龐大的數據項進行了優化，不過大多數系統支持比較小的字（包括8位向量運算）。同樣，不同的神經網絡應用得益於不同的配置，但是比較小的8位整數已廣泛應用於許多DNN應用。

TPU有五種主要的指令：

Read_Host
Read_Weights
矩陣乘法/卷積
激活
Write_Host

寬度是神經網絡裡面的值，被矩陣乘法單位所使用。激活函數為人工神經元執行非線性操作。

谷歌的TPU有望減少對更龐大數據中心的需要，不然，這種數據中心需要多得多的CPU和GPU來處理人工智能應用，應用領域廣泛：從語音識別及分析、圖像及視頻處理、通過搜索提供服務，到那些小巧的Google Home系統，不一而足。

英特爾Lake Crest

Lake Crest（圖3）是旨在補充多核至強Phi的英特爾平臺的代號。至強Phi負責處理許多人工智能事務，但是面對谷歌的TPU或英特爾的Lake Crester可以更高效地輕鬆處理的應用時卻顯得力不從心。Lake Crest技術最初是由Nervana開發的，這家公司並不隸屬英特爾。

第一代是CPU，第二代是GPU，第三代是什麼？AI芯片！

圖3：英特爾的 Lake Crest使用針對人工智能應用而優化的處理集群。

新芯片將採用眾多先進的功能特性，從多芯片模塊（MCM）設計，到“Flexpoint”架構（擁有十多個專門的多核處理節點，類似TPU的矩陣乘法單元），不一而足。該芯片會有32 GB的高帶寬內存2（HBM2），通過中介層（interposer），可獲得8 TB/s的聚合帶寬。HBM2在高性能的片上系統（SoC）和GPU中司空見慣。Lake Crest沒有任何緩存。軟件將用來優化內存管理。

Lake Crest預計會在2017年面市。

Knupath Hermosa

Knupath的Hermosa（圖4）擁有64個DMA引擎和256個數字信號處理（DSP）核心，組織成8個集群，每個集群的8個核心由Lambda Fabric加以連接。Lambda Fabric還旨在以一種低延遲、高吞吐量的網狀網來連接成千上萬個Hermosa處理器。

第一代是CPU，第二代是GPU，第三代是什麼？AI芯片！

圖4：Knupath的Hermosa多核處理器有256個DSP核心，這些核心採用8個集群來組織，每個集群的8個核心由Lambda Fabric加以連接。

Hermosa有一隻集成的L1路由器，擁有32個端口和1 Tbps帶寬。對外連接包括16個10 Gbps雙向端口。該芯片有72 MB數據內存（分成32排）和2MB程序內存。

雖然Hermosa面向人工智能應用，但是相比更專用的Lake Crest或TPU平臺，它卻更加類似多核至強Phi。Hermosa可提供每秒3840億次浮點運算（384 GFLOPS）的計算能力，耗電量卻只有34瓦，因而非常適合一系列廣泛的應用，而不僅僅是人工智能應用。

GPGPU繼續唱主角（眼下）

英偉達和AMD在GPU平臺方面有既得利益，這些GPU平臺一向是大多數高端神經網絡處理工作的基礎。隨著專門的人工智能芯片變得普及起來，這種情況可能會發生變化。問題在於，這些芯片針對特定應用的定製性有多強、它們有多普及，以及用於不同的應用領域效果有多好。

眼下，像英偉達的Jetson TX2這些GPU平臺用於從無人機到醫療設備的各種系統中。實際上還有可能用於英特爾的小型Curie模塊中的人工智能加速器。一種尺寸適合不了所有需求，但是人工智能對於計算機應用而言的重要性只會越來越強。

相關推薦

'物聯網助推芯片蓬勃發展，雲端AI芯片規模達百億美元'

"文/楊劍勇隨著5G網絡在全球如火如荼建設，以及NB-IoT和LoRa等LPWA低功耗廣域網通信技術應用，支撐百億級海量物聯網設備連接成為可能，將加速物聯網應用落地，面向城市、工業、教育、醫療、車聯網和智能家居等垂直領域得到廣泛應用。並在人工智能技術促進下，信息科技進入全新...

人工智能物聯網智能家居英偉達技術 GPU 英特爾寒武紀無人駕駛深度學習雲計算高通電腦自然語言處理 Google 機器人通信我的第一部5G手機屏住呼吸智能汽車來了語音識別技術中央處理器華為公司阿里巴巴集團 2019-09-17

'華為拿什麼破解AI核心難題？'

"C114訊 9月16日早間消息（舒允文）OpenAI近期發佈的研究顯示，僅2012年以來，人們對於算力的需求增長六年就超過30萬倍，平均每年增長10倍，遠遠超過了摩爾定律的發展速度。作為AI的後入局者，面對AI算力需求的爆發式增長，華為大膽地提出要為業界提供“易獲取、用得...

人工智能華為公司技術雲計算英偉達詹姆斯·瓦特 GPU Google 自然語言處理列奧納多·達·芬奇移動互聯網硬件運營商物聯網納米技術英國電腦穿戴設備特斯拉汽車大數據設計算法交通無人駕駛中央處理器我的第一部5G手機 2019-09-17

'華為昇騰910芯片發佈，AI算力世界第一，美國科技界的噩夢來了'

"大家好，我是科普君！美國封鎖華為的時候一定沒有想到，這個看似不起眼的公司，居然擁有這麼大的能量。通過不斷的發佈“備胎”發明，居然這麼快就在世界科技領域中佔有了一席之地。而這次，美國科技界註定無眠，因為華為又一次用實力證明了自己！最近，華為就發佈了一個好消息，宣佈他們生產出...

華為公司人工智能技術任正非工程師英偉達 Google 機器人通信普惠公司 2019-09-16

'iPhone 11“浴霸三攝”AI增強超廣角，智能手機最快芯片爭霸華為'

"【新智元導讀】2019蘋果秋季發佈會，庫克發佈了三款新iPhone：iPhone 11、iPhone 11 Pro、iPhone 11 Pro Max，作為首款以Pro命名的蘋果手機，iPhone 11 Pro系列最大的變化是三攝像頭。而新的A13仿生芯片，則以機器學習為...

iPhone 智能手機浴霸人工智能技術華為公司機器學習中央處理器增強現實 GPU 設計我的第一部5G手機 Apple Watch 蘋果公司 PowerPoint 攝影數學 2019-09-13

'摩爾定律失效？芯片發展放緩，Ai或為撬動產業繼續發展的槓桿'

"算力說當價格不變時，集成電路上可容納的元器件的數目，約每隔18-24個月便會增加一倍，性能也將提升一倍，這也被稱為摩爾定律。實際上集成電路的發展速度已經放緩，面對越發微小的納米工藝，製造業正在面臨物理上的瓶頸。但是集成電路仍然要發展，接下來怎麼做，華虹集團總工程...

2019世界人工智能大會大數據設計中央處理器算法工程師物理機器學習 2019-09-13

'華為麒麟990：首款7nm旗艦5G芯片比快更快，16核GPU笑傲江湖'

"【新智元導讀】剛剛，華為消費者BG CEO餘承東在2019德國IFA上揭曉了 “史上最強芯片” 麒麟 990 5G，這是業界首個集成了5G基帶的SoC商用芯片，集成103億晶體管，採用7nm+EUV工藝，毫無疑問是世界最強大的5G SoC！世界首個集成了5G基帶的SoC ...

我的第一部5G手機 GPU 華為公司技術餘承東人工智能中央處理器笑傲江湖硬件設計我想靜靜 IFA 三星集團原汁原味的德系SUV PowerPoint 單鏡頭反光相機高通通信 2019-09-09

'華為發佈全球首款5G SoC芯片，雙大核NPU帶來最強AI算力'

"作為智能手機的核心部分，處理器芯片的市場近些年逐漸變得更加激烈，雖然高通依然佔據著Android陣營大片的市場，但在研發技術方面卻要面臨華為施加的巨大壓力，每一代的海思麒麟旗艦芯片都有著巨大的進步，高通希望能夠抵消與華為麒麟處理器的三個月時間差，但華為在芯片技術的飛速發展...

我的第一部5G手機華為公司高通人工智能 GPU 技術中央處理器智能手機圖像處理我想靜靜小米科技 IFA Android 麒麟啤酒 OPPO 2019-09-09

'國人驕傲！麒麟990發佈，真正的5G，16核GPU最強AI，馬上能買到'

"時隔一年，麒麟980在德國IFA國際電子消費展會上發佈期待已久的麒麟990，全球業內人士見證國產最強移動芯片的誕生，高通和三星獵戶座處理器對比，有多個參數領先，麒麟990問世，搭載990的產品也在不久就能買到。可能手機發布多了，連處理器也將有兩個版本：一個支持5G一個不支...

我的第一部5G手機 GPU 華為公司人工智能高通三星集團餘承東原汁原味的德系SUV 蘋果公司 IFA 2019-09-09

'專業化AI芯片對開發者的影響'

"來源：內容來自「IEEE電氣電子工程師學會」，作者：Evan Sparks ，謝謝。這是一篇guest post。本文所表達的觀點僅僅是作者的觀點，並不代表IEEE Spectrum或IEEE。當談到人工智能的計算密集型領域時，硬件供應商正在恢復我們在摩爾定律最高峰時所享...

人工智能軟件 ARM 自然語言處理深度學習英偉達 GPU 雲計算中央處理器英特爾硬件微軟 Google 機器學習工程師語音識別技術蘋果公司設計恩智浦半導體機器人高通加州大學伯克利分校 Azure Dropbox 高德納集團超微半導體文章 IBM 聯發科技 2019-09-09

'從4核到6核再到8核5GHz 酷睿九代CPU能效有什麼變化？'

"筆記本電腦應該考慮續航嗎？提到這個問題，筆記本玩家可能要分裂了，面向商務市場的筆記本顯然會把續航作為第二甚至第一選擇，至少也要支撐8小時工作時間，還得輕薄、便攜，這又進一步壓縮了電池空間。遊戲本玩家似乎不太注重續航，即便很多遊戲本空間夠大，可以塞入更大的電池，但是沒有幾款...

Intel Core 中央處理器筆記本電腦電腦英特爾技術 GPU 設計臺式電腦 2019-09-07

'地平線餘凱：車規級AI芯片，引領汽車駛向超級計算機時代'

"9月3日，第二屆全球IC企業家大會暨第十七屆中國國際半導體博覽會（IC China 2019）在上海召開，本屆大會主題為“開放發展合作共贏”，由工業和信息化部、上海市人民政府指導，中國半導體行業協會、中國電子信息產業發展研究院聯合主辦。地平線作為在AI芯片領域的先鋒創業...

人工智能超級計算機電腦無人駕駛算法人機交互設計 GPU 我的第一部5G手機語音識別技術編譯器創業上海眾包能源 Ultrasone 2019-09-06

'華為IFA2019大展：麒麟990芯片用AI重構手機未來'

"近日，華為終端重磅消息不斷，代表華為手機最高技術水準和創新能力的全新麒麟芯片和華為Mate30系列爆料不停，看點十足，將外界對於下半年的旗艦智能手機的期待推向高潮。全新麒麟芯片“麒麟990”很可能將於明天在德國柏林IFA2019大展上首發，華為消費者業務CEO餘承東日前也...

華為Mate 華為公司華為手機人工智能智能手機我的第一部5G手機技術 IFA 原汁原味的德系SUV GPU 餘承東列奧納多·達·芬奇中央處理器蘋果公司高通 2019-09-06

'對標谷歌、英偉達，華為自主研發的AI芯片，究竟有多強？'

"繼上個月的鴻蒙發佈之後，華為將在 9 月份中旬在上海舉辦年度大會：華為全聯接大會 2019。這次他們要發佈的產品實力同樣不容小覷，譬如：鯤鵬計算平臺相關產品和基於昇騰 910 的 AI 重磅新品。這一批都是華為的自研芯片雖說鯤鵬計算平臺涉及的領域很多，不過有些服務差友們應...

華為公司人工智能英偉達 Google 技術無人駕駛雲計算 DevOps 嘉年華電腦上海量子計算理論大數據區塊鏈算法我的第一部5G手機策略遊戲自然語言處理機器人 2019-09-06

'從AI企業芯片集錦看“中國芯”的活躍'

"芯片代表了人工智能應用的算力水平。2019世界人工智能大會上的一堵“芯片牆”引人注目，這堵牆上展出了國內外7家知名企業的10款芯片產品，包括華為“麒麟810”、高通“驍龍855”、地平線“征程/旭日”系列、依圖科技“求索”、平頭哥“玄鐵910”、紫光展銳“銳虎賁T710”...

高通技術 2019世界人工智能大會我的第一部5G手機華為公司算法中央處理器 GPU 華為榮耀通信機器人設計三星集團列奧納多·達·芬奇深度學習 OPPO 臺灣積體電路製造公司攝影 2019-09-05

'重磅！一款雲端全功能Ai芯片“崑崙'

"為方便企業外出場景服務，為企業用戶提供一站式出行解決方案，滿足企業員工自由出行的需求，航班管家推出了企業服務功能。在今年7月，百度在北京舉辦百度雲智峰會，該公司又推出了一款雲端全功能ai芯片“崑崙”，其中包含訓練芯片崑崙818-300，推理芯片崑崙818-100。特別重磅...

人工智能百度百度雲物聯網騰訊雲計算跳槽那些事兒騰訊機器學習算法人生第一份工作 2019-09-05

'中國首款車規級自動駕駛芯片發佈：全面開放、算力超GPU 10倍'

"中國首款車規級AI芯片來了。今天（8月30日）在上海人工智能大會期間，邊緣人工智能芯片企業地平線正式宣佈量產中國首款車規級人工智能芯片——征程二代。征程二代是地平線自動駕駛芯片“征程”迭代款，該芯片搭載了地平線自主創新研發的高性能計算架構BPU2.0（Brain Proc...

GPU 無人駕駛技術算法設計 2019世界人工智能大會編譯器人機交互網絡安全工業設計軟件語音識別技術臺灣積體電路製造公司上海 2019-09-04

'車規級AI芯片“征程二代”量產，地平線前裝商業化開啟加速跑'

"自動駕駛技術規模化上車困難重重，量產落地前路漫漫的討論甚囂塵上。從2018年下半年開始，自動駕駛領域投資者開始迴歸理性。全世界自動駕駛的競爭，也正在從試驗階段走向工程化量產階段的競爭。在這個時間點上，地平線於今日宣佈量產中國首款車規級AI芯片——征程二代Journey 2...

人工智能無人駕駛軟件技術設計網絡安全算法編譯器 GPU 工業設計上海創業 2019-09-03

'一種接口應付CPU、GPU等各種硬件，英特爾公佈oneAPI簡化AI開發'

"曉查發自凹非寺量子位報道 | 公眾號 QbitAIAI開發者最怕什麼？硬件不統一，帶來的開發碎片化問題。現在用於AI開發的硬件，不僅有CPU、GPU，還有FPGA、AI專用計算芯片。不同的硬件需要不同的API，甚至是不同的編程語言。將原來開發的AI程序移植到另外一...

英特爾人工智能中央處理器 GPU 編程語言技術軟件英偉達硬件 Facebook 設計程序員黃仁勳編譯器數學 Twitter 深度學習工程師百度 MATLAB 2019-09-03

'AI智能芯片崛起史'

" 對於AI芯片可以理解為面向 AI應用的處理器芯片，它屬於AI和處理器芯片兩大領域的結合。當前隨著人工智能的蓬勃發展，AI芯片已經成為了最炙手可熱的投資領域，除了Intel、Nvidia、ARM這些老牌的芯片廠商外，Google、Facebook、微軟這樣的互聯網公司也進...

人工智能 GPU 中央處理器英特爾英偉達 Google 算法超級計算機並行計算硬件 ARM 賽靈思語音識別技術設計軟件微軟 Facebook Altera 亞馬遜搜索引擎 2019-09-03

'刷爆朋友圈的AI換臉為什麼那麼神奇？'

"還記得不久前在歐美再次走紅的AI視頻換臉嗎？一款名為Deepfake的工具，能夠利用人工智能算法，將一個人的臉合成到另一個人的視頻中，當用來訓練的數據足夠多，相關計算能力足夠強大時，人們很難直接辨別視頻的真偽。昨天一天，朋友圈出現了大量被“換臉”的短視頻。網友們紛紛將自己...

人工智能技術算法陌陌軟件杭州人生第一份工作蘋果公司頭條女神 Google 電腦 GitHub 沈騰西遊記 2019-09-03

推薦中...