人工智能的“大腦”

2017年5月27日,中國棋手柯潔(左)在與“阿爾法圍棋”的第三場對局中思考自2006年人工智能走出實驗室進入到產業化階段以來,人工智能界在算法理論、基礎與平臺、應用技術、終端產品、行業應用以及未來探索領域湧現出了諸多領軍團隊,引領著人工智能的發展方向。

文/徐貴寶

自2006年人工智能走出實驗室進入到產業化階段以來,在產業鏈各環節的不懈推動下,人工智能開始以前所未有的速度滲透進各個行業,併成為深刻改變人類生產生活方式的革命性力量。

在此期間,人工智能界在算法理論、基礎與平臺、應用技術、終端產品、行業應用以及未來探索領域湧現出了諸多領軍團隊,引領著人工智能的發展方向。

算法理論

當前應用最廣泛的算法當屬於深度學習算法了。美國神經網絡之父傑弗裡·欣頓(Geoffrey Hinton)在2006年提出的深度學習算法,通過構建多隱層模型和海量訓練數據來學習更有用的特徵,最終提升了分析和預測的準確性。

也正是深度學習算法與雲計算、大數據的共同作用,才使得人工智能華麗蛻變,開啟了產業化的大門,成為了產業發展的新引擎。而為深度學習的產生與發展做出卓越貢獻的深度學習三駕馬車——欣頓、加拿大蒙特利爾大學教授約舒亞·本希奧(Yoshua Bengio)、紐約大學教授揚·萊坎(Yann Lecun)也深受企業界青睞,目前他們分別受僱於美國的頂級公司谷歌、微軟和臉書,併成為2018年的圖靈獎獲得者。

為進一步提高深度學習的效率和準確率,學術界一直在探索對深度學習算法的深化和改善研究。這一方面取得最大成績的當屬谷歌旗下的Deepmind公司,其AlphaGo由於採用深度強化學習算法而一路戰勝李世石、柯潔等一系列人類圍棋冠軍而聞名天下,後來推出的新版本AlphaZero甚至又戰勝了AlphaGo。

在信息非對稱的博弈中,卡耐基梅隆大學開發的人工智能Libratus在與4名人類頂尖得州撲克選手之間的“人機大戰”中也取得了壓倒性勝利。此外,比較知名的算法還有谷歌大腦研究科學家Ian Goodfellow提出的對抗式生成網絡、南京大學周志華教授提出的深度森林、新加坡南洋理工大學黃廣斌教授提出的超限學習機等。

但是,隨著深度學習應用逐步深入,其不可解釋性與黑箱問題等也在近兩年逐步暴露出來。因此,一些傳統的機器學習算法重新受到重視,如1988年美國計算機科學家猶大·伯爾(Judea Pearl)提出的貝葉斯網絡、2012年穀歌提出的知識圖譜等。另外,還有一些新型算法,包括欣頓提出的膠囊網絡、谷歌大腦與Deepmind提出的圖網絡等。

基礎與平臺領域

在通用芯片設計方面,美國英偉達(NVIDIA)的Tesla等系列GPU、谷歌的TPU以及英特爾(Intel)的NNP等產品都屬於國際領先的雲端芯片;三星、蘋果、高通等終端廠商也都有相應的終端芯片產品;中國的寒武紀在深度學習芯片設計方面也已經達到國際先進水平。

在專用芯片設計方面,特斯拉2019年4月發佈了自主研發的自動駕駛專用芯片以及CPU、GPU、ISP等一系列芯片,其完全自動駕駛計算機可以達到144TOPS的算力,但功耗僅為72W,並已搭載在目前新生產的特斯拉旗下車型中。總部位於北京的地平線機器人2017年底發佈了面向智能駕駛的Journey 1.0和麵向攝像頭的Sunrize1.0處理器。

在半導體加工設備方面,超高精密儀器、數控機床、光刻機等基本上被美國、日本、荷蘭等壟斷,包括美國的應用材料公司、日本的日立、荷蘭的阿斯麥(ASML)等。

在芯片生產方面,目前來自中國臺灣的臺積電處於世界領先水平,它將於2020年開始5nm製程的量產,而且3nm製程的環境影響評價已獲通過,2nm製程計劃已經制訂。

深度學習模型需要基於大量的數據進行訓練才能獲得較好的參數,因此國際上一些大型科研機構和企業非常重視數據集的建設。數據集建設的先驅當屬於美國斯坦福大學的華裔科學家李飛飛,她於2009年成功創建ImageNet數據集,並通過舉辦比賽等方式極大地促進了圖像識別算法的進步,使其分類精度達到了95%以上。

目前,比較知名的數據集包括美國國家標準研究院的Mugshot、谷歌的SVHN、微軟的MS COCO等圖像基礎數據集、斯坦福大學的SQuAD、卡耐基梅隆大學的Q/A Dataset、Salesforce的WikiText等自然語言數據集以及2000 HUB5 English、CHiME、TED-LIUM等語音數據集。另外,澳大利亞的數據集Kaggle橫跨多個領域,具有較強的綜合性,其影響力也正在逐年增強。

由於深度學習對算力有較高的需求,因此相繼出現了一些專門的計算框架和平臺,著名的框架包括谷歌的TensorFlow、加州大學伯克利分校的Caffe、微軟的CNTK、臉書的Torch、亞馬遜的MXNet等。其中,谷歌的TensorFlow能夠支持異構設備的分佈式計算,其平臺API能力已經覆蓋了CNN、RNN、LSTM等當前最流行的深度神經網絡模型。

中國的百度公司也於2016年宣佈了開源PaddlePaddle深度學習平臺,並於2019年4月發佈了10餘項新特性及服務,覆蓋深度學習開發、訓練、預測環節。

開發語言和工具涉及腳本語言、開發平臺以及芯片設計工具等。

由荷蘭的吉多·範羅蘇姆(Guido van Rossum)於1990年代初開發出來的腳本語言Python語言已經成為廣受歡迎、用途廣泛的AI開發語言。微軟在其Build 2019開發者會議上宣佈在Visual Studio 2019中默認包含IntelliCode。谷歌於2018年發佈了AutoML,大大降低了人工智能開發者的門檻,目前已經能夠支持圖像、翻譯、視頻和自然語言處理等多個領域。

谷歌還推出一個名為AI Platform的人工智能訓練平臺,為人工智能研究人員的團隊測試、培訓以及部署模型提供了一個共享型端到端環境。

在智能化芯片設計工具方面,由於高集成度、高速度、高性能、高功效等要求,電子設計自動化(EDA)已經成為必不可少的工具。自1978年Calma公司發佈GDS-II以來,EDA市場經過激烈的競爭,目前已經形成了Cadence、Synopsys、Mentor Graphics三足鼎立的局面。

應用技術領域

語音識別與自然語言處理領域的先驅當屬於IBM,其ViaVoice早在1970年就已經引起了廣泛關注。但語音識別能夠開啟產業化大門還要歸功於本希奧開創了深度神經網絡做語音識別的先河。

此後,IBM Watson在2011年贏得了《Jeopardy!》答題秀,Nuance公司的語音識別技術也成為了蘋果公司Siri產品的核心。谷歌在2018年10月推出的BERT模型,在機器閱讀理解頂級水平測試SQuAD1.1中取得了驚人的成績,全部兩個衡量指標全面超越人類,並且還在11種不同的NLP測試中創出最佳成績。

中國在語音識別與自然語言處理領域也取得了較好的成績,科大訊飛在國際權威大賽中繼續保持領頭羊位置。

2018年1月,科大訊飛在業界權威的斯坦福SQuAD評測中第三次獲得世界第一名,其融合式層疊注意力系統也是全球首個模糊準確率超過89%的系統。隨後,在第十二屆國際語義評測比賽(SemEval2018)中,哈工大訊飛聯合實驗室獲得了機器閱讀理解評測任務第一名。

另外,科大訊飛還獲得了首個美國CES展“2017年度優秀人工智能產業領導者”獎,在第五屆國際多通道語音分離和識別大賽(CHiME-5)中再次包攬了大賽中單麥克風陣列任務、分佈式麥克風陣列任務和兩種麥克風陣列對應的兩個端到端的語音識別任務等全部四個項目的冠軍。

此外,搜狗公司在智能語音方面的成長速度也很驚人。在國際口語機器翻譯評測比賽IWSLT2018評測比賽中,搜狗與訊飛分別奪得了baseline模型和端到端模型的冠軍。

近些年來,影響較大的學術領軍人物基本上都是來自於圖像識別領域。欣頓由於其深度學習算法在當屆ImageNet競賽中取得壓倒性勝利,而使得人工智能進入到深度學習時代;萊坎提出的以LeNet為代表的卷積神經網絡應用到各種不同的圖像識別任務時都取得了不錯效果;吳恩達供職於谷歌時負責的項目藉助模擬神經網絡“DistBelief”,在沒有人幫助的情況下使機器自己讀懂了貓的概念。

中國企業在圖像與視頻識別領域也取得了令人矚目的成績。

何凱明、孫劍等提出的ResNet模型在ImageNet 2015競賽中以96.43%的準確率首次全面超過人眼94.9%的準確率;海康威視在ImageNet 2016競賽中獲得了多項第一名。

依圖科技、商湯科技、中國科學院深圳先進技術研究院在美國國家標準技術局(NIST)的人臉識別競賽FRVT2018中包攬了前五名,依圖科技成績甚至達到了千萬分之一誤報率下的識別準確率超過99%。

大華股份2018年在2D車輛目標監測、MOT跟蹤、行人重識別等國際競賽中分別取得了第一名的成績。

騰訊2018年在WIDERFACE和FDDB兩個權威的人臉檢測數據集上均取得了第一併刷新了世界紀錄,騰訊優圖還可在150毫秒內完成對色情圖片的識別,精度達到千分之一錯誤率。

另外,百度於2016年推出了體育解說機器人,在奧運期間為用戶直播熱門籃球賽事,不僅能在直播過程中與用戶互動回答問題,而且還特別設定了“全程賽事解說”和“球星重點解說”兩種模式。

搜狗在脣語識別領域表現優異,在非特定人開放口語測試集上可以達到60%以上的準確率,在車載、智能家居等垂直場景命令集上甚至可以達到90%的準確率。

終端設備領域

在工業機器人方面,日本的發那科和安川、瑞士的ABB、德國的庫卡被稱為“四大家族”,它們佔據了全球將近60%的市場份額,在中國市場份額更是達到70%以上。

在人形機器人方面,最引人注目的機器人當屬谷歌旗下的波士頓動力公司研發的阿特拉斯(Atlas)機器人,其閃轉騰挪、跳躍能力令人稱奇。日本本田研發的阿西莫(ASIMO)機器人不僅能夠主動閃避迎面而來的人,還能上下樓梯,甚至完美地完成用紙杯倒水等任務。俄羅斯致力於打造太空戰士,其軍方機器人Fedor不僅可以準確執行人類口頭指令,還可以完成匍匐前進、開車、射擊等任務。

在手術機器人方面,由美國直覺外科公司(Intuitive Surgical)、IBM、麻省理工學院和Heartport公司聯合研發的達芬奇機器人在外科手術領域具有絕對的壟斷地位,自問世以來20多年一直處於行業第一的位置,保持70%的毛利潤率和30%的淨利潤率。

微型機器人方面,慕尼黑工業大學的Simmel團隊2018年使用DNA分子組裝出一個可以遠程控制的納米機器臂,並用它成功推動了一個納米金微粒。哈工大謝暉教授團隊2019年3月研製出可重構磁性微機器人群,磁性遊動機器人長3微米,直徑2微米,為實現毛細血管內手術帶來了可能。

在無人系統方面,中國大疆無人機目前已經佔據了全球70%以上的市場份額,而特斯拉、谷歌、百度等均在無人車領域取得了較大進展,相繼在一些國家和區域獲得了路測牌照。

未來探索:

腦機接口控制與類腦智能領域

自1980年代約翰·霍普金斯大學的科研人員Apostolos Georgopuolos找到獼猴的上肢運動方向和運動皮層中單個神經元放電模式的關係以來,腦機接口取得了較大進展。

早期的腦機接口基本上都是侵入式的。2005年,美國電子活動神經技術系統公司(Cyberkinetics)獲得美國生物製品評價和研究中心(FDA)批准,進行了第一期的運動皮層腦機接口臨床試驗,使得四肢癱瘓的病人能夠利用一個96個電極的植入物通過運動意圖來完成機械臂控制、電腦光標控制等任務。

2016年9月,浙江大學吳朝暉課題組通過一種結合了大鼠和增強學習算法計算機的混合腦機系統,使得被“增強”後的大鼠在學習走迷宮任務中即使是在視覺和觸覺感知受阻的情況下也能順利走出迷宮。

由於侵入式腦機接口容易給植入者帶來痛苦和傷害,近年來非侵入式的神經成像術開始受到研究者的青睞。

2004年創辦於硅谷的神念科技已經將利用腦電波實現的腦機接口應用於腦立方等產品中。

2017年,創業領域領軍人物埃隆·馬斯克(Elon Musk)等投資創立面向神經假體應用和未來人機通信的腦機接口公司“神經連接”(Neuralink)。

中科院半導體所及其合作團隊利用任務相關成分分析算法,將穩態視覺誘發電位腦機接口的通訊速率提升到5.4 bit/s(最優結果達到6.3 bit/s),成為目前已有報道的最快頭皮腦電腦機接口系統。

2018年11月,美國華盛頓大學和卡耐基梅隆大學的研究學者首次成功建立了多人腦對腦接口合作系統,使3名受試者在互不對話情況下的意念分享平均準確率高達81.25%。

由於現有計算機系統受到內存牆等相關方面的制約,難以達到較高的計算效率,近些年來國內外一些科學家開始進行顛覆馮·諾依曼體系結構(數學家馮·諾依曼提出了計算機制造的三個基本原則,即採用二進制邏輯、程序存儲執行以及計算機由五個部分組成,這套理論被稱為馮·諾依曼體系結構)的類腦智能算法與技術的探索。

現在,隨機興奮神經元、擴散型憶阻器等已經在IBM、馬薩諸塞州阿姆赫斯特大學、清華大學等機構研製成功,IBM已經研製成功TrueNorth芯片,清華大學團隊也成功研製出了基於憶阻器的PUF芯片。

(轉載於新華社)

相關推薦

推薦中...