一財朋友圈·鄔學寧 | 第三波人工智能潮跟以前有何不同

人工智能技術電腦機器人算法雲計算社交網絡物理物聯網阿蘭·圖靈達特茅斯學院約翰·麥卡錫高能小子終極裝備貝爾實驗室 Google Facebook 卡內基梅隆大學黑洞金融大學不完美媽媽無人駕駛大眾汽車日本經濟英國音箱紐約大學歷史加拿大人臉識別第一財經 2019-06-28

人工智能（AI）自1956年誕生以來，60多年來經歷了“三起二落”的波折的發展歷程。

2016年，隨著谷歌圍棋機器人AlphaGo的一戰成名，人工智能一詞開始佔據了大量媒體版面和大眾思想，從國家到企業層面，隨處都能見到人工智能的身影。隨著經濟增速的放緩以及資本的退潮，人工智能的“寒冬論”又開始甚囂塵上，“一哄而上，一鬨而散”帶來了一地雞毛，人工智能的未來，究竟何去何從？

人工智能歷史會重演嗎？

AI之父、圖靈獎獲得者約翰·麥卡錫在1956年的達特茅斯夏季研討會締造“人工智能”一詞時，曾有不同的聲音。在英語中，Artificial（人工、人造）一詞略帶一絲貶義，如人造革、人造絲等，暗藏著一點“假”的意思，當時英國的一些學者更願意使用“思考機器”的提法。阿蘭·圖靈憑藉他的“迷一樣的機器”enigma破解了德軍密碼，大大加速了二戰結束的進程，減少了上千萬人的傷亡，居功至偉，他提出了著名問題，機器可以思考嗎？

從這個角度看，其實人工智能這個術語還是貼切的。今天，AI的核心支柱——機器學習並不是在進行主動的學習，而只是在被“訓練”，更本質的來說，只是通過尋找最小誤差值的方法來進行參數擬合（Fitting），並不具有任何意識。在小數據等需要人類認知能力的領域，今天的AI就連5歲的孩子都比不上，例如，兒童在看到幾張照片後，就能輕鬆的學習到“貓”的概念，而“先進的”卷積神經網絡需要對大量的標籤數據進行學習才能完成類似的任務。即便如是，得益於算法的改進和指數增長的計算能力，在特定的場景中，AI已經展現出令人驚歎的能力，並且對部分行業的創新產生了關鍵影響。

麥卡錫對人工智能的定義是：製造智能機器的科學與工程。在人工智能誕生後的十多年裡，科學家們致力於通過模仿人的思維來實現智能。今天的人工智能算法，例如神經網絡、知識圖譜和對話機器人的雛形在那時都已經出現（分別對應為，感知機：可以完成簡單視覺分辨任務；DENDRAL：輸入質譜儀數據，輸出給定物質的化學結構；ELIZA：用於心理治療的聊天機器人），由於受當時歷史條件所限，AI能做的事情很有限，大眾對AI前景不切實際的樂觀和AI所承諾的能力均未能兌現，引發七十年代長達十年的首次AI寒冬。

80年代初，日本成為了當時全球第二大經濟體，在技術上也積極謀求世界領先的地位，提出了“五代機”（第五代計算機，前四代計算機分代表性技術別是：電子管、晶體管、大規模集成電路和超大規模集成電路）的設想，英美等政府也被迫跟進，對相關技術進行了大量投資，同時，機器學習的神經網絡算法也出現了兩項突破。基於物理學能量概念的霍普費爾德網絡被提出；在今天深度學習中仍然具有重要作用的“反向傳播”的方法被廣泛應用於神經網絡的參數訓練中，取得了不錯的效果，併成為今年（2019）圖靈獎得主JefferyHinton獲獎的重要依據之一；90年代初，時任貝爾實驗室負責人的楊力昆（YannLeCun，紐約大學教授，2019年圖靈獎得主，美國工程院院士，原Facebook AI研究院主任）實現了商用的手寫數字識別，美國有10%的支票的識別使用了該算法，1992年，採用簡單神經網絡控制的卡內基梅隆大學的首輛無人駕駛的裝甲車也上路了。儘管如此，但是受制與當時的計算力和數據量，人工智能逐漸湮沒於快速崛起的互聯網的奪目光芒中，但是，這個階段的理論儲備為今天的AI發展提供了重要的源泉。

前兩次AI的繁榮具有兩個特點，一是從參與者來看，主要政府投資主導，企業參與度低，落地應用極為有限；二是技術上均是以邏輯推理為核心的符號主義佔據了主導地位，神經網絡學派的發展長期被壓抑，客觀上，神經網絡所需要的數據量和算力條件當時也不成熟，AI的主要形式也因此表現為確定的推理，難以處理現實中遇到的大量不確定性問題。

當下處在第三波人工智能浪潮之上

互聯網30年的快速發展，社交網絡、物聯網和雲計算所產生的海量數據為本輪人工智能的繁榮提供了燃料。摩爾定律驅動算力在過去30年提升了百萬倍，為數據驅動的人工智能提供了強勁的動力。2006年，加拿大科學家Geoffrey Hinton教授等人一年之內連發三篇重量級論文，標誌著由深度學習時代的開啟。自2016年AlphaGo引爆了媒體以來，AI得到整個社會個關注，在B端；金融、零售和快消品等行業利用AI助力變現與創新，已經產生了巨大的價值；在C端，人臉識別、智能音箱等個人助手已經司空見慣。在科學領域，無論是蛋白質摺疊研究還是繪製黑洞的視覺圖像，數據密集型研究已經徹底改變了很多學科的研究方法，甚至也滲透到了人文社科領域的方方面面。

與前兩次人工智能浪潮不同，很多和業務緊密結合的AI應用場景已經或正在落地，企業成為了最主要的推動者。技術上，深度學習作為機器學習的一種，放棄了之前符號主義的機械推理，而採用了基於概率的範式，使得應用場景得以大幅度的拓展。符號主義則以知識圖譜的形式延續下來，成為新一代搜索引擎的核心技術，今天，你在搜索引擎中輸入一個問題，比如：姚明的妻子是誰？系統會直接返回結果“葉莉”，而不是連篇累牘的相似鏈接。

同時，繁榮之下的侷限也是顯而易見的。首先，深度學習技術上缺乏理論的支撐，目前是模型的結構和訓練是經驗主義主導，先有蒸汽機，後有熱動力學；先有飛機後有空氣動力學；先有望遠鏡，後有光學，實踐先於理論是人類認識世界的重要途徑，未來深度學習理論的誕生將能減少算法對算力和數據的依賴；其次，也缺乏突破性的算法思想。深度學習中大紅大紫的卷積神經網絡（CNN）和長短時記憶網絡（LSTM）都是在上世紀八九十年代就被提出了的，只是囿於當時數據量和算力，才沒有流行。本輪人工智能的繁榮真正的令人眼前一亮的創新點乏善可陳，對抗神經網絡（GAN）引入博弈論的思想、AlphaGo強化學習結合深度學習、自然語言處理中的詞向量等技術可以算是為數不多的重要創新。

經典力學和量子力學的發展過程與今天深度學習的近似點：第谷收集了大量行星運動數據，他的助手開普勒在這些數據中發現了行星運動三大定律，但未能指出背後的原理，直到牛頓在三大定律基礎上提出萬有引力定律；在量子力學領域，人們很早就獲得了氫原子的光譜數據，但是無法解釋。1885年，瑞士一位數學教師發現了這些數據的規律，提出了“巴爾莫公式”，但是不能解釋其原因，直到1913年，波爾的原子核模型和巴爾莫公式完全吻合。今天，我們擁有大數據，也有一些不錯的深度學習模型，但是還缺乏理論的支撐，對這些模型進行很好的解釋，恰似處於開普勒和巴爾莫的狀態，等待著牛頓和波爾提出的理論來進行解釋。

學術界作為人工智能理論的先鋒，對於深度學習的基礎理論研究、非監督學習、弱監督學習、模型的可解釋性和通用人工智能（AGI）都期待突破性創新，而不是在已有模型上微調，為了發論文而進行“創新”。本輪人工智能主要算法的靈感來源於認知科學、博弈論和量子力學等廣闊的領域，大數據驅動的算法主導的科學研究範式（第四範式）被應用於各個學科的研究，他山之石可以攻玉，其他學科的進展也能反哺人工智能的創新，並可能起到至關重要的革命性作用，特別是腦科學、心理學等學科發展可能與AI的發展形成閉環和相互促進的良性關係。

在工業界，除了金融、零售等少數數據條件好而且“離錢近”的行業，傳統行業在數字化轉型過程中，面臨數據採集、數據治理和缺乏人才等一系列挑戰、直接利用人工智能變現具有一定難度。換個角度看，這些行業也具有極大的潛力，可以從先從一些簡單的“速贏”場景切入，逐步培育數據文化和人才，先對已有業務進行優化，例如創造更好的用戶體驗，並進而考慮利用AI商業模式的創新，例如將一次性的產品銷售轉化為長期的個性化服務，比如某國外的智能冰箱可以識別食品包裝的有效期，並進而可以和零售商合作，為用戶提供食品服務。

本輪人工智能的上半場在C端衣食住行方面都已普及，接下來的主戰場將在B端，企業不要總是想著風口，踏踏實實地將一個個AI場景落地才是王道。整個社會各行業的數字化轉型將持續數十年，即便學術界在未來十年在AI理論上沒有大的突破，對於行業的AI場景落地並不會產生太大的瓶頸效應，大部分企業AI場景並非一定要使用最酷炫的技術，合適的技術才是最好的。根據Gartner的估計，未來企業對於預測算法的需求將指數增長，其中大部分場景並不需要追求極致的預測準確率，使用目前流行的框架和工具，普通程序員和商業分析師就能滿足大部分這類需求，對於少數核心場景，例如金融行業的風控，零售行業商品推薦，1%的準確率的提升都會帶來巨大的價值，企業自然會在這些領域不遺餘力的進行投入，數據科學家未來的用武之地也將轉移到這些領域。

今天，AI的主要目標不再是讓它像大腦一樣思考，而是利用其獨特的能力，做好人類的助手，如同工業革命解放我們的體力那樣，AI解放我們重複性工作所需的腦力，讓我們有更多的時間和精力從事更有價值的創造性工作。雖然，今天對於沒有意識的AI統治人類的擔心如同杞人憂天，但是我們已經看到大量的行業正在數字化轉型的進程中，現實物理世界被逐漸映射到虛擬的數字空間之中，主宰虛擬世界的算法如同法律，其在虛擬世界中的決策作用在現實生活中不斷顯現，電影《黑客帝國》所預言的時代似乎已經觸手可及。AI正在成為人類新的潛意識，替我們進行著各項決定，雖然我們好像擁有最終決策權，卻對我們正生活在我們自己編織的信息繭房之中常常不自知。

一財朋友圈·鄔學寧 | 第三波人工智能潮跟以前有何不同

相關推薦