觀察人工智能的三個維度，創業者、研究機構與技術觀察家

創業人工智能物聯網機器學習數字人的數字化思考 2017-05-05

本文選自第 38 期「I/O」會員通訊存檔，原文發表於 2017 年 1 月 17 日。歡迎加入「I/O」會員服務獲取最新內容，每週你還會收到三封專屬會員郵件，包括獨家的科技書評，科技新聞、趨勢的獨家解讀以及別處看不到的文章、圖書、視頻推薦 。

我曾在過去幾期會員通訊裡多次指出，當下不同領域的人對於人工智能的理解是有偏差的，這種偏差並非簡單意義上的對與錯，而是缺乏一個對話頻道，導致多數人自說自話。而在本期的會員通訊裡，我會提供一系列圍繞人工智能的多角度觀點和思考，有從業者的反思、智能機器行業年度總結報告以及一篇頗具含金量的演講。

創業者的反思

華盛頓大學人工智能博士徐宥曾在 Fitbit 負責機器學習，去年離職後參與到人工智能創業大潮中，他在 2016 年年底寫了篇反思人工智能創業和投資的文章，他直言這個行業已經開始浮躁：

這一波的 “AI” 創業熱潮，準確的說應該是“深度學習算法”創業潮.......而大量的創業公司都紛紛採用 .ai 做為域名後綴，實質上只是在“深度學習”這個子領域，解決一些特定的，以前只能靠人的智慧才能解決的問題。
就和 .com 時代一樣，域名後綴的符號意義遠大於實際意義。媒體，投資人和創業者都默默接受了 .ai 這個集體幻覺。總的來說，目前 AI 公司的井噴，是深度學習這項技術完成其技術擴散 (diffusion of innovations) 的體現。在 Google, Facebook 等技術領先企業的示範和大筆收購下，風險投資大量向 AI 傾斜。許多掌握機器學習和深度學習的人才，認識到深度學習可以用來解決一個具體的問題，也流動到創業公司開始創業。因為 AI 入門門檻很高，目前還是很容易從創業者的教育和工作經歷來甄選到底一個公司做的是不是深度學習，還是掛羊頭賣狗肉的。

其次，創業公司的真正機會在哪裡？很多投資人在人工智能領域投資時會關注創始人的價值，比如早前藍馳創投就在一篇分析報告中認為：

現在來看美國比中國還是領先不少，美國有4大名校：MIT、斯坦福、卡內基梅隆、紐約大學，還有Google、Facebook、MS這些大牛公司，培養了很多人才。在語音識別，圖像處理等領域國際很多頂級專家都是華人。國內也有很多專家，行業薪資待遇越來越好，會吸引更多的優秀人才進來。這批人目前可能在百度、騰訊和阿里，將來可能加入創業大軍（已經出現）。

然而擺在創業公司創始人面前的，還有產品方向的問題，徐宥提出他的思考：

AI 創業，還是要落實在深入解決一個非標準（不能拿標準的深度學習模型一套就能用）的問題上。只有在非標準的問題上，切實的瞭解用戶需求才變成可能。標準的問題，如圖像識別，自動駕駛，可以說，最終產品的亮點大家都差不多，因此人工智能也就不自動成為一個亮點。在非標準的問題上深耕，無形中就構建了兩個護城河：1，競爭對手需要花時間瞭解這個問題之後才能提出解決方案和產品；2，你比競爭對手先收集許多解決這個領域特定問題的數據，因此在同一時間節點上，你的模型永遠領先對手幾個月。這就像微軟的搜索引擎或許使用的模型很先進，但因為沒有足夠的數據因此質量永遠落後 Google 幾個月一樣。

人工智能相關行業的發展彙總

從語義的角度來說，物聯網、人工智能、機器學習、自動化其實沒有任何真正含義，常將這些用於掛在嘴邊的人也大多是外行人（比如，投資人），但在過去的 2016 年，上述四個領域還有一些值得關注的現象，尤其是一些可能會在 2017 年影響到技術行業發展的重要因素。

比如亞馬遜的 Echo 和 Google Home；緊接著，VR、AR 以及 MR （Mix Reality）的持續火爆，尤其是 PokemonGo 引發的 AR 遊戲熱潮，而當 Google 的 AlphaGo 一舉擊敗人類選手之後，人工智能、機器學習的熱潮開始席捲全球；另一個戰場上，Uber、百度、Google 又緊鑼密鼓地爭奪無人駕駛的未來話語權。

事實上，「物聯網」這個詞的外延也很大，從字面的角度來說，所謂物聯網，是一些從前沒有連接的物體被連接起來，比如過去我們會在書桌上使用筆記本，儘管筆記本是可以聯網的，但書桌並沒有聯網，而物聯網要做的，則是將這些傳統意義上不具備智能屬性、聯網屬性的物體連上互聯網。

在 2016 年，物聯網領域最有代表性的突破就是新一代交互模式的成熟，這就是基於聲音的交互模式；但另一方面，物聯網所遇到的挑戰也非常大：Dyn 服務器被攻擊導致 Twitter、Netflix 下線，再次引發了人們對於大量物聯網設備接入網絡後所面臨安全風險的擔憂；Google Nest 團隊新產品難產，部分意義上也說明了這筆高達 32 億美元的收購或許就是一個敗筆；在可穿戴設備市場，Pebble 賣身 Fitbit，Android Wear 出貨大戶 Moto 360 無限期推遲新產品計劃，只剩下 Apple Watch 苦苦支撐.....

下面這幅圖以時間線的方式非常直觀地展現了 2016 物聯網領域的發展狀況：

觀察人工智能的三個維度，創業者、研究機構與技術觀察家

從硬件領域，以下這些事件影響深遠：

Nvidia 通過 GeForce GTX 1080、1070 繼續統治 GPU 市場，這些圖形處理器也加入了很多支持 VR 的特性；與此同時，Nvidia 還在機器學習領域和包括 Facebook、IBM 在內巨頭公司建立合作，將其自身研發的 Tesla 圖形處理器裝備到這些公司的服務器上。
英特爾這年完成兩筆重要收購：Nervana Systems 和 Movidius。接下來，英特爾計劃通過整合上述收購，並結合自身的產品，比如 Altera、Phi、Xeon 處理器等產品，從而打包推出人工智能套件產品。
高通 390 億美金收購了汽車芯片製造商 NXP （恩智浦半導體），而軟銀也在今年花費了 310 億美元買下 ARM 公司，TDK 則用 13 億美元將一個重要供應商 InvenSense 收入囊中；
9 月份的時候，Particle.io 與Google 雲平臺達成合作，將通過雲端加速整個物聯網的開發部署；

軟件層面，語音交互之爭還在另一個戰場繼續，三星買下了曾經一手締造了蘋果 Siri 的 Viv 團隊；目前來看，語音交互呈現一超多強的局面，Alexa 繼續領先，而 Google、Apple 與三星將爭奪接下來的市場，這也會成為 2017 年最值得關注和期待的領域。

機器學習在過去的 2016 年迎來重大發展，這不僅包括 AlphaGo 歷史性勝利，也還包括創紀錄參會人數的 NIPS （神經網絡研究大會），更重要的則是，圍繞機器學習的大量創業公司的出現，也進一步推動了整個行業的發展。fnn這其中，深度學習毫無疑問贏得了幾乎所有人的主力一，下面是 CB Insights 針對創業公司的梳理：

觀察人工智能的三個維度，創業者、研究機構與技術觀察家

下面不妨來看看巨頭們的動向：

Google DeepMind：由 AlphaGo 引發的公眾情緒一定程度上也加速了人工智能行業的發展。而在強化學習之外，DeepMind 還在其他領域取得突破：比如研發了 Differential Neural Computer (DNC），這是一種建立在神經網絡概念上的計算機，通過結合深度學習模擬思考的方式，而不再侷限在模式識別。另外，DeepMind 還在還在研究如何讓小規模數據集條件下，進一步提升機器學習的訓練效果。
Google 大腦：就目前來看，Google 內部的人工智能項目也有兩個團隊，除了上文提到的 DeepMind，還有一支 Google 大腦。《紐約時報》年末用了大量篇幅報道了這個團隊現在所做的事情，從中也可以基本歸納出Google 大腦和 DeepMind 的區別之處：Google 大腦更側重於深度學習與 Google 自身產品的結合，比如在翻譯產品方面的突破就得力於深度學習了；而 Deepmind 則在基礎算法研發上保持優勢。
Facebook：在 Yann LeCun 的領導下，FB 人工智能實驗室主要聚焦在卷集神經網絡和圖像處理方面。2016 年，FB 發佈了一款名叫 Caffe2GO 的工具，這是一個可以讓深度學習網絡在移動設備上完成部署的工具。
OpenAI：在 Elon Musk 的努力下，這家名叫 OpenAI 的非盈利人工智能研究公司終於成立了，這個機構背後還有包括 Reid Hoffman、Peter Thiel 等人。OpenAI 的研究者在 8 月份提出一個 infoGAN 的模型，這是一個基於海量數據、非監督性學習下的生成式模型。
微軟：和 Google 一樣，微軟在機器學習領域佈局甚廣。今年主要的突破是在語音識別領域，2016 年 10 月，微軟的研究人會員宣佈其語音識別系統的準確性已經達到人類的水準。而大量與機器學習相關的產品模塊也融入到微軟 Azure 雲端。

技術觀察家的「警世恆言」

Maciej Cegłowski 的名聲並不大，他的影響力更多的還是侷限在程序員、極客的小圈子。從履歷上說，他曾在雅虎做過程序員，同時開發了一款書籤產品 Pinboard，同時也是一位畫家和作家。在他的個人網站 idleword 上，有很多對科技發展睿智的思考，包括文章和演講。比如這篇以人工智能為主旨的演講。

觀察人工智能的三個維度，創業者、研究機構與技術觀察家

Maciej Cegłowski 這篇演講更多地站在技術倫理的層面，去探尋人工智能、智能機器所帶來的各種影響——這並非杞人憂天，而是現實境況倒逼的選擇。

1945 年的時候，隨著一群美國物理學家準備測試原子彈，一些關於原子彈的疑問也開始增多，比如有人就質疑：「原子彈真的能在大氣層裡爆炸嗎？」

這個問題並不愚蠢，因為構成大氣的主要成分是氮，而氮是一種非常不穩定的元素。這就意味著物理學家們需要精確計算原子彈爆炸時的各種環境參數，既要保證能夠完成爆炸，又要避免原子彈點火前出現任何偏差。

而在一系列精密計算之後，物理學家們給出一個答案——這個答案的公式對我們來說並無真正意義，但你我都清楚一件事：那就是人類能夠活到現在，就是因為這一次的計算非常準確。

現在，人類遇到了另一個需要計算的「武器」——機器智能或人工智能。其實名字並不重要，重要的是這些技術將給人類的生活、工作帶來重要影響。比如提升生產效率、比如讓駕駛變得更安全，但另一方面也帶來一系列隱患和擔憂，就像當時人們對於原子彈的擔憂一樣——我們如何讓新技術的發展不影響到人類生存？

英國牛津大學學者 Nick Bostrom 提出了一個思考框架，在他的暢銷書《超級智能》1裡，Nick Bostrom 進一步闡釋了這個邏輯，用 Nick Bostrom「迷妹」Elon Musk 的話來總結：人工智能就是被召喚的惡魔。

仔細去看 Nick Bostrom 的分析框架，其實是有以下幾個前提：

前提1：一些顯而易見的重要證據
前提2：大腦是符合經典物理的存在
前提3：相信生物進化
前提4：相信計算能力的進化
前提5：當計算能力達到一定高度後，時間變得無足輕重，比如 AlphaGo 只需要幾天的時間就能完成一個職業棋手幾年才能熟練掌握的棋譜；
前提6：機器可循環的自我提升

如果你認同六個前提，那麼一定程度上也可以接受 Bostrom 的觀點，但更多的問題和爭論也就此開始了......結合這幾年不同行業、領域的瘋狂反應，Cegłowski 特別指出了一點，也是我覺得最具洞察的一點：當下對人工智能的某種狂熱就像一門新的宗教。他這樣寫道：

What it really is is a form of religion. People have called a belief in a technological Singularity the "nerd Apocalypse", and it's true.
It's a clever hack, because instead of believing in God at the outset, you imagine yourself building an entity that is functionally identical with God. This way even committed atheists can rationalize their way into the comforts of faith.
The AI has all the attributes of God: it's omnipotent, omniscient, and either benevolent (if you did your array bounds-checking right), or it is the Devil and you are at its mercy.
Like in any religion, there's even a feeling of urgency. You have to act now! The fate of the world is in the balance!
And of course, they need money!