《哈佛商業評論》髮長文，談人工智能商業之路的現狀、潛力、障礙與風險……

人工智能機器學習哈佛大學網絡安全將門創投 2017-07-21

來源：Harvard Business Review

250多年來，經濟增長的根本動力一直是技術創新。其中最重要的是經濟學家所謂的通用技術——包括蒸汽機、電力和內燃機。每一個都催化了互補創新和機遇的浪潮。例如，內燃機汽車、卡車、飛機、鏈鋸和割草機，以及大型零售商、購物中心、交叉碼頭倉庫、新供應鏈等。像沃爾瑪Walmart、UPS和Uber等公司都找到了利用技術來創造可贏利的新業務模式的方法。

我們這個時代最重要的通用技術是人工智能（AI），尤其是機器學習（ML）——也就是說，機器有能力不斷提高性能，而無需人工解釋如何完成它所提供的所有任務。在過去的幾年裡，機器學習變得更加有效和廣泛。我們現在可以構建學習如何自己執行任務的系統。

為什麼這是一件大事呢？有兩個原因。

首先，人類知曉的事物比我們能表述出來的要多得多：我們無法確切地解釋我們如何能夠做很多事情。在應用機器學習的方法之前，由於這方面的缺陷意味著我們無法使很多任務自動化。現在我們可以了。

其次，機器學習系統通常是優秀的學習者。他們可以在廣泛的活動中實現超人的表現，包括檢測欺詐和診斷疾病。這類優秀的數字學習者正在被部署到整個經濟中，他們的影響將是深遠的。

在商業領域，AI將對早期通用技術的規模產生革命性的影響。儘管它已經在世界各地數千家公司中使用，但還有大量的機會還在等待被髮掘。隨著製造業、零售業、交通、金融、醫療、法律、廣告、保險、娛樂、教育、以及幾乎所有其他行業都正在利用機器學習技術來轉變其核心流程和商業模式，AI的影響將在未來十年被放大。現在的瓶頸在於管理、實施和業務暢象。

然而，與其他許多新技術一樣，人們對AI也產生了許多不切實際的期望。我們看到很多創業公司的BP中開始加入很多關於機器學習、神經網絡和其他形式的技術，雖然這和實際功能沒有什麼聯繫。例如，把一個約會網站包裝成AI在背後支持的並不會讓它變得更有效，但在融資上卻可能會有很大幫助。本文希望拋開圍繞在AI周圍的噪聲，來向大家展示AI的真正潛力、它的實際意義，以及AI實際應用中的障礙。

今天AI可以做什麼？

AI這個詞是在1955年由達特茅斯大學的數學教授John McCarthy提出的，他在次年組織了這個主題的開創性會議。從那以後，或許是由於這個令人回味名字的原因，這個領域的發展遠遠超過了人們的想象。1957年，經濟學家 Herbert Simon 預言計算機將在10年內擊敗人類（實際上花了40年）。1967年，認知科學家Marvin Minsky說，“在一代人的時間內，人工智能的問題將得到極大的解決。” Simon和Minsky都是智力巨人，但顯然他們都錯了。

我們先來看看AI已經在做什麼，以及這個領域的進展有多快。最大的進展來自於兩大領域：感知（perception）和認知(cognition)。在前一類中，最前沿的進展大部分是和語音相關的。語音識別還沒有達到完美，但現在有數百萬人已經在使用它們了——想想Siri、Alexa和Google Assistant。你現在正在閱讀的這篇文章最初是由我們口述給計算機的，已經比我們自己打字更快了。斯坦福大學計算機科學家James Landay和他的同事進行的一項研究發現，語音識別的速度大約是手機上打字速度的三倍。語音識別的錯誤率已經從過去的8.5%，下降到4.9%了。令人驚訝的是，這種實質性的進步並非在過去10年，而是從2016年夏天開始。

圖像識別領域的進展也讓人驚歎。你可能已經注意到，Facebook和其他app現在已經能從你上傳的圖片中識別出你的朋友，並提示你用他們的名字來標記他們。在你的智能手機上運行的app可以識別任何野生鳥類。圖像識別甚至取代了公司門禁卡。自動駕駛汽車中所使用的視覺系統，在識別一個行人的時候，通常會在30幀中出現一次錯誤（在這些系統中，相機記錄大約每秒30幀）;而現在，它們的錯誤頻率要少於1千萬幀。ImageNet這個大型數據庫中識別圖像的錯誤率，已經從2010年的30%下降到了2016年的4%。

近年來，隨著大規模深度神經網絡的使用，AI領域的進展日新月異。當然，目前基於機器學習的視覺系統還遠遠沒有完美無缺——但即使是人也不是無所不能的嘛。

AI領域第二類的主要進步是集中在認知和問題解決方向。機器已經打敗了最優秀的(人類)撲克玩家和圍棋選手——雖然原來專家們預測至少還要再過十年。谷歌的DeepMind團隊使用了機器學習系統來提高數據中心的冷卻效率提升了15%。像Paypal這樣注重網絡安全的公司也正在用AI來檢測惡意軟件。由IBM技術支撐的系統使得新加坡一家保險公司的索賠過程進入了自動化。數十家公司正在使用機器學習來幫助進行金融交易決策，而且越來越多的信貸決定是在AI幫助下做出的。亞馬遜採用機器學習來優化庫存，並提升給客戶的產品推薦。Infinite Analytics公司開發了一個機器學習系統來預測用戶是否會點擊某個特定的廣告，為一家全球消費包裝產品公司的在線廣告位置進行了優化。另一個開發的系統幫助巴西的一家在線零售商改進客戶的搜索和發現過程。第一個系統將廣告的ROI提升了三倍，而第二個系統使得年收入增加了1.25億美元。

機器學習系統不僅在許多應用中取代了舊有的算法，而且在許多曾經被人類做得最好的任務上也佔盡先機。儘管這些系統並不完美，但它們的錯誤率已經表現比人類更好了。語音識別，即使在嘈雜的環境中，現在也幾乎等同於人類的表現。這為改變人們的工作和經濟帶來了巨大的新可能性。一旦基於AI的系統在給定的任務中超過人類的表現，它們就更有可能迅速傳播。例如，Aptonomy和Sanbot，這兩家分別是無人機和機器人的製造商，他們正在使用改進的視覺系統來自動化大部分保安人員的工作。軟件公司Affectiva使用它們來識別諸如快樂、驚訝和焦點小組的憤怒等情緒。Enlitic是幾家利用AI來識別醫療影像，進而幫助診斷癌症的深度學習的初創公司之一。

這些成果都令人印象深刻，但是基於AI的系統的適用性仍然相當狹窄。例如，既然AI在擁有數百萬圖片的ImageNet數據庫上表現出色，也並不總能在現實環境中取得同樣的成功。因為在現實世界裡，光線條件、角度、圖像分辨率和背景可能會非常不同。更重要的是，如果人類完成了一項任務，我們會很自然地假設此人在相關任務中具有一定的能力。但是，機器學習系統是被訓練來完成特定的任務，因此通常他們的知識不會泛化。我們離那些能在不同領域展現通用智力的機器還非常遙遠。

理解機器學習

要理解機器學習，最重要的一點是它代表了一種從根本上與以往不同的創建軟件的方法：機器從示例中學習，而不是明確地為特定的結果編程。這是一個重大突破。在過去50年的大部分時間裡，信息技術的進步和它的應用都集中在編纂現有的知識和程序，並將它們嵌入到機器中。實際上，術語“coding”表示將知識從開發人員的頭腦中轉移到機器能夠理解和執行的形式的艱苦過程。這種方法有一個根本的問題：我們所有的知識都是隱性的，這意味著我們無法完全解釋它。我們幾乎不可能寫出能讓另一個人學會騎自行車或認出朋友臉的指令。

換句話說，我們知道的比我們能講出來的東西要多。這個事實非常重要，它被稱為：Polanyi悖論。Polanyi悖論不僅限制了我們能告訴別人的東西，而且對我們賦予機器智能的能力是一個根本性的限制。很長一段時間，這限制了機器在經濟中能夠有效發揮作用的活動。

機器學習正在克服這些限制。在第二個機器時代的第二次浪潮中，由人類製造的機器正在從例子中學習，並利用結構化的反饋來解決他們自己的問題，如Polanyi經典的識別人臉的問題。

機器學習的不同風格

人工智能和機器學習有許多種方式，但近年來的大多數成功都是在一個類別：監督學習系統。在這裡，機器被給予了很多正確答案的例子。這個過程幾乎總是涉及從一組輸入X，到一組輸出Y的映射。例如，輸入可能是各種動物的圖片，正確的輸出可能是這些動物的標籤：狗，貓，馬。輸入也可以是聲音錄音的波形，輸出可以是文字：“是的”，“不”，“你好”，“再見”。

成功的系統通常使用一組數據的訓練集，有成千上萬甚至上百萬個例子，每一個都被貼上正確的答案。然後，可以放任系統去看新的示例。如果訓練進行得很好，系統將會以很高的準確度來預測答案。

推動這種成功的算法依賴於一種叫做深度學習的方法，這種方法使用神經網絡。深度學習算法比早期的機器學習算法有很大的優勢：它們可以更好地利用更大的數據集。隨著訓練數據中的示例數量的增加，舊系統將會得到改進，但這只是在一定程度上，在此之後，額外的數據不會帶來更好的預測。根據AI巨頭之一的Andrew Ng，深度神經網絡似乎並沒有達到這樣的水平：更多的數據會帶來更好的預測。一些非常大的系統通過使用3600萬個例子或更多。當然，處理非常大的數據集需要越來越多的處理能力，這是非常大的系統經常在超級計算機或專門的計算機架構上運行的原因之一。

不論你是在何種場景下擁有很多關於行為的數據並試圖預測結果，都有可能用到監督學習系統。亞馬遜負責消費者業務的Jeff Wilke說，監督學習系統基本上取代了用於向客戶提供個性化推薦的基於記憶的過濾算法。在其他情況下，建立庫存水平和優化供應鏈的經典算法已經被基於機器學習的更高效和健壯的系統所取代。摩根大通推出了一套審查商業貸款合同的系統，過去以貸款計36萬小時的工作現在可以在幾秒鐘內完成。監督學習系統現在被用於診斷皮膚癌。這些只是一些例子。

給一個數據體貼上標籤，用它來訓練一個受監督的學習者是相當簡單的；這就是為什麼監督的機器學習系統比沒有監督的系統更常見，至少現在是這樣。無人監督的學習系統尋求獨立學習。我們人類是優秀的沒有監督的學習者：我們掌握了我們對世界的大部分知識(例如如何認識一棵樹)，很少或沒有標記的數據。但是要開發一個成功的機器學習系統是非常困難的。

如果我們有朝一日建立了穩健的無人監督學習機器，將會打開一扇新世界的大門。這些機器可以用新的方式來研究複雜的問題，以幫助我們在自己還沒意識到之前，就發現了其中的傳播模式，比如疾病的傳播，市場上的證券價格變動，顧客的購買行為等。為此，Facebook的人工智能研究主管、紐約大學教授Yann LeCun將監督學習系統生動的比作蛋糕上的糖霜，無監督學習則是蛋糕本身。

在這個領域內另一個小眾但發展快速的領域是強化學習（reinforcement learning）。這種方法嵌入到已經掌握了Atari技能的視頻遊戲和棋類遊戲的系統中。它還有助於優化數據中心的電力使用情況，併為股票市場制定交易策略。Kindred使用機器創建的機器人能夠識別和分類他們從未遇到過的對象，加快了在配送中心對消費品進行“挑選和放置”的過程。

在強化學習系統中，程序員指定系統的當前狀態和目標，列出允許的操作，並描述約束每個動作的結果的環境元素。使用允許的操作，系統必須弄清楚如何儘可能接近目標。當人類能夠明確目標但卻不知道如何達到目標時，這些系統就能正常工作。例如，微軟利用強化學習，通過“獎勵”這個系統來為MSN.com的新聞故事選擇標題，當更多的訪問者點擊鏈接時，這個系統會得到更高的分數。該系統試圖根據設計者給出的規則來最大化其分數。當然，這意味著一個強化學習系統將對你明確獎勵的目標進行優化，但這也有可能並不是你真正關心的目標(如終身客戶價值)，因此正確明確目標和明確的目標是至關重要的。

讓機器學習工作起來

對於希望將機器學習儘快應用起來的公司來說，有三個好消息。首先，人工智能技術正在迅速蔓延。世界上仍然沒有足夠的數據科學家和機器學習專家，但是對他們的需求正在被在線教育資源和大學所滿足。其中最好的，包括Udacity、Coursera和fast.ai。人工智能已經不僅僅是一個書上的概念，已經可以讓聰明的、有潛力的學生們達到能夠創建工業級的機器學習算法部署的目的。除了培訓自己的員工之外，感興趣的公司還可以使用在線人才平臺，如Upwork、Topcoder和Kaggle，來尋找具有可驗證的專業知識的機器學習專家。

第二個可喜的發展是，現代人工智能的必要算法和硬件可以根據需要購買或租用。谷歌、亞馬遜、微軟、Salesforce和其他公司正在通過雲計算提供強大的機器學習基礎設施。這些競爭對手之間的激烈競爭意味著，那些想嘗試或部署機器學習算法的公司將會看到越來越多的功能隨著時間的推移而不斷降價。

最後一個甚至仍有可能被低估的好消息是，有效使用機器學習算法所需要的數據可能沒有你想象的那麼多。大多數機器學習系統的性能提高,因為它們有更多的數據。所以擁有的數據越多，勝出的可能越大，這在邏輯上是行得通的。如果“贏”的意思是“在全球市場上主導某一應用領域，例如廣告定位或語音識別”，那確實沒毛病。但如果將“成功”定義為顯著提高性能，那麼獲得足夠的數據其實是非常容易的。

例如，Udacity聯合創始人Sebastian Thrun注意到，他的一些銷售人員在回答聊天室的入站問題時，比其他人更有效。Thrun和他的研究生Zayd Enam意識到他們的聊天室日誌實際上是一組標記的訓練數據——這正是監督學習系統需要的。導致銷售的交互作用被標記為成功，所有其他的都被標記為失敗。Zayd利用這些數據來預測成功銷售人員在回答一些非常常見的問題時可能給出的答案，然後與其他銷售人員分享這些預測，以推動他們更好的表現。經過1000次的培訓，銷售人員的工作效率提高了54%，並且一次能服務兩倍的顧客。

AI初創公司WorkFusion採用了類似的方法。它與其他公司合作，將更高的自動化水平引入後臺流程，例如支付國際發票和在金融機構之間進行大型交易。這些過程還沒有自動化的原因是它們很複雜，相關的信息並不總是每次都以同樣的方式呈現——我們怎麼知道他們在說什麼貨幣，並且有必要進行一些解釋和判斷。WorkFusion的軟件在人們工作時觀察他們的一舉一動，並將其作為訓練數據用於分類的認知任務：“這張發票是美元的，這個是日元。這是歐元……一旦系統對其分類有足夠的信心，它就會接管整個過程。

機器學習在三個層次上驅動變化：工作任務和職位、業務流程和業務模型。工作和職業被重塑的一個例子是使用機器視覺系統來識別潛在的癌症細胞——釋放放射科醫生以專注於真正的關鍵病例，與病人溝通，和與其他醫生協調。影響業務流程的一個例子是，在引入機器人和基於機器學習的優化算法之後，重新設計了Amazon實現中心的工作流和佈局。類似地，業務模型需要再優化，以利用可以智能化地推薦音樂或電影的機器學習系統。與其在消費者選擇的基礎上銷售歌曲，一個更好的模式可能會為一個個性化的電臺提供訂閱服務，這樣可以預測並播放特定顧客喜歡的音樂，即使這個人以前從未聽過。

但要注意的是，機器學習系統是無法完全代替這個職位、流程或業務模型的。大多數情況下，它們是對人類活動的補充，使他們的工作變得更有價值。對於新的勞動分工來說，最有效的規則很少是“把所有的任務交給機器”。相反，如果一個過程的成功完成需要10個步驟，其中一個或兩個步驟可能會自動完成，而其餘的則會變得更有價值。例如，Udacity的聊天室銷售支持系統並沒有試圖構建一個能夠接管所有對話的機器人；相反，它向銷售人員提供瞭如何提高性能的建議。人類仍在掌控中，但變得更加有效和高效。這種方法通常比設計能夠完成人類所有操作的機器更可行。它通常會帶來更好的、更令人滿意的工作，最終為客戶帶來更好的體驗。

設計和實施新的技術、人類技能和資本資產組合，以滿足客戶的需求需要大規模的創意和計劃。這就是一個機器不擅長的任務。這就使得企業家或商務經理成為了社會最具回報價值的工作之一。

風險和侷限

第二個機器時代的第二波浪潮帶來了新的風險。特別是，機器學習系統通常具有較低的“可解釋性”，這意味著人類很難弄清楚系統是如何做出決定的。深層神經網絡可能有幾億的連接，每一個都貢獻了一點點的最終決定。因此，這些系統的預測往往會抵制簡單而清晰的解釋。與人類不同，機器還不是很好的故事講述者。他們不能總是給出一個理由，說明為什麼某個特定的申請人被錄用或被拒絕了，或者推薦了一種特殊的藥物。具有諷刺意味的是，即使我們已經開始克服Polanyi的悖論，我們也面臨著另一個版本：機器知道的比它們能告訴我們的更多。

這將帶來三個風險。首先，機器可能有隱藏的偏見，不是來自設計者的任何意圖，而是來自提供給系統的數據。舉個例子，如果一個系統瞭解到哪些求職者在面試中使用了過去招聘人員所做的一系列決定來接受面試，那麼它可能會無意中學會將他們的種族、性別、種族或其他偏見延續下去。此外，這些偏差可能不會作為一個明確的規則出現，而是被考慮到成千上萬個因素之間的微妙交互中。

第二個風險是，與傳統的基於顯式邏輯規則的系統不同，神經網絡系統處理的是統計學上的真理，而不是真實的事實。這可能會使證明系統在所有情況下，尤其是在沒有在培訓數據中表示的情況下工作很難，甚至不可能。缺乏可驗證性對於任務型的應用場景是一個問題，例如控制核電站，或者涉及生死抉擇。

第三，當機器學習系統確實出現錯誤時，幾乎不可避免地會出現錯誤診斷和糾正錯誤。導致解決方案的底層結構可能是難以想象的複雜，如果系統被培訓的條件發生變化，那麼解決方案可能會遠遠不夠理想。

儘管所有這些風險都是真實的，但適當的標準不是為了定義完美，而是最好的選擇。畢竟，我們人類也有偏見、犯錯誤，並且很難如實解釋我們是如何做出一個特定的決定的。基於機器的系統的優點是，它們可以隨著時間的推移得到改進，並在提供相同數據時給出一致的答案。

這是否意味著人工智能和機器學習能做到一切事情？感知和認知涵蓋了大量的領域——從駕駛汽車到預測銷售，再到決定僱傭誰或提拔誰。我們相信，人工智能在大多數或所有領域的性能將很快達到超人水平。那麼什麼是AI和ML做不到的呢?

我們有時會聽到“人工智能永遠不會擅長評估感性、狡詐、善變的人類，它太死板、太沒人情味了”等類似的抱怨。但我們不以為然。像Affectiva這樣的機器學習系統，在以聲音或面部表情為基礎來辨別一個人的情緒狀態時，已經達到或超越了人類的表現。其他系統可以推斷出，即使是世界上最好的撲克玩家也能在令人驚訝的複雜遊戲中擊敗他們。準確地閱讀人們是一件很微妙的工作，但這不是魔法。它需要感知和認知——確切地說，現在的機器學習是強大的，並且一直變得更強大。

討論人工智能的極限可以從畢加索對計算機的觀察出發：“但它們是無用的，只能給你答案。”它們當然不是一無是處，正如機器學習最近的勝利所彰顯的那樣，但畢加索的觀察仍然提供了參考。電腦是用來回答問題的裝置，而不是用來造問題的。這意味著企業家、創業者、科學家、創造者和更多的人，他們都要想，下一步要解決的問題是什麼，或者有什麼新領域要探索，這將是至關重要的。

同樣，被動地評估一個人的精神狀態和積極努力去改變它，兩者之間有著巨大的差異。機器學習系統在前者上表現驚人，但後者要想趕超人類需要進步的空間還很大。我們人類是一個非常社會化的物種，我們不是機器，最擅長利用諸如同情、自豪感、團結和羞恥等社會驅動力來說服、激勵和感染彼此。2014年，TED大會和XPrize基金會宣佈設置一個獎項以期待，“第一個人工智能來到這個舞臺，給一段同樣富有感染力的TED演講，讓觀眾起立為其鼓掌”。估計這個獎項很快就要被捧回家了。

我們認為，在這個超級強大的人工智能的新時代裡，人類智慧的最大和最重要的機遇在於兩個領域的交叉點：找出下一步要解決的問題，並說服許多人去解決問題，並廣泛應用。這是對領導力的一個很好的定義，在第二個機器時代，領導力變得更加重要。

在頭腦和機器之間劃分工作的現狀很快就會瓦解。與那些願意並且能夠把機器學習放在適當的地方，並能找出如何有效地將其功能與人類的能力集成起來的競爭對手相比，故步自封的公司將很快發現自己會出去前所未有的劣勢和被動中。

商業世界的構造變革時代已經開始，由技術進步帶來。就像蒸汽動力和電力一樣，它本身也無法獲得新技術，甚至無法進入頂尖技術人員，將贏家和輸家區分開來。相反，它是那些思想開放的創新者，能夠看到過去的現狀，並設想出截然不同的方法，並且有足夠的悟性把它們放在合適的位置。機器學習的最大遺產之一可能是創造新一代的商業領袖。

在我們看來，人工智能，尤其是機器學習，是我們這個時代最重要的通用技術。這些創新對商業和經濟的影響不僅反映在他們的直接貢獻上，也體現在他們能夠支持和鼓勵互補創新的能力上。通過更好的視覺系統、語音識別、智能問題解決以及機器學習帶來的許多其他功能，新產品和新工藝正在成為可能。

一些專家甚至走得更遠。現在負責豐田研究機構的Gil Pratt將目前的人工智能技術與5億年前的寒武紀大爆發相比較，那就是誕生了各種各樣的新生命形式。就像現在一樣，關鍵的新功能之一就是視覺。當動物第一次獲得這種能力時，它允許它們更有效地探索環境;這就催化了物種數量的大量增加，包括捕食者和獵物，以及被填滿的生態龕的範圍。今天，我們還希望看到各種各樣的新產品、服務、流程和組織形式，以及大量的物種滅絕。當然也會有一些驟然失敗和意想不到的成功。

雖然很難準確預測哪些公司會在新環境中佔據主導地位，但一般原則是明確的：最靈活、適應性強的公司和執行力將會發展壯大。在AI驅動的時代，任何對趨勢敏感且能快速反應的團隊都更應該抓住這次好機會。因此，成功的策略是願意嘗試並快速學習。如果職業經理人們沒有在機器學習領域增加實驗，他們就沒有在做他們的工作。未來十年，人工智能不會取代管理人員，但使用人工智能的經理將取代那些不使用人工智能的人。

-END-

-----本週將門技術社群分享預告-----

▼

將門招聘

將門創投正在招募編輯、運營類全職/實習生崗位，工作地點在北京三元東橋附近，期待熱愛技術的你到來，和我們一起見證技術創新的傳奇！

歡迎發送簡歷至>>[email protected]

將門是一家專注於發掘、加速及投資技術驅動型創業公司的創業服務和投資機構。

將門創業服務專注於為技術創新型的創業公司連接標杆用戶和落地行業資源。

將門技術垂直社群專注於幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容。

將門投資基金專注於投資通過技術創新激活商業場景，實現商業價值的初創企業。關注領域包括：機器智能、物聯網、自然人機交互、企業計算。

獲取將門投資>>[email protected]