來自麥肯錫的機器學習的指南

人工智能麥肯錫公司技術 Google 高能小子終極裝備電腦算法通用電氣人生第一份工作斯坦福大學軟件跳槽那些事兒 IBM 銀行大數據 Netflix 設計體育不完美媽媽 NBA 歐洲 CDA數據分析師 2019-07-12

CDA數據分析研究院出品，轉載須授權

它不再是人工智能研究人員和亞馬遜，谷歌和Netflix等天生的數字公司的專利。

機器學習是基於可以從數據中學習而不依賴於基於規則的編程的算法。上世紀90年代末，由於數字化和廉價的計算能力的穩步發展使數據科學家能夠停止構建成品模型，而是訓練計算機去這樣做，因此它在20世紀90年代後期成為一門科學學科。世界現在正在湧動著大量的無法管理和複雜的大數據，這增加了機器學習的潛力 - 以及對機器學習的需求。

2007年，斯坦福大學人工智能實驗室負責人李飛飛放棄了嘗試對計算機進行編程以識別物體的做法，並開始標記孩子三歲之前可能遇到的數百萬原始圖像貼上標籤並將其輸入到電腦上。通過顯示成千上萬個帶有貓的實例的圖像數據集，機器可以形成自己的規則來決定一組特定的數字像素集實際上是否是貓。去年11月，李的團隊推出了一個程序，可以高精度地識別任何圖片的視覺元素。IBM的Watson機器依賴於類似的自我評分系統，2011年在數百個潛在的答案中擊敗了世界上最好的Jeopardy節目中的選手。

儘管這些壯舉令人眼花繚亂的很，但是機器學習與人類意義上的學習完全不同。但它已經做得非常好了 - 而且會變得更好 - 它正在無情地吸收任何數量的數據和變量的各種組合。由於機器學習作為主流管理工具的出現相對較晚的，因此它常常引發一些問題。在這篇文章中，我們提出了一些我們經常聽到並以我們希望對任何高管都有用的方式進行回答。現在是解決這些問題的時候了，因為機器學習增加的商業模式的競爭的重要性正在蓄勢待發。實際上，管理學作者拉姆·查蘭（Ram Charan）表示”任何現在不是數學家、或者無法成為數學家的組織，都已經成為了一家傳統的公司。“

1.傳統行業如何利用機器學習收集新的業務見解？

好吧，讓我們從運動開始吧。今年春天，美國國家籃球協會錦標賽的競爭者依賴於加州機器學習初創公司Second Spectrum的分析。通過數字化過去幾個賽季的比賽，它創造了預測模型，讓教練能夠區分，正如首席執行官Rajiv Maheswaran所說的那樣，“一個投籃得厲害的射手和一個投籃不好的射手” - 並根據此進行調整自己的決策。

再也沒有比通用電氣公司更古老、更傳統的公司了，這是道瓊斯工業股票平均價格指數原始股中唯一一家上市119年之後依然健在的公司。通用電氣公司通過處理從深海油井或噴氣發動機收集的數據來優化性能、預測故障和簡化維護工作，從而已經賺了數億美元。但去年年底從IBM軟件中作為軟件研究的副總裁科林·帕里斯加入通用電氣公司後，認為持續的數據處理能力的提高，傳感器和預測算法的不斷進步將很快使他的公司有同樣的銳利的洞察力，谷歌目前已經進入了一個來自西好萊塢的24歲網民的在線行為。

2.北美以外的地方怎麼樣？

在歐洲，十幾家銀行用機器學習技術取代了舊的統計建模方法，在某些情況下，新產品的銷售額增長了10％，資本支出節省了20％，現金收入增加了20％，流失率下降20％。這些銀行通過為零售業和中小型公司的客戶設計新的推薦引擎，實現了這些收益。他們還建立了微目標模型，可以更準確地預測誰將取消貸款服務或造成貸款違約，以及如何最好地進行干預。

言歸正傳，正如在最近的麥肯錫季刊中的一篇文章指出，我們的同事一直嘗試將硬分析應用到人才管理的軟材料中。去年秋天，他們測試了三種算法的能力，一種有外部供應商開發，一種由內部構建，僅通過檢查掃描的簡歷，就能預測到該公司將接受的10,000多名潛在的新員工。這些預測與現實世界的結果密切相關。有趣的是，這些機器接受的女性候選人比例略高，這為使用分析來解鎖更多樣化的個人資料和對抗隱藏的人類偏見而帶來了希望。

隨著越來越多的虛擬世界被數字化，我們通過開發和測試算法從數據中學習的能力對於現在被視為傳統業務的東西變得更加重要。谷歌首席經濟學家哈爾·瓦里安稱此為“計算機改善。”因為“大規模生產改變了產品組裝的方式，持續的改進也改變了製造的方式”他說，“因此，持續（往往是自動）實驗將改善我們優化組織業務流程的方式“

3.機器學習的早期基礎是什麼？

機器學習基於許多早期構建塊，從經典統計開始。統計推斷確實形成了當前人工智能實現的重要基礎。但重要的是要認識到，經典統計技術是在18世紀到20世紀初之間發展起來的，其使用的數據集比我們現在使用的數據集要小得多。機器學習不受預設的統計假設的限制。因此，它可以產生人類分析師自己看不到的洞察力，並以更高的準確度進行預測。

最近，在20世紀30年代和40年代，計算機的先驅（例如對人工智能有深刻和持久興趣的艾倫圖靈）開始制定和修補神經網絡等基本技術，使今天的機器學習成為可能。但是這些技術在實驗室中停留的時間比許多技術都要長，並且在大多數情況下，必須等待20世紀70年代末和80年代初的強大計算機的開發和基礎設施。這可能是機器學習採用曲線的起點。引入現代經濟的新技術 - 例如蒸汽機，電力，電動機和計算機 - 似乎需要大約80年才能從實驗室過渡到你可能稱之為文化隱形的東西。計算機目前還沒有從人們的視線中消失，但很有可能會在2040年消失，機器學習可能很快就退居幕後了。

4.機器學習入門需要什麼？

如果C級管理人員將機器學習視為制定和實施戰略願景的工具，他們將最好地利用機器學習。但這意味著將戰略放在首位。如果沒有戰略作為起點，機器學習就有可能成為公司日常運營中被埋沒的工具：它將提供有用的服務，但其長期價值可能僅限於無休止地重複“千篇一律”應用，如模型獲取，激勵和客戶留存的模型。

我們發現，這與併購有相似之處並且具有指導意義。畢竟，這是一個明確定義的手段。沒有明智的企業會匆忙的進行一連串的收購或合併，然後只是坐下來看看會發生什麼。從事機器學習的公司應該在進行併購之前做出公司所做的三項承諾。首先，這些承諾是調查所有可行的替代方案; 第二，全心全意地在高管層面推行這一戰略; 第三，使用（或必要時獲得）高級管理人員的現有專業知識和知識來指導該戰略的應用。

負責創建戰略願景的人很可能（或曾經）是數據科學家。但是，當他們確定問題和戰略的預期結果時，他們需要C級同事的指導，監督其他關鍵的戰略計劃。更廣泛地說，公司必須有兩種類型的人才能釋放機器學習的潛力。“定量分析師”學習其語言和方法。“翻譯人員”可以通過將定量分析師的複雜結果重新定義為管理者可以執行的可操作的見解，從而在數據、機器學習和決策制定學科之間架起橋樑。

有效的機器學習需要獲得大量有用和可靠的數據，例如Watson在測試中能夠比醫生更好地預測腫瘤學結果，或Facebook最近成功地教會計算機，以便像人類一樣準確地識別特定的人臉。真正的數據戰略始於識別數據中的差距，確定填補這些差距所需的時間和資金，以及打破數據孤島。很多時候，各部門都在囤積數據，並將獲取信息的途徑政治化- 這是一些公司創建首席數據官這個新角色來整合所需要的信息的原因之一。其他要素包括將生成數據的責任交給一線的管理人員。

從小初招收，尋找更容易摘到的果實，並宣傳任何早期的成功。這將有助於招募基層支持，並加強個人行為和員工參與的變化，最終決定組織是否可以有效地應用機器學習。最後，根據明確的成功標準進行評估結果。

5.高層管理人員的作用是什麼？

行為改變至關重要，高層管理人員的關鍵角色之一就是影響和鼓勵這種改變。例如，傳統管理人員必須適應對自己的A / B測試方面的變化，這是數字公司使用的技術，用於瞭解對在線消費者有吸引力的內容或者說無法吸引消費者的內容。擁有越來越強大的計算機洞察力的一線管理人員必須學會自己做出更多決策，高層管理人員設定總體方向，只有在出現時才會進行關注。將分析的使用民主化 - 為一線提供必要的技能並設置適當的激勵措施以鼓勵數據共享 - 而這需要時間。

C級官員應該分三個階段考慮應用機器學習：機器學習1.0,2.0和3.0 - 或者，我們更喜歡說，描述，預測和處理。他們可能不需要擔心大多數公司已經完成的描述階段。這完全是為了收集數據庫中的數據（必須為此目的而發明），這一發展為管理者提供了對過去的新見解。OLAP-在線分析處理 - 現在已經非常常規，並且在大多數大型組織中已經建立。

現在更迫切的是要進入預測階段，而這個階段也正在發生。今天的尖端技術已經使企業不僅可以查看其歷史數據，還可以預測未來的行為或結果 - 例如，通過幫助銀行的信用風險官員評估哪些客戶最有可能違約或啟用電信公司預計哪些客戶在短期內特別容易“流失”（展覽）。

高級管理層在開始預測階段時經常關注的是數據的質量。這種擔憂經常使高管癱瘓。然而，根據我們的經驗，過去十年的IT投資為大多數公司提供了足夠的信息，以便從不完整的，凌亂的數據集中獲得新的見解，當然前提是這些公司選擇了正確的算法。與現有數據倉庫中開採的數據源相比，添加外來的新數據源可能只會帶來很少的好處。面對這一挑戰是“首席數據科學家”的任務。

處理 - 機器學習的第三個也是最先進的階段 - 是未來的機會，因此必須引起高層的高度重視。畢竟，僅僅預測客戶將會做什麼是不夠的; 只有理解為什麼他們打算這樣做，公司才能鼓勵或阻止未來的行為。從技術上講，今天的機器學習算法，在人工翻譯的幫助下，已經可以做到這一點。例如，一家關注其零售業務違約規模的國際銀行最近確定了一組客戶，他們在突然從白天使用信用卡轉為在半夜使用信用卡。這種模式伴隨著儲蓄率急劇下降。在諮詢了分行經理之後，銀行進一步發現，以這種方式行事的人們也在應對最近的一些壓力事件。因此，所有被算法標記為該微觀成員的客戶都會自動獲得信用卡的新限制並提供財務建議。

機器學習的處理階段，開創了人機協作的新時代，需要我們工作方式的最大變化。雖然機器識別模式時，人工翻譯人員的責任是將其解釋為不同的微段解釋模式，並建議相應的操作過程。在這裡，高管必須直接參與設計和指定這些算法試圖優化的目標。

6.從長遠來看，這聽起來像是自動化取代了人類。我們是否更接近於知道機器是否會取代管理人員？

確實，變革到來的如此之快（數據生成也是如此之快），以至於人與人之間的所有決策參與正在迅速變得不切實際。展望三到五年，我們期望看到更高水平的人工智能，以及分佈式自治公司的發展。這些自我激勵，自成體系的代理人以公司的形式組成，將能夠自主地實現既定目標，而無需任何直接的人為監督。一些DAC肯定會成為自編程。

一種觀點認為分佈式自治公司對我們的文化具有威脅性和敵意。但是當它們完全發展的時候，機器學習將在文化上變得隱形，就像20世紀的技術發明消失在當前的文化背景中一樣。人類的角色將是指導和指導算法，當它們實現給定的目標時。這也是在2008年金融危機期間造成這種損害的自動交易算法的一個教訓

無論計算機發現什麼新的見解，只有人力資源管理者才能決定基本問題，例如公司真正想要解決的關鍵業務問題。正如人類同事需要定期審查和評估一樣，這些“精彩的機器”及其作品也需要定期評估，改進，甚至可能被解僱或被告知要走跟之前完全不同的道路- 這需要有經驗，判斷和領域專業知識的高管。

獲勝者既不是機器，也不是人類，而是兩者有效地合作。

7.所以從長遠來看，沒有必要擔心？

很難確定，但分佈式自治公司和機器學習應該在高級管理層議程中佔據重要位置。我們期待有一個，關於什麼是智能、人工智能或其他智能的討論將會結束，因為不存在智能這種東西，它只是人類發展的一個過程。如果分佈式自治公司能過智能地行動，智能地執行並且智能地響應，我們將停止爭論是否存在除人類之外的高級智能。與此同時，我們都必須考慮我們希望這些實體做什麼，我們希望它們的行為方式，以及我們如何與它們合作。

如果你是以下幾種情況之一：

1、想了解更多大數據分析、數據挖掘、數據科學、人工智能領域的內容；

2、職業遭遇瓶頸，想提升自己在數據分析或人工智能領域的硬件技能；

3、尋求新出路、新發展，有意向轉行到數據分析行業或人工智能領域。

可點擊下面的【瞭解更多】，獲取更多有效信息和幫助！

來自麥肯錫的機器學習的指南

相關推薦