關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

本週六(7.15)CSDN學院舉辦了一次非常火爆的沙龍,對於這次沙龍的演講主題,三位資深老炮:極客幫創始合夥人 & CSDN創始人蔣濤,CSDN副總裁孟巖,魯朗軟件(北京)有限公司聯合創始人智亮跟現場眾多程序員們聊了聊開發者轉型的事兒:機會在哪,轉型中會遇到的哪些問題,技術實操等。

為了方便大家學習,我們精心整理了本次沙龍的嘉賓演講。另外,你也可以在微信公眾號會話中回覆“沙龍”,下載本次分享嘉賓(蔣濤、孟巖和智亮老師)的演講PPT。

演講 | 蔣濤,孟巖,智亮

整理 | 蘇靖芝,鴿子

Part 1 蔣濤:AI時代,B端比C端更有機會

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

這幾年我也在做投資,從一個比較宏觀的角度給大家講一下,就是說為什麼人工智能這麼重要。

上上週,百度開了一個開發者大會,叫Create大會,是由史以來中國最像開發者大會的開發者大會。

為什麼像開發者大會?

因為有很多大會打著開發者大會的名義,其實都是在推銷自己的東西,並沒有真正提供給開發者實際的資源。

第二個也沒有建立所謂的開發者生態,因為我們開發者生態都是建立在國外的公司的基礎上。

百度這場會含義還是非常深的,也是陸奇去作為百度的二號人物,第一次大的亮相,他講了一句話:未來屬於創作者,AI的未來屬於開發者,開發者成功才是百度真正的成功,這句話有一定的邏輯關係,我後面給大家解讀一下,為什麼開發者變得這麼的重要,然後AI為什麼成為百度的一個重要的基石。

PC時代回顧

首先讓我們來回顧一下歷史。

歷史上,最大的開發者大會是微軟1992年開的,為什麼?

因為這是PC時代,PC時代最核心的是入口就是操作系統,或者是Windows的桌面,它是建立在X86因特爾的芯片技術上。圍繞著這個,我們才有了PC時代,也誕生了開發者的時代。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

他們為開發者做了什麼東西?

在PC時代,我們看最大的一個公司,出現了幾類:

一個是行業,公司百億級別,如IBM,Oracle,SAP,他們為企業提供信息化的軟件和工具,包括數據庫、ERP,還有做外包,因為各個行業都需要信息化。

另外一個就是C端的業務,服務個人。在個人市場只產生了兩類大的公司:

一類是做遊戲的,暴雪公司,EA,這是PC遊戲行業,也是非常大的一個產業。

還有一類是工具廠商,如圖像工具Adobe。

移動互聯網時代

接著我們迎來了移動互聯網時代,大家都開始找入口,一開始是門戶,後來發現不是門戶。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

比如,一開始最厲害的是新浪,三大門戶,還有網易。

後來隨著時間的發展,發現最重要的入口是搜索引擎。谷歌和百度等掌握了絕大部分流量的分發權。

電商也是很大一塊入口。比如淘寶,58同城,大家一般都直接去到淘寶,而不是用百度搜索,因此不會被百度卡了脖子。

這是整個PC互聯網的發展,這時候我們開發者在做什麼呢?

他們在建立各種各樣的網站,但是你的網站呢,很重要一點是要服務這些C端的用戶。

第二個,可能要做好跟搜索引擎之間的關聯。

這是PC互聯網,到了移動互聯網,才是一個開發者大顯身手的時候。

到了移動互聯網時候,入口變成了APPSTORE,就是說你做一個應用,原來是關健詞搜索,現在是你的應用名字比較重要,你的應用名字能不能在用戶之間建立它的認知。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

微信作為一個巨大的入口,對開發者沒起什麼作用,倒是對內容起到一個巨大的作用,不少內容生產者立足微信做創業。

因為PC互聯網跟人的連接還是比較遠一點,而手機是隨身攜帶的,因此移動支付發展起來。

跟生活比較貼近的,如做天氣的APP,也發展得很好,因為它跟生活連在一起,就可以接入更多的服務。

現在APP已極大豐富,APPSTORE上有150萬個APP,你現在需要分走用戶的注意力比較難了,基本上能做的都被大家做了一遍。

第二個用戶沒有增長了,獲得新用戶的成本越來越高。

這是整個APP移動互聯網時代。

AI時代

今天什麼百度要提出這麼一個戰略?

因為百度發現,它在移動互聯網的時候抓瞎了,因為它不是入口,入口變成APPSTORE、變成微信,變成小米手機,手機成為一個入口,還有應用寶商店,騰訊開了個應用寶,百度買了個91也不是很成功,所以在移動互聯網上,百度就Miss掉。

Miss掉以後,O2O戰略也不是很成功,這次他們下了很大的決心要做AI的OS,做AI的生態。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

那AI的OS是什麼呢?

以後所有的東西都要和互聯網連接。攝像機可以連網,攝像機帶人臉識別。攝像機識別以後,怎麼跟你互動呢?

百度提了一個口號叫喚醒萬物,你說Hello索尼攝像機,它就知道是在叫它。這個大概三年內就會發生,這就是說,語音會作為一個入口。

有了入口以後,後面是什麼?

你把它喚醒了,它得和你進行交互,它得有算法在背後,而這個算法是要靠大量的硬件驅動。

百度認為,未來的每個行業,每個硬件都可能變智能,而智能化一定要有一個核心的OS來驅動它,所以這就是一個是入口。

但是現在這個生態剛剛開始,機會在哪裡呢?

第一個你要做C端的應用,還是很有挑戰的,因為現在做人工智能的應用,要有數據,沒有數據你的算法就沒有辦法做出精確度。

那麼數據在哪?

數據都在BAT手上,他們有大量的數據,有一大堆C端的公司,他們每天都產生大量的數據,餓了嗎,滴滴,摩拜等。有了信息,他就能判斷你的意圖。比如,現在亞馬遜在美國就能根據你過去的購買記錄,預測你會喜歡什麼樣的書,於是它會提前把書送到你家。你回家就能看到5本新書,想看就留下,不想看就退。

所以在C端,實際上我們的機會就不是很大了,因為這些公司手上的數據太大了。其實在B端,AI時代產業B端佈局會比移動互聯網更大。

AI時代,B端機會更大

為什麼這麼說B端機會更大呢?

我來詳細解釋一下。

移動互聯網大量解決的是C端的問題,而B端有很多問題沒有解決,B端也面臨巨大的變革,他們做了第一步的信息化,但是他們沒有把業務進行重構,但是人工智能來了以後,會有一個非常大重構的機會。

這其中最大的重構就是無人駕駛汽車,這是一個上萬億美金的市場,圍繞著它配套的產業,光售後就有八千億,如果汽車都變成無人駕駛了,現有的很多服務都會瓦解。

所以我們看到有很多大的公司在這裡面下重注。

這是從投資角度看到的一個非常大的機會。

深度學習可以做什麼

那從整個產業的角度,人工智能為什麼現在變得這麼熱?

當然第一個原因是阿法狗在去年打敗了李世石。

實際上,真正歷史性的轉折點在2012年。

在2012年Imagenet比賽中,深度學習的使用,將識別錯誤率大大降低,引起了人們的關注。也就是說,原來人工智能技術被一道牆堵住了,過不去,進步很小,但是採用深度學習後,這個牆相當於被鑿開了一個窟窿。下圖中紫色代表採用深度學習,藍色代表傳統方式,可以看出其中的跨越式的變化。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

如下圖,計算機採用深度學習可以做到精確的識別,把這張圖描述出來。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

我們常說代碼時代結束了,其實它指的不是所有代碼,而是原來我們是用各種各樣的規則和技術,現在可以用深度學習,用神經網絡來建立模型,用以取代原來人工設立的規則。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

這是很大的一個不同,而且這個技術不是說只是用在識別領域,它可以用在非常多,以及看起來很小的領域。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

這是Google發佈的數據源,展示出自己內部哪些項目用到了深度學習。

從2012年開始,他們就開始用,一開始幾個項目,到2015年Q3已經有1200個項目使用深度學習。到2016年,已經有2700個。目前Google內部的所有項目,80%以上都用到了深度學習來改進。

比較小的地方,大家意想不到的地方,比如做縮略圖的時候作,同比例放縮就看不清楚人了,所以用深度學習技術來改進。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

如上圖,圖片裡有人頭,當你同比例縮小的時候,就有點看不清了,不方便瀏覽。於是,我就可以用深度學習來識別頭像,以此在縮放的時候,做一個調整,讓人像看起來吐出一些方便查找。

還有做壓縮,利用這個技術,還可以再壓縮30%,因為機器會學習,知道哪裡更重要,壓縮的時候主要內容保持質量,其他次要內容進一步壓縮。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

現在我們已經進入到新應用時代。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

圖片上這個人是深度學習的網紅,原來在Open AI,剛剛跳槽到特斯拉做無人駕駛的首席科學家。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

他曾經拿托爾斯泰的作品來做一個學習,用機器去模擬,程序只有幾百行,但就能讓機器創造出來作品,雖然還達不到托爾斯泰的水平。

很多行業,都面臨著這個巨大的挑戰。

圍棋行業已經被顛覆了,後面還有律師、金融,包括程序員,美國已經有不只一家公司做自動化編程,取代程序員的一部分工作。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

上圖是調用了Google的API做識別,這個人是斯坦福機器人研究室的一個博士,花一百美金左右買了這些設備,就做出來原來需要花50萬美金的東西。這說明什麼,說明智能應用時代是真的來臨了。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

這是來自YC的分析圖。從上圖可以看出,學術界的突破在2012年,從2014年起進入創業高峰期,2017年進入爆發期。

AI現在被我們捧得非常熱,但是要很好地解決我們實際面臨的困難和問題,達到大家期望,還需要經歷一個過程,我們把它分三個階段。

AI發展的三個階段

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

目前還是算法紅利期。現在大家都下重注去挖算法的優秀人才,年薪開到上千萬美金,這是一個優秀算法掌舵的時代。

學術界的進步對我們非常重要,因為論文的一個突破就可能帶來技術上應用上的一個大突破,一個快速發展期。

不過這個階段很快會穩定下來,變成局部很小的改進,不再是大的突破。

這之後是工程技術期,會在2到3年後到來,這個時期就可以真正去做出各行各業的應用,而且對這些行業會產生比較大的價值。

再後面才是平臺,誰擁有最多的數據,誰就擁有最大的商業資源,誰就更強大。

我記得我很早時,跟微軟談事的時候,他們內部就說過,我們公司沒有10億美金以上收入的項目,都不會列入我們的計劃。但是無人駕駛他們是可以殺進去的,這是一百億一千億的市場,但是我們可以在很多行業都找到這樣的機會往裡去切入,但是等到這個市場變得非常巨大的時候,你不一定打得過平臺,或者你要先把這個平臺要做的事做好,才有空間。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

現在AI是同樣的情況,我們可以調用誰呢?

Google是在這個領域做得最好,百度是目前最大,我把他們做了個對比,開放的能力大家可以去看一下,包括百度推的語音喚醒,Google現在還沒有。視頻內容比較分析,就是一個視頻封面,我剛才講,你怎麼去選視頻裡面的哪一幀,作為你封面的展示頁,百度也把它公佈出來了,這些都是他們很大的積累了。

所以呢,這些技術的豐富,包括框架的成熟,就像安卓1.0時代,2.0時代,也不太成熟,我大概是3.0參加了Google IO大會,那時候才有了點氣象,也不是像現在這樣,安卓一定會勝利,大概是在4.0的時候會確定。

AI時代,我們要做什麼

那順便說說我們最近在做些什麼。

最近花了很大的精力在組建我們自己的AI社區——AI100,其中媒體公眾號為AI科技大本營。它可能是個升級的CSDN,或者升級版的社區。一方面我還要把工程師、專家聚集起來,為他們提供內容,交流的平臺。第二方面,把行業的資源帶入進來。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

正如剛才所說,我們的基本判斷是說C端的應用可能沒有那麼大機會,而B端有太多的事情可以做。所以,一開始,你馬上切入核心業務也很難,一個是說,它固有的模式不容易馬上變化;第二個是說,你也不知道從哪去切入。

所以我們現在跟這些行業分別做一些合作,把他們的數據集,它內部的商業需求和項目開放出來,甚至呢,提供相應的資金,這資金可能是作為一個項目的資金,也可能作為一個比賽的獎金。

比如說最近的一個比賽就是智能電視的項目,智能電視記錄對於你看多長時間,怎麼切換過去的信息,都可以記錄下來,那我們用這個來做一個收視率的預測。

包括醫療行業、教育行業等都在給我們提供數據。因為對這些公司來說,你是願意自建一個研發的團隊,或者AI的研究院嗎?不會,成本非常昂貴,且不一定能做的出來,所以還是通過我們這樣一個新的AI社區的平臺來做更省錢省力。

通過AI社區的平臺,一方面我們能夠做更多的嘗試,一方面也能發現更多的人才,這是我們CSDN下面要做的一件主要的事情。

我們要做的是將工程師、技術和產業真正連接起來。

對工程師來說,你的成長最終是要做市場應用,這才是真正的成長。你學了這些AI,人工智能,圖像識別,語音識別,我們能夠給你找到應用的場所。

總結來說,我們做AI100有兩點。

第一、人才的增長。假設現在有一千萬名工程師,7年之內,中國應該有10%-20%的人要成為AI的工程師。

第二、每個行業都會變成一個以技術驅動和數據驅動來引領。對於企業來說,一定要了解數據在公司裡面到底該怎麼去應用。現在互聯網公司有數據,但很多行業還不夠智能,沒有數據,因此我們也希望幫助三十萬家企業走向智能化。

Part 2 孟巖:人工智能的泡沫與啤酒

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

1. 人工智能產業有沒有泡沫?

著名財經作家吳曉波最近發表了一篇文章,《為什麼新科技的風口總火不過一年》,在文章中引用了Garner技術發展曲線,他認為人工智能目前處在第一波峰的頂點,那麼很顯然,馬上就會面臨泡沫的崩潰。如果他的判斷是正確的,那麼這將是第三次人工智能的泡沫破滅。

作為財經作家,吳曉波非常的博學,而且也特別的聰明,他能夠很快的從一個現象當中抓住足以引爆輿論的點。但從專業角度分析的話,這個判斷有問點題。從這幅圖上來看,無人機、機器人和物聯網已經開始爬坡了。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

那問題來了,如果無人機、機器人和物聯網即將邁上迅速成長的階梯,你怎麼可能想象人工智能會崩潰呢?因為無人機,機器人本身就是人工智能的應用平臺,而物聯網則是大數據的最大來源,會有力的推動人工智能的發展。大家要理解,在無人機、機器人、物聯網這樣的技術浪潮當中,人工智能將扮演很重要的角色。

所以我直接說我的觀點,人工智能目前沒有泡沫。

具體的分析一下。

第一,本輪人工智能技術的紅利還沒有吃完。今天人工智能的熱潮,是技術上主要是深度學習的突破引發的。深度學習理論上的突破是2006年,所以大家會問一個問題,11年過去了,深度學習的紅利是不是已經吃完了?

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

我們來看,這張圖是吳恩達在一本書叫 Machine Learning Yearn的書裡面一幅著名的插圖,縱座標是算法的表現,橫座標數據量。從這個圖中你可以看到,對於大規模的神經網絡來說,數據量越大,它的性能就會越高,也可以說它的能力越強。我問過在這方面非常頂尖的專家,目前有沒有看到頂點?他告訴我說,他們有人已經做到上萬層的深度神經網絡,還是沒有看到這個頂點在哪裡。深度學習它的紅利是很厚的,目前還遠遠沒有吃完。這是第一點。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

第二件事情,最近DeepMind公佈了兩分鐘的Video,他們利用深度增強學習,教會虛擬空間的木偶走路、跳躍、跨越,甚至在漂浮的木條上保持平衡和跳躍。這些木偶並不知道什麼叫走路,僅僅是給它目標,給他激勵,他就自己學會了走路,自己學會了跨越障礙物,甚至可能在一些複雜情況下比人的表現要好得多。這充分展現了深度學習的潛力。

所以我們不需要看每天 arXiv 上那麼多的論文,就從這些新聞事件上來看,都可以得出結論,這一代技術的紅利還遠遠沒有被吃光。

另外,我們不能光看技術,還要看這個產業。

這個是來自麥肯錫的一個報告,2013年到2016年裡面,AI這個領域獲得的外部投資增加了3倍,2016年的總規模達到了260億到390億美金之多。投資的效應是累積的,這些投資將會對 AI 的發展產生很大的拉動。

一個重點的行業是自動駕駛。同樣來自麥肯錫的報告,預測從2015年到2010年,自動駕駛和半自動駕駛車輛的數量將從100萬上升到1000萬臺。汽車這是一個幾萬億美元的產業,單單隻要考慮這一個產業的轉型,對於 AI 就足以產生巨大的牽引力。

所以我完全不擔心這次 AI 的泡沫會崩潰。

今天的 AI 整體是什麼水平呢?如果你反推,從現實需求出發來對 AI 提要求,你會發現,它有很多事情確實做不到。但是如果你正推,從AI今天已經具備的能力出發,來看看我們能夠解決什麼問題,你會發現,在今天的AI的能力範圍之內,已經可以解決很多問題,可以激發很多行業的變革。

所以如果你們認為AI有泡沫,我告訴你,泡沫只會來的更凶猛,這是第一個問題,AI是不是有泡沫?我的回答很明確,AI沒有泡沫。

2. 人工智能人才薪資虛高嗎?

第二個問題,人工智能的人才薪資是不是虛高。PingWest 最近發表了一篇文章,作者花了很大的功夫去做調研,寫出來一篇強文,題目是《百萬年薪的人的泡沫與人工智能的虛假繁榮》。文章寫得很棒,我讀了好幾遍,也推薦所有人都去看。

這個文章的核心意思,是說現在很多 AI 的人才在市場上拿到高薪,但是卻沒有為企業賺到錢。有些掛著高級學術頭銜的人,跑到企業裡先拿個高薪爽幾年,然後可能拍拍屁股就回學術圈了。

我們怎麼看待這個問題。

首先,AI 和數據科學人才的高薪是個全球現象,他們現在就是在享受薪資溢價,這個是事實。我接觸的很多 AI 界的人也是這麼看。

我們看一下美國的情況。

在美國,AI、機器人,機器學習與數據科學人才薪資水平目前快速增長中。你如果是程序員,你的薪資平均水平是九萬一千美金,不過圖中代表眾數(mode)的那根柱子靠左,說明更多的人是略低於這個水平的。這說明少數的超高薪的程序員把多數低工資的程序員給平均了。而算法工程師,尤其是數據科學家,他們整體收入水平很高,均值十三萬美元,而且圖中代表眾數的那個柱字偏右,說明超過這個收入的人群在他們整個這個人群當中也是多數。在招聘網站上,把 AI 方面人才的廣告掛出去,5天時間招不到人,顯著高於其他職業。意味著什麼?供不應求。這個是美國的情況。

英國是全球人工智能的另一箇中心。從2014年開始,英國的AI人才需求迅速的直線的上升,就是需求量迅速的上揚。

然後看印度,他們對程序員和機器學習專家的收入做了一個對比。結果呢,機器學習專家的收入不僅始終高於開發者,而且差距還越拉越大。

我們再從另外一個側面來看一下,我們知道這個AI開發者使用的主力語言主要是Python。

這是從2005年到2016年,這三個語言薪資水平之間的一個對比,排在上面的是遙遙領先的是Java,它在整個企業應用,電子商務開發的地位,很難被撼動,目前它的薪資是排名第一的。排名第二名的是世界上最好的語言,PHP,這個語言跟Java一直是並駕齊驅,保持不是很大的一個差距,但是到2014年,15年之後,出現了一個死亡交叉,Python語言在收入上開始超過PHP,我相信Python開發者的薪資水平超過是Java是遲早的事情,在最近兩三年之內就會發生。

中國會怎樣呢?大家看這幅圖,也來自麥肯錫,在世界地圖上藍色越深的地方,當前勞動力當中可以被機器和人工智能取代的比例越高。墨西哥、玻利維亞、祕魯這些國家,它整個自動化程度很低,所以有大量的手工工作都是可以被機器所取代的,他們是深藍色。然後呢,像美國、加拿大、澳洲這樣的國家,他們的自動化程度很高,所以他能夠被機器所取代的工作的比例並不是特別高,所以是淺色的。

你看我們中國呢,是比較深的,是49%到51%,就是在我們中國的話,AI和自動化取代人力是非常有潛力的。所以呢,我認為在未來的相當長的時間裡面,中國的做AI的這幫人,都將參與到一場勞動力替代當中,而且是佔據優勢地位的一方,享受高薪是必然的。

但是剛才那篇文章裡所說的薪資泡沫也很確鑿,因為我們看到呢,很多的企業,現在花了很多的錢去僱了一些一流的博士碩士,但是 AI 這個產業的規模還沒有起來,這些高薪基本上是靠投資人撐著,這合理不合理?

我認為事情的本質是人才結構的問題。這張圖是我和蔣總討論了很久以後我們列出來,其實一個成熟的,在未來5年以後真正賺到很多錢的人工智能企業,它的人才結構應該是這個樣子的,應該是AI專家學者,機器學習的博士們,資深專家比較多;然後呢,應該有一大堆AI的機器學習工程師,AI的產品經理、架構師在這裡。更重要的底下有大批的開發者,數據工程師,運維人員,行業人員,這是一個合理的結構。

但是實際情況,目前市場上獨立的人工智能初創企業,普遍嚴重缺乏優秀的產品、工程和運維人才。有些公司非常得意的宣傳說,你看我的團隊裡,一流名校博士佔百分之多少,比 Google、Facebook、微軟高多了。但其實這樣的構成恰恰有問題,這種團隊的工程化、產品化能力會成為瓶頸,從而制約他們賺錢的能力。很簡單,用戶只會為產品和服務買單,不會為論文、算法和你們的學位買單。正是這樣的反差,讓一部分人覺得這裡頭有泡沫。

那麼怎麼辦呢?我主張不要著急,把這個事情交給市場。投資者不傻,他們很清楚,現在我們處在算法紅利期,算法領域還不斷的有突破,所以我們先把懂算法的人找來,花錢養著他,先把論文看懂,先突破,往前突破。

但是算法紅利期還有個兩三年可能就要結束了。這不是說算法不會有進步了,還是會有很大的進步,但是呢,從算法的突破,到工具化,這個轉化路徑現在變得很順暢,兩三年之後會更順暢。如果你有一個算法突破,發表論文出來,很短的時間內,幾個月,甚至幾周內,Github 上會有實現出來,甚至你可能會看到百度、谷歌把新的算法放在自己的開放API裡面,這就意味著,企業競爭主要拼的就是工程能力和產品能力了。到那個時候,整個 AI 產業裡的薪資水平會有更合理的分佈。

我說一下我的結論。所謂的人才泡沫問題,只是一個暫時性的現象,是發展的一個必然過程,不需要擔心。

3. 數據科學向左,人工智能向右

我再說第三個問題,選擇方向的問題。

我們現在叫廣義 AI,其實裡面大致包含兩個工作性質差別挺大的方向。一個是商業分析與優化,一個是智能產品與解決方案。

兩者主要的不同是誰來做決策,人做決策還是算法做決策,這個決定了自動化程度的高低。

商業分析與優化技術的應用的週期當中,人仍然在裡面扮演很重要的角色,數據分析是用來輔助人類決策的,自動化水平受到人的決策的制約,不會太高。

另外一個方向叫做智能產品和解決方案,自動駕駛、掃地機器人、自動廣告投放系統,都是這類。整個產品的執行過程基本上是完整的,很少需要有人干預,決策主要由機器來完成,自動化程度接近 100%。

大家很快會面臨方向上的選擇,你是走左分支,還是走右分支,這件事情你們要好好的想一想。左邊這一支走下去,你可能會成為數據分析師、數據科學家、CDO。右邊這一支走下去,你應該會成為 AI 工程師、AI 產品經理,CTO。

走左分支,你的關鍵是獲得高質量的業務數據。在中國,這個事情難度很大。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

這個是最近的一個全球數據開放度調查,美國排名第8,中國排名第93。如果你們想走左分支,儘可能加入到一些具有數據訪問特權的機構,否則想在中國想低價拿到別人的數據是很難的。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

那麼怎樣選擇行業呢?麥肯錫給了六個原則,

  • 第一,數字化高度成熟;

  • 第二,業務規模巨大;

  • 第三能夠把AI用在自己的核心業務裡邊,而不是一些邊緣業務;

  • 第四,它能夠同時的去接納多項科技,不僅僅是AI,可能還有區塊鏈,還有物聯網,還有其他的科技,都能夠去接納;

  • 第五,它更加註重增量,而不是存量;

  • 第六,領導對AI的應用有強有力的支持。

選擇方向的時候,用這六把尺子來量一量,就會有一個大致的判斷。這是麥肯錫的一個行業分析,排在第一名的,叫做高科技和電信,就是它各個領域裡面綠的比較多,如果你們在這個領域做AI比較容易。今天大部分在互聯網領域裡,你們可能在這個領域裡面做AI比較容易,因為數據也比較全,各方面的支持也比較到位,人的意識到位。隨後分別是汽車和生產線、金融、電力、娛樂傳媒、零售等行業。我們現在很多人都在談醫療的大數據,醫療的AI化,但是其實呢,這個行業的準備度是不足的,做這個方向,要克服很大的難度。

其他的行業不一一解釋了,謝謝大家。

Part 3 智亮:你是我的眼——對計算機視覺的介紹

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

今天我們主要聊的是計算機視覺,咱們先從最大的概念開始說一說,人工智能,機器學習,計算機視覺。

人工智能這個概念一點都不新,機器學習也一點都不高深,那個計算機視覺也談不上神奇,為什麼這樣說?

我們人工智能實際上在歷史上,浪潮至少三次。

第一次50年代到70年代,叫符號主義流派,專家系統占主導地位。

什麼叫專家系統?就是人去學一個東西,然後把學到的知識理論化,再把這些理論模型化,最後把這個模型程序化,形成一個系統,就叫專家系統。

專家系統巔峰在1962年,IBM公司的跳棋,戰勝了當時的人類高手,引爆了第一次浪潮。

專家系統能解決一些問題,但是也解決不了很多問題。

到了1980年,統計時代開始盛行。統計流派巔峰在1993年,Vapnik系統性的提出了一篇論述叫支持向量機,現在這個算法在很多地方被大量的使用,它非常有效。

引爆第二波浪潮的重點就是1997年,IBM的深藍戰勝了當時的國際象棋冠軍卡斯帕羅夫。

2016年的阿爾法狗引爆了第三波浪潮,我們這一波的流派現在還沒有名字,我更傾向於把它叫暴力流派。

2006年Hinton提出過一個經典的論文,Hinton這篇論文雖然在2006年提出,但是我們神經網絡是一個非常老的概念,它的前身要追溯到1986年的多層感知器反向傳播算法。

這裡邊還有一段歷史公案,就是Vapnik老爺子和Hinton老爺子,他們學術矛盾很深,在80、90年代外面SVM一個佔據主流的時候,神經網絡被打壓到連論文都發不出去,業都畢業不了。現在老爺子算是打了一個翻身仗。

剛才說到我們三次浪潮,前兩次每次都是這樣,說人類要毀滅了,後來發現其實並不是這樣。

我們現在就處在這個狀態,人類又要毀滅了。其實和前兩次比,還是有一點區別。

我覺得最大的一個區別就是它現在真的是深入到我們生活的每一個角落,打開你的手機看看,淘寶,智能推薦,拍一拍,谷歌翻譯,搜索引擎,智能出行,智能規劃,微信,智能助理,頭條,智能推薦,還有機器識別,其實它已經深入的改變了我們生活的每一個角落,而將來它會改變更多。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

然後我們剛才說為什麼機器學習一點都不高深。當年,Vapnik老爺子他提出支持向量機有一個核心概念,這個世界是線性可分的。

什麼叫線性可分呢?線性就是一條直線,二維空間裡它就是一條直線,三維空間裡它就是一個平面,他認為這個世界用直線能全分割開,在我們的二維世界給它變一個緯度也能分開。

有點像我拿著一堆木球和鐵球,你在它們在地上滾,然後你讓它一刀切,分成兩堆這是不可能的,但沒關係,我把它放到水裡,木球漂起來,鐵球沉下去,橫著來一刀,這就是支持向量機的核心理念。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

雖然有些時候是這樣的,但是並不是所有時候都能夠成立,所以支持向量機當時只能解決簡單世界的問題。

而神經網絡是用了一個比較複雜的結構,多層感知機。

現在深度神經網絡用了一個非常複雜的多層、高階的結構,然後去擬合我們現實的世界,它比支持向量機要成功得多。但是如果說它真的能夠擬合我們真實世界的所有情況,其實還差那麼一點意思。這也就是說為什麼我說,機器學習或者神經網絡沒有那麼高深。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

它本質上不對這些問題進行數學上的建模,我就是用一個很複雜的神經網絡,做出了一個足夠複雜的方程,Y等於F(X),這個方程參數非常多的,階數高,非常的巨大,我們的輸入是X,這個方程給我們算出來Y。

然後我們比如說我們看一張圖片,我們這張圖片輸入就是X,一隻貓,這隻貓它真的是一隻貓,我們的期望就是這個F(X),計算出來的結果等於貓,這就是我們目標,怎麼讓它等於呢?就是我們用大量的數據不斷的迭代。

當年,Hinton老爺子提出這個東西之後,被Vapnik老爺子批評,說你這個東西一點數學的美感都沒有,Hinton老爺子在數學成就上確實不如Vapnik他老人家,這也是歷史公認的。但是一句話,我好使,我有用。

但是現在也有人質疑什麼呢?我們這麼算出來的東西,為什麼?什麼原理啊?它怎麼就好使了呢?不知道,但是我們知道,這個複雜的非線性方程,它能夠在某種程度上模擬出來我們真實世界的情況,但它具體怎麼模擬的,是一個黑箱,我們都不知道,阿爾法狗下棋能贏柯潔,沒問題,但是你讓他去教圍棋,那是一把瞎,別說阿爾法狗教不了,寫阿爾法狗的人也教不了。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

再說智能,我們的大腦就是一個典型的智能。

佛家有六識,眼、耳、鼻、舌、身、意,它對應的是六塵色、香、聲、味,觸、法。視覺,聽覺,嗅覺,味覺,觸覺,以及我們的思考,這個構成了我們的智能。

而計算機如果想有智能,它首先也得有這些感官,有輸入才能有思考,有思考才能有輸出,有了輸入、思考和輸出,它才有智能。而我們今天主要講的就是在我們生活中,我們最大的信息來源,視覺。放在計算機上,就是計算機視覺。

當前的計算機視覺,它的技術上一般是有叫卷積神經網絡。這個東西就是用大量的神經網絡堆疊起來。

比如,給一個輸入說,這是個人,而且是個女人,計算完了以後,得到輸出,只要這個網絡得出的是個女人,就OK。換句話說,我給它的每一個訓練數據,我都告訴他正確答案是什麼,這個就是監督式學習。

然後呢,它和以前的模式識別,特徵檢索,是有比較大的區別,區別在哪裡?

其實它也有特徵提取和特徵檢索,為什麼說有區別?

區別在這,它的特徵不是我們告訴的,不是我們編碼,不是我們手工設定,而是通過大量的數據,它自己學習出來的,這也是神經網絡和以前的所謂專家系統最大的區別。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

那我們來看看,單就計算機視覺這個領域它能做什麼。上圖就是大家現在能做得非常好甚至超過人的一個例子,在這張圖片裡面,有很多東西,計算機能夠把它分析出來。它能夠從一個圖片裡面區分出不同的物體,並且辨別出它們是什麼,在哪裡,這是能做得事情。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

這張圖是畢加索的公牛,畢加索在畫這一系列的圖時有一個目的,說我畫的公牛跟真的公牛一模一樣,你能認出來,說明我畫的好,如果我畫的跟真實的公牛不一樣,你們是怎麼認出來?

我全塗成黑的,是牛;我再黑一點,細節全都丟失了,還是牛;那我把紋理去掉,把形狀變一下,把各種全都抽象起來,到這還是跟我們平時看到的比較接近,畫到後來還有人認為是牛,那麼對人來說牛到底是什麼東西?為什麼這個樣子是牛?這就是抽象。

我要說的就是計算機視覺現在有兩個非常大的不能做的事情,第一就是抽象。

第二件事情很有意思,看上圖,計算機第一反應有可能是貓,但是再仔細看看,就不認識了。我們的計算機視覺至少在目前這個階段,它不知道自己不知道,這個事它做不到。

這兩個事,一個是看到抽象的東西它認識,另外一個是看到不認識的東西,它知道自己不認識。在目前的卷積神經網絡這個結構下,計算機是做不到的,它並不是萬能的。

當然它也能做很多事情,接下來,我就仔細的看一下,卷積神經網絡的一個大致的發展歷程。

卷積神經網絡開拓者Yann LeCun做了一個非常簡單的卷積網絡,去做手寫數字的識別,也就是我們現在每個人初入機器學習,一定接觸到的一個Mnist。

他做了一個數據集,用了一個卷積神經網絡去計算一個手寫的數字,它到底是一二三四五六七八九中的哪一個。這個東西做的非常的成功,美國的郵政和銀行都在用,但是並沒有產生太大的反響,因為支持向量機,也能做到同樣的事情。

第二個,Alex,剛才兩位老師也提過,他也是老爺子的學生。2012年,他刷爆了計算機視覺的比賽,以碾壓性的優勢,幹掉了所有的SVM的東西,從那以後卷積神經網絡才成為了計算機視覺的標配。

第三個人,何凱明,微軟亞洲研究院出來的,2015年他提出的參加網絡也是卷積神經網絡的一種。這一年,計算機在Imagenet的比賽成績超過了人類,雖然不像阿爾法狗那麼有名,但是在計算機視覺史上這個時間點是要被銘記的。

下一個時代在哪裡?是不是在你們中間,我也不知道。

介紹完了歷史,我們來看一看卷積神經網絡最大的特點。這個特點在於它能夠自己去學習這些特徵,我們看一下一個非常經典的一篇論文,叫做《Visualizing and Understanding ConvolutionalNetworks》,非常有名。

他們做了一個實驗說,我訓練一個非常簡單的積卷神經網絡,訓練出來之後,我想看一看究竟學到了什麼,大家都說它是黑箱,那我們打開看一下,到底學到了什麼東西。

第一層,他們發現,都是非常簡單的直線,斜線,各種顏色,這些非常簡單的紋理。用這種形狀的卷積核能夠把圖片上面的線條區分出來。這個網絡在沒有任何人工指定的情況下,大量的學習數據網絡,它天然學到的,非常的巧合,或者說也是必然。

第二層,每個九宮格是個神經元,在我們用大量數據去輸入它的時候,它會給出一個反饋。這個反饋是一個數,越高,代表它越興奮,對這個輸入越敏感。

它在所有的數據裡面,找出了讓這個神經元最敏感的九張圖,並且通過反捲積的方式把它計算出來,它不代表這個神經元就是這個內容,而是這個神經元對這樣內容的東西最為敏感。我們能看到第二層裡面出現了圓形和各種角度的弧線,我們在大量的觀察之後,得出一個判斷,這個網絡的第二層對形狀敏感。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

第三層,我們看到的紋理有點像長頸鹿,在經過大量的數據研究之後呢,我們認為它的第三層是對形狀,紋理,這些信息比較敏感。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

第四層,就開始對紋理形狀結合,是對形狀和紋理的複雜結合開始敏感。

第五層的時候,它就開始把所有的信息結合起來,形成一個高階的概念。比如,我對狗敏感,我對花敏感,我對人臉敏感,它在一層一層這樣不斷遞進之後,把上一層的信息,結合起來,然後形成下一層的輸入,通過不斷的訓練自己,讓每一層的神經元對不同的信息產生反映。

計算機視覺這個領域,它現在的課題大概就是這麼幾個。

首先就是識別,比如,這張照片,我能說出來它是人,那麼就OK。

然後就是檢測,檢測的目標是我不但要說出來這個照片都有哪些東西,我還要知道它在哪一塊。

再然後是語義分割,就是我畫框已經滿足不了我,我要精確的描繪出來這個人的輪廓,我要把有語義的東西從背景裡面挑選出來。

最後一個叫描述,比如我給你一張圖,你要給我一句話,一個女人和孩子在看電視,如果我們粒度再細膩點,還要說電視裡面有一隻獅子,這就是我們描述要做得事情。

識別檢測分割和描述,就是當前計算機視覺的四個重要課題,現在很多論文都是圍繞著這幾個方面。

識別已經超過人了;檢測還比人差點,但是不會差特別多;語義分割差的稍微遠點,人能畫出來,它不一定能畫的像;描述,英文方面,現在是大概能看,說出來的東西比較靠譜,中文,基本上是一個空白,現在大概就是這樣的情況。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

然後如果說我們剛才看到的識別,檢測,分割和描述,是我們現在在研究的這個領域,那麼它的未來在哪裡?

這是我個人的判斷,首先說我們人在看到這個世界的時候,不是通過一張張的照片去認識這個世界,我們看到的是連續的,流動的物體,我們在大腦裡面接受的是視頻,這個也是視覺的一個發展方向,它未來必然是以視頻或者序列為基礎。

第二個大的發展方向,就是理解和分組,像上圖,我們人一看到,就知道這是草地上有一條公路,公路上有一輛車,有一個樹把車擋住了,在我們的腦海裡是這個樣子。但是計算機確實不是這麼理解的,而讓他能夠這樣去理解問題,就是我們未來的一個研究的目標。

第三個,叫無監督和One-Shot。比如,我們現在都知道Imagenet這個大賽,它一共有1000個類別,每個類別平均下來有一千張圖像,加在一起是一百多萬張圖片,每張圖片都有標籤,都告訴你這張圖片是什麼東西。

所以大家現在看到的很多這種檢測都是這樣,為什麼呢?因為他們只有Imagenet這樣一個大量的數據都有標籤,我們倒是想訓練出來一個能識別其他的東西的,但是沒數據。

所以未來我們的方向有一個很重要的分支,我們怎麼樣能夠縮減數據的需求量,最好是什麼呢?我給你圖片,哪怕一千萬張都可以,但是你別讓我每張數據我都給它標個標籤,太累。

無監督學習是個分組的過程。舉個例子,分組的過程就相當於是,我看到無數只貓的圖片,我不知道它叫什麼,但是我知道所有這些貓都是同一個東西,當我把貓這個概念抽離出來以後,你給我一張照片,說這個物體叫做貓,我瞬間就明白了貓這個概念,這個是我們的無監督學習。也是我認為非常重要的一個方向,甚至說能不能夠改變我們未來的產業的格局,就是最後一點。

如果說每一個數據都要監督,每一個分類都要一百張帶標籤的圖片,那就只有Google、BAT這樣的公司玩兒得起這個產業,但是如果當無監督出現之後,我們會看到,整個這個人工智能或者叫計算機視覺這個領域,會進入到一個群雄並起的局面,這個技術的成功,或者失敗決定了未來的產業化的發展方向。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

介紹一下目前用計算機視覺技術做的一些市面上的應用,這個東西就是我們做得一個識花的東西,對著一個花,拍張照片,我告訴你它是什麼,從技術本身來講其實沒有太大的難度,就是一個簡單的識別。

然後還有一個比較有意思的東西,Prisma,用到的是英文,給你一張照片,選定一個名作,比如梵高的星空,選定一個藝術風格之後,對這張照片進行應用,我們得到一個內容還是這張照片,但是風格變成了星空,或者吶喊的這樣一張圖片。

為什麼把它們兩個提出來呢?因為這兩個應用用的技術都不難,投入也非常的小,像我們花伴侶,第一個用了一個星期訓練,一個下午寫APP,出來之後,大概四個多月的時間就有了一百多萬的用戶,最可怕的是什麼呢?它從0到十萬,花了三個月的時間,然後到三月的時候,春天來了,野花開了,一個月的時間,從十萬變成一百萬。而Prisma是5周,一千萬用戶。

我們並沒有用多複雜多高深的技術,都是計算機視覺技術一個簡單的應用,但是引爆了我們的社會,這也是我們為什麼要去了解計算機視覺,瞭解機器機學習技術的原因,因為在之前這些技術並不是保密,是公開的,他們都流傳在學術界。

我們為什麼說機器學習是個的大的機會,學術界的寶藏,剛才兩位老師也提到了,算法的紅利,在於把它拿到工業界,學術界已經玩兒的不愛玩兒的東西,但是你把它向公眾開放,讓大家看到它能做什麼之後,往往會爆發出連你自己都想象不到的一個巨大作用。

然後接下來就介紹一些前沿的嘗試,這個是從16年開始,在學術界就非常熱門的一個叫對抗生成網絡的技術。

意思就是說我有兩個網絡,一個網絡不斷的去創造出來東西,相當於各種各樣的造假;而另外一個網絡呢,我就去負責分辨真偽,這兩個網絡不斷的去訓練自己,去提升自己。

造假一張接著一張的往外造,分辨網絡再去分辨是真是假,這樣它們兩個在不斷對抗磨合的過程中,只要有訓練數據,就等生成一個以假亂真的東西。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

這個是對抗生成網絡的一個例子,你用手畫個貓的輪廓出來,它給你生成一隻貓,但是很快被人玩兒壞了。左邊這樣的東西,大家能夠說很像是貓。但是右邊呢?真正能像人一樣,畫出來的都像貓嗎?有一定的距離,但是這個技術現在確實是未來的一個非常重點的一個方向。

這幾張圖是哪位大師的作品呢?我們肯定不知道,因為都是電腦畫的,沒有一張是人畫的,但是看起來好像都很厲害的樣子。計算機造了大量的圖片出來,然後讓人去挑,說哪個你覺得最有藝術價值。

然後這個呢,是挑戰對世界的理解,為什麼這麼說?上邊大家看到的是真實的行車記錄儀拍攝下來的記錄,下邊這個是計算機根據第一幀的真實的畫面,自己訓練的生成後面的畫面,憑空生成,無中生有,這也是對抗神經網絡的一個非常可怕的點,也許有一天你看到的視頻,你根本就不知道是真是假。

關於程序員轉型AI這件事,三位老炮從產業、人才和實操跟你聊了這麼些乾貨

最後一個,是比較老的論文,但是我覺得代表了很多東西,就是它不光是能夠學習圖片上的特徵,它還能學習它的語義。大家看,我有一堆照片訓練出來說第一個戴眼鏡的是男人,然後剪掉一個男人,加上一個不戴眼鏡的女人,得到的是戴眼鏡的女人,這篇論文非常的有意思,後來沒有在語義上面學術界沒有跟得太緊,但是這可能是我們未來一個很大的一個爆發點,很有意思。

【完】

相關推薦

推薦中...