沈向洋無懼BAT逼宮:微軟培養了中國幾乎所有 IT 公司的CTO,5000人撐起AI四大方向|新智元專訪

人工智能 沈向洋 微軟 微軟小娜 手機和訊網 2017-05-14

本文首發於微信公眾號:新智元。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

沈向洋無懼BAT逼宮:微軟培養了中國幾乎所有 IT 公司的CTO,5000人撐起AI四大方向|新智元專訪

【新智元導讀】 微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋博士(Harry Shum)在 Build 大會發表主旨演講後,接受了包括新智元在內的幾家受邀媒體的採訪。他在採訪中談到了微軟的 AI 人才流失問題,對騰訊等公司到西雅圖招攬AI人才進行了迴應。同時,作為微軟去年整合的 5000 AI 人才軍團的負責人,沈向洋談到了他們的四個主要發力方向。最後,有記者問到,陸奇去了百度,微軟還會跟百度合作嗎?來看看沈向洋的答案。 2017年05月10日,微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋博士(Harry Shum)在微軟全球開發者大會(Build)發表主旨演講後,接受了包括新智元在內的幾家受邀媒體的採訪。

採訪中,沈向洋博士認為Cortana代表了AI的未來,他多次提到Conversational AI,也即對話式AI。在他看來,智能語音市場遠遠沒有飽和,各大巨頭都在做智能語音助理,正表明這是一個正確的方向,而在亞馬遜Alexa/Echo,谷歌Google Home等先入產品面前,微軟的機會仍然有很多。微軟將利用小娜、小冰的優勢,從語音方面發力。

所不同的是,沈向洋提到,他認為“AI對人類情感的理解將會是非常了不起的一件事”,“大多數的人還沒有認識到能夠不斷聊下去這件事情的重要性”。而在這一點上,微軟的小冰遙遙領先於其他智能語音助理,平均多輪對話次數是目前業界最高的23次。不過,沈向洋也表示,微軟的Conversational AI會“兩條腿走路”,既要發揮Cortana的商務助理優勢,也要充分挖掘小冰在情感聊天方面的優勢。

當被新智元問及去年微軟組建的5000人規模AI團隊的具體組織架構時,沈向洋並沒有直接回答。但他表示,搜索引擎、以Cortana為代表的智能語音助理、用AI幫助微軟現有產品轉型,以及用AI開發全新的產品線,是當前微軟AI團隊主要發力的4個方向。尤其是最後一點,沈向洋堅信,AI將顛覆所有的商業應用,那麼在這其中,決定去做什麼、不去做什麼,是微軟AI當前最重要的事情。

至於關注度很高的微軟AI人才流失,沈向洋似乎對此並不是太擔心,他告訴新智元:“我覺得人才流動非常正常,一個大公司培養了很多的人才,最重要的是一個公司你要知道你存在的價值和理念,這體現在優秀的員工為什麼會選擇留在你這裡,不光是你到外面挖人,你給在這裡員工提供什麼樣非常了不起的環境,讓他在這裡面有非常好的發展。”對於其他公司來微軟“挖角”,沈向洋反而感到非常自豪,認為體現了微軟為中國AI乃至整個IT行業培養了優秀的人才。

沈向洋還表示,在去年微軟重組構建5000人規模AI團隊後,他就成立了一個“微軟人工智能學院”,培養相當一批微軟內部人才,“我們希望通過這樣的方式,可以吸引更多外面的人才來微軟。這麼做,並不是我們擔心又有人挖我們AI的人才,更重要的是,要把我們的人才培養成‘AI capable’。”

接下來,在回答其他媒體記者提問時,沈向洋表示,未來10年左右,計算機視覺可以識別一切。他認為未來3到5年,垂直領域AI將有所發展,看好toB的業務,而未來5到10年,他認為“可解釋的AI”是一個非常值得研究的方向,這方面肯定會有重要突破。此外,沈向洋還表示,認知計算將成為Azure的“重中之重”,看來在智能雲(Intelligent Cloud)方面,谷歌與微軟也勢必有精彩的角逐。

採訪中,沈向洋提到他非常享受做研究的過程,可惜他“後來被鮑爾默趕出來去做產品”。此外,沈向洋認為“可以從安卓興起的過程當中學習很多東西,深度學習下一波浪潮當中怎麼樣可以做的更好,我不覺得微軟一家公司可以把這些東西都做出來。”

新智元專訪沈向洋:如何迴應騰訊等公司爭搶微軟AI人才?

新智元:有一個問題,微軟怎麼應對人才流失?說實話,像騰訊已經把研究院開到西雅圖了。

沈向洋博士:上次我跟馬化騰講,我說你太不像話了,把研究院開到我們門口了。小馬哥還有點不好意思,還有點靦腆。我覺得人才流動非常正常,一個大公司培養了很多的人才,最重要的還是說任何一個公司你要知道你存在的價值和理念,這體現到優秀的員工為什麼會選擇留在你這裡,不光是你到外面挖人,你給在這裡的員工提供什麼樣非常了不起的環境,讓他在這裡面有非常好的發展。你去問問騰訊,騰訊的人才也在不斷流失,騰訊以前沒有AI的人才,所以他必須就要去挖人,去百度挖也好,去別的地方挖也好,都很正常。大家到西雅圖開研究院,對西雅圖本地經濟太好了。在中國還出去招商,把人拉過來,像微軟、亞馬遜或者到其他的大公司,我們也有責任把西雅圖本地經濟帶動起來。

新智元:就像您剛才說的一樣,如何要留住AI人才,就是這個公司的實力了。不過,從現在的新聞來看,從微軟研究院出去的人很多。

沈向洋博士:對,我上次在烏鎮,跟劉雲山書記報告的時候,跟大家說微軟公司在中國,為中國IT產業培養了無數的優秀人才,我說你不僅要看到中國幾乎所有IT公司的CTO都是我培養的,從聯想到海爾到小公司,我說你更加要看到微軟研究院在過去18年,培養了5000個學生,那些才是真正了不起的,新一代的創業公司出來——現在可能不會是這樣的情況——當時計算機視覺、AI公司剛起來的時候,那些投資人來問我一些情況,我說你不要跟我講,在中國開計算機視覺的公司,要麼是我的學生開的,要麼是我的學生的學生開的,這都非常光榮的事情。回過頭來看,微軟研究院、微軟公司對中國的IT發展,很多方面都起了巨大的正面作用,特別是為中國培養了非常多的一流人才。

新智元:那您現在也覺得微軟繼續對外輸出人才也是很自豪的?

沈向洋博士:我們一直覺得非常自豪,微軟研究院一直覺得非常自豪。我們培養了李開復,我們培養了張亞勤,我們培養了趙峰、我們培養了芮勇,芮勇還是我學弟,這些都非常好,我們都覺得非常光榮。

新智元:接下來繼續有高級的研究員離職的話,你們仍然覺得很光榮?

沈向洋博士:你具體應該去問問那些離開的人,他們是不是還是研究員,你聽懂我的意思啊?你問問他們最近研究了什麼,叫他寫個算法給你看一看。

我再補充一下,微軟最近在做一件非常重要的事情,就是人才方面的。6個月前我率領的AI這個部門組建後不久,我就成立了一個“微軟人工智能學院”,培養相當一批微軟內部人才,我們希望通過這樣的方式,可以吸引更多外面的人才來微軟。這麼做,並不是我們擔心又有人挖我們AI的人才,更重要的是,要把我們的人才培養成“AI capable”,所以我們就有一字頭的課、二字頭的課、三字頭的課,一直到六字頭的課,類似研究生這樣的課。我最近剛剛做完一期AI 611這門課,專門做hands-on project,深度學習具體項目。有10個項目,非常了不起,他們這門課結束的時候,我專門用了2小時去聽了他們的報告,非常好!所以,我們現在就是在不斷培養AI的人才,既包括內部的人才培養,也包括吸引外面的人才參加。

在LinkedIn發佈的全球和中國科技企業最佳僱主的排名上,微軟在全球排名第二,僅次於谷歌。但是在中國,微軟超越了谷歌,成為最佳僱主。詳細情況參見新智元公眾號的二條報道:

《LinkedIn 技術VP王迪專訪 | 全球AI人才聚集,Top10 中美公司排行榜》。

微軟5000人 AI 軍團:發力搜索、Cortana等四大方向

新智元:微軟去年做了重組,您率領一個5000人規模的AI團隊,但是對具體的組織架構,我們一直都沒有太多的瞭解,希望您能在這方面介紹一下,這5000人的團隊具體的側重點、方向、人事架構是怎麼樣的。我相信5000人還是分佈在世界各地吧,這時候你們採取怎樣的聯繫方式?

沈向洋博士:我們通常都不會對外部講具體的架構和人事,內部當然任何一個單位都有一個組織架構。不過,我可以簡單跟你講一下,微軟發展AI主要還是在4個方面。

第一,搜索引擎方面。你可以同意,也可以不同意我的意見,那就是今天世界上最大的人工智能可能還是搜索引擎,微軟Bing這麼多年下來做了知識圖譜,超過25億的實體(entities)。這裡面就有很多的知識,搜索引擎本身不僅僅是一個業務——當然現在Bing也很賺錢,我們在美國佔22.6%的搜索市場份額,再加上雅虎的11%(後臺技術是微軟做的),所以我們在美國有1/3的搜索份額,在英國最近漲到16.5%。從AI的角度來講,搜索引擎主要就是World Knowledge——對世界知識的積累。

第二,非常非常重要的一件事情就是Cortana,這是一個私人的智能數字助理,我覺得Cortana代表了AI的未來,對人的瞭解。要做好AI需要三個方面的知識,一個是你對世界的理解,一個是你對工作的瞭解,一個是你對用戶的瞭解,這三件事情在一起的話,才可以做得非常好。我覺得小娜在朝著這個方向走,要去做這個事情當然要有很大的投入在裡面。

第三,其他的公司和微軟一起合作,怎麼樣令AI 幫助微軟(所有產品的)轉型。我剛才提到Office,也提到Cloud,也提到Windows,我們一起做。同時,我們把這樣的一些技術拿出來給其他所有Microsoft開發者去做,比如認知服務(Cognitive Service),這也是我在演講的重點。認知服務這麼多年一直都是我們AI部門在做,其中有很多的技術是從微軟研究院做出來的。

第四,也是我自己覺得非常激動的一點,我在主旨演講的最後稍微提了一下,沒有機會展開講,那就是Every Business App is going to be Disrupted by AI——“所有的商業應用都會被AI顛覆”。所以,我們微軟正在這裡面選擇哪些方向,哪些商業的AI機會我們會去挖掘,希望能夠在不久的將來有機會跟大家再分享這邊的進展。

新智元:目前這些方向還是在探討階段中嗎?

沈向洋博士:我們已經做了很多的產品原型,甚至很多的產品和服務已經有很多人在用了。我在我的演講中也提到,從銷售到市場到售後,這些我們都有在做。

對話式AI:微軟有一些不同看法

新智元:現在有很多公司都將Conversation AI作為一個入口,但也有人認為對話是一個偽需求。從剛才您的介紹當中,我是否可以這樣理解,微軟跟其他公司所不同的,是微軟的對話平臺是從情感這個角度去切入?

沈向洋博士:微軟不僅從幫助你完成任務的角度,微軟同時也非常關注情感方面的研發,我覺得我們是兩條路同時在走,我們小娜是幫助你,你有什麼事情,我幫助你找到需要的問題,同時我們小冰更加是從情感的角度,陪你聊天,試圖理解你,跟你不斷對話。這裡面大家的設計理念是非常的不一樣,比如你要幫人完成任務,你希望越快越好,你要陪人聊天的話,你要能夠聊越久越好,這兩件事情從產品和設計上是非常不一樣的。

大多數的人還沒有認識到能夠不斷聊下去這件事情的重要性,我給你講一個數字,大家都不見得知道。一個人一天講幾句話?事實上,人一天可以講6000句以上,你可能都沒有認識到這一點。為什麼人要不斷講話,這絕對不會是因為要完成一件事情,它是人類自身學習的過程,通過對話、通過交流,跟不同的人學到不一樣的東西,這一點是微軟做AI,特別是對話式的AI,非常注重的一點,其他的公司不見得都很注重。

沈向洋無懼BAT逼宮:微軟培養了中國幾乎所有 IT 公司的CTO,5000人撐起AI四大方向|新智元專訪

當前微軟AI最重要的事情:決定做什麼和不做什麼

以下是專訪現場沈向洋博士回答其他記者提問的實錄。

問:微軟全力投入AI,您的部門會繼續擴編嗎?

沈向洋博士:你這個問題要問我們CEO(笑),我覺得一定會的。

問:接下來的首要任務是什麼,有沒有一個發展的進程,比如短期和長期的規劃?

沈向洋博士:是有的。任何一個企業,一個單位,特別是大了以後,一定要去想短期的目標是什麼,中期的希望是什麼,長期的願景是什麼,一定要從這個角度去想。我的部門比較特別的地方就是,我除了 AI 以外,還管研究院。在研究院我們有1000多位科學家,剛才新智元的同事也問道,我覺得最重要的就是,要不斷培養一代一代新的了不起的研究員,去做更了不起的技術。

例如我剛才提到,人工智能(更多在離散的空間做符號處理)和腦科學(更多在Neural神經元做連續處理)這兩個空間的融合。符號可解釋的空間和連續的腦空間之間的關係,三五年前基本上沒有什麼人研究這些方向。我認為更重要的就是應該培養新一代,看到這樣的問題。如深度學習,要去解釋它。

回到您剛才問的,微軟有些什麼樣的目標?我覺得看得蠻清楚的,短期的話AI還是要看到短期業務,哪裡有真正的商業價值。就是我們可以掙一些錢,定個小目標,這都非常重要。但是,更重要的事情是 AI 這個部門成立之後,我們要想清楚如果我們真的覺得AI會顛覆更多的行業應用,在顛覆的過程當中,我們的機會在哪。

主要是兩個方面:一個是在現有的產品,比如Office等跟AI結合,將會有哪些顛覆性的內容產生,有什麼新的產品出來,有什麼新的功能出來,這邊的話我們進展得非常好;另外一個你要去想,新的產品線在哪裡,你有沒有一條新的產品線出來,三五年以後可以做到十億美元的生意。要思考,你有沒有這樣的業務,五到十年可以做到一百億美元的生意。如果有,當然要放馬去追求這樣的機會。所以我們現在整個AI部門最重要的事情,就是決定要做什麼,決定不做什麼。

未來10年左右,計算機視覺可以識別一切;未來5到10年,可解釋的AI是一個值得研究的方向,肯定會有重要突破

問:Harry你好,您之前提到的人工智能研究方向大致可以分為感知和認知兩方面。我想請您以更加技術的語言來說明一下兩者的趨勢,可以舉個例子講一講。

沈向洋博士:說到人工智能,大家今天激動得不得了,我自己也覺得有些東西是真的已經在發生了。首先,你要回過頭來看,為什麼會有“人工智能”這個詞,“人工智能”實際上是對應於“人類智能”提出來的,就是human intelligence。

為什麼覺得人有智能,人的智能基本上分成兩部分,一部分是感知,另一部分是認知。感知是裡面最了不起的,而其中最大的一部分就是視覺的感知。以前有人做過這樣的研究,一個人大概91%的信息是從視覺收集過來的,我忘記了他用什麼樣的方法算出來這個數字,但是我想大家基本上會同意,人絕大多數感知都來自於視覺。然後是聽覺,然後才是其他的感知,比如觸覺。

我覺得這邊的進展非常大,過去這一年我都在講,計算機語音識別的突破最多是5年的事情,也就是說5年之內計算機語音,不管你怎麼去講它都能識別,而且肯定會比人類強。然後,接下來10年左右的時間,計算機視覺也會達到這一點,今天視覺很多東西已經超過人,具體來講比如人臉識別。但我講的是一個很general的,anything is recognizable,到一個新地方,AI看到一個新東西能夠聯想到其他東西,這些我認為大概十年左右的時間可以實現。

但是在認知方面,今天我們遠遠沒有獲得突破,都談不上跟人類相比的地步。首先是自然語言處理的問題,然後就是知識獲取的問題。越來越多的人更應該去做這方面的工作。自然語言處理,我剛才也提到機器閱讀,語言這個問題,相對來講的確是比較複雜。用今天現有的方法,包括深度學習的方法,解出來的效果還不是足夠好,當然用深度學習已經可以幫助到我們很多東西,比如像翻譯也用了很多自然語言的東西。

更重要的,今天大家對整個“認知”這樣的一件事情的定義,還在一個比較初級的階段,什麼叫做常識(Common Sense)?你怎麼知道見到這個人以後,為什麼會對他很有一種親近的感覺?這些我們還不是很理解,而這是一個很大的問題。稍微岔開一點講,很重要的問題,今天我們個人工智能做的這些東西,和腦科學的結合不夠,理解也不夠。很主要的原因就是對“智能”的很多東西,只有人腦這樣一個範本,但人腦結構很特別,今天我們還不夠理解。腦科學作為一門科學,今天也還處在一個早期的階段,我們還不能做太多的實驗,也不能隨時把一個人的腦袋打開塞一些東西進去。

這個是一個長期的問題,現在越來越多的人也在想這樣的問題。連接人工智能和腦科學,今天有一個方向我們覺得是很激動人心,現在在微軟研究院很多的人在做這方面的事情,我也跟很多大學有一些合作,就是所謂的“可解釋的AI”(Explainable AI)。我認為,Explainable AI在接下來5到10年,肯定可以做出非常了不起的成果。今天我如果有研究生的話,我就會讓他們做這個方向的工作,原因非常簡單,因為今天AI最大的突破就是深度學習,但是深度學習的一個最大的問題就是,出來的結果非常好,但是你沒法解釋。

我自己看到的,這方面寫得最好的一篇文章,是最近在《紐約客》的一篇有關醫療AI的。為什麼看同一張圖,醫生會跟你講,你沒問題,原因是一、二、三。但今天AI還做不到這點,深度學習做不到這點,很大的問題是大家解問題的空間不一樣,醫生是在一個所謂的neural,腦的這樣一個連續的空間在解,而AI很多的理解是在符號的離散的空間上去做。

所以,如何把這些東西連起來,從技術上有講有很多有待突破的地方,也是我們現在研究院很認真在做科研的一個方面。

問:微軟現有的一些成果或者說優勢都有哪方面?

沈向洋博士:我剛才提到在一些感知方面,從計算機視覺到計算機語音,我自己是覺得我們都是領先的。

問:有沒有這方面的數據,或者特別強有力的案例?

沈向洋博士:我們是第一個做到語音識別達到人類水準,特別是在最難的數據級switch bot data set,在我演講裡面提到,6個月之前我們已經做到這一點。在計算機視覺方面,我們兩年前第一次做到物體識別(Object Recognition)跟人一樣的準確率。接下來,我希望我們在自然語言理解方面也能有所突破。翻譯也是這樣,翻譯的質量特別是Spoken Language(口語語言),我們肯定也是世界領先的水平。但是有那麼多的語言要去做,還有很多工程方面的問題要去解決,今天微軟也只提供60種語言而已,世界上有6500多種語言,怎麼樣把人工智能普及化,也是我們要考慮的。

微軟亞洲研究院不是公益組織,研究員對公司是有責任的,要把技術轉化為產品

問:怎麼樣把研究院裡研究實際去產品化和商業化。您在成立這個團隊的時候,從研究到產品的流程有什麼變化嗎?另外一個是開發新的產品,比如大會第一天上的Demo,幫助患帕金森症的設計人員重新執行作畫,怎麼樣把這樣的研究個案去擴展開來?

沈向洋博士:這是一個非常好的問題,不知道在座有多少人做過研究,科研是很不一樣的東西,很多人不明白,說這麼多人做科研,怎麼還沒有產品化。科研就是一個很長期的東西,你要麼就不要說自己做科研,要做科研就要有耐心。比如今天大家談的熱火朝天的量子計算,具體哪天量子計算機可以做出來,沒有人知道。有人知道還得了,VC會像狼一樣撲出去了(笑)。在這一點上,美國的這套系統還是值得我們學習。從大學開始,到研究所,再到工業界。以前的AT&T和IBM,再到現在的微軟,很多公司願意花很多的錢出來做長期的科研,而絕大多數的科研成果不僅僅屬於本公司,只是自己的公司有可能得到利益。這一點我們蓋茨講得非常清楚,比如蘋果和微軟早期的成功,很重要的就是圖形用戶界面,而 graphic interface 最早是施樂做出來的,我們跟他們學習。同樣,今天微軟做了很多了不起的事,但是可能其他一些公司,甚至一些初創公司還會做得更好,這都是很正常的。

而且,做科研是非常愉快的一件事情,做科研最愉快的事情就是根本不用擔心別人在想什麼,你自己拍拍腦袋想想就可以,要有一個了不起的想法——我以前是多麼的享受做科研,後來被鮑爾默趕出來去做產品。

最近我跟微軟亞洲研究院同事交流,其實我們能夠提供最了不起的東西是一個環境,這個環境裡面不光是大家的待遇還不錯,更重要的是邊上有比自己更聰明的人,你可以向他們學習。第二,在微軟研究院我們提供一個自由的空間,從來沒有要求你一定要做什麼,研究員你自己想做什麼,你覺得應該做什麼,就去做什麼。因為你已經是最聰明的人之一了,才進得了微軟研究院。有幾個人選擇要走了,出去做VC啊,換一家公司啊,這都很正常,我們就不斷再培養下一代的人,重要的就是你要有一個能夠不斷培養人才的環境。

當然,因為你不是一個公益的研究院,當然對公司是有責任的,包括最重要的一件事情,就是從技術到產品的轉化。目前,AI本身今天很多的東西還在研究階段,所以今天微軟重組,把AI和研究院放在同一個部門——我覺得非常榮幸能夠領導這樣的部門——我們看到了非常多的機會。怎麼從技術到產品轉化這個問題,可能今天最好的例子就是認知服務,其中大概2/3的技術是原來微軟研究院做的,而且做了很多年,以前我們不是很清楚,一些計算機視覺的技術怎麼轉化成產品。但是因為有Azure,有認知服務這樣的機會,很多很多的微軟研究院的技術,都已經通過認知服務轉化成為產品。

我再給你舉兩個例子,今年7月份在夏威夷,我會去計算機視覺最大的國際會議CVPR,今年他們請我做主題演講,我演講的題目就是“Commercialize Computer Vision Success Stories and Lessons Learned”。這裡面我會舉三個例子,一個是認知服務,另外一個例子是我們最近推出了一款很了不起的相機iOS App,叫Microsoft Pix,大家有機會可以試一試。第一版出來的時候,裡面就有12篇以前的論文做基礎。當然有很多其他的公司相機應用做的非常好,包括iPhone本身的camera做的也相當好。

第三個例子是我最喜歡的HoloLens,它研發的過程是“研和發,研和發”不斷循環的過程。HoloLens這幫人之前就是做Kinect,Kinect做出來微軟研究院就做了Kinect Fusion,又做了一個項目叫Holodesk,如果是三維的東西,你怎麼樣加一些三維的虛擬物體進去。後來微軟有一批非常了不起的做產品和設計的工程師,他們想到要在此基礎上做成HoloLens,在這個過程當中,裡面很多計算機視覺、語音的技術都是微軟研究院一起做的,是一個共同研發的過程。

到最後你還是要有產品,因為對普羅大眾來講,他不會去看論文,也不知道你的論文有多了不起。你要跟人解釋,最容易解釋的方法就是你給人看看你的產品,HoloLens馬上就會被人看到,我們希望有機會做一些更了不起的產品,不光是對消費者,更多是針對企業用戶的產品。我個人認為,三五年內,對AI而言最大的機會還是在企業市場中。

微軟的Cortana與谷歌Home和亞馬遜Echo有何不同

問:您剛才把微軟的Cortana還有Google、亞馬遜的相關產品對比,講到各家service都是很不同的,您能不能給我講個例子展開一下。此外,國內AI公司有一個觀點,認為如果做純2B的開發者的生意,如果提供工具,本身可能不是一個在國內環境下很好的商業模式,覺得很苦不賺錢。但您對Cortana 的定義就是一款2B的工具。我比較好奇您怎麼看?

沈向洋博士:第一個問題比較簡單,我想強調一下,其他公司在做digital assistance都做得很好,但都非常難做。最近有個人在網上做了一些調查,好像75%的時候,如果你問Alexa問題,她會說“我沒有答案”(I don’t have an answer)。實際上,今天語音這個東西,不會是因為有一家已經做了怎麼樣,其他人就不用做了,[市場還]遠遠沒有[飽和]到這個地步,谷歌也在做,亞馬遜也在做,蘋果也在做,微軟也在做,國內很多公司也在做,非常好,這個方向至少大家都看得很清楚。就像無人駕駛車一樣,大家都在做無人駕駛車,已經沒有人討論這件事會不會發生。

在這樣一個設計的過程當中,因為它本身就叫digital assistant,幫助你把事情做好。大家想的都是怎麼樣儘快找到你需要的東西,儘快幫你完成這樣的工作,在這樣的設計過程當中,完成任務的時間越短越好。另外一條思路,很特別的地方,我覺得還沒有太多的人做的是從聊天機器人:我是你的同伴,我是陪伴你的,我不幫你解決任何問題。從微軟研究院來說,我們是在兩條腿走路,這肯定是我們最不一樣的地方。

剛才新智元的記者也問到,微軟是不是隻做情感方面?不是這樣的,我們是兩條腿走路。這裡面就像我剛才講的有world knowledge、work knowledge、user knowledge,能夠幫助你解決問題。另外一個怎麼樣可以得到你的信任,怎麼樣可以跟你繼續做朋友,怎麼樣跟你繼續聊下去,在這個過程當中不斷積累知識。我們用的產品設計metrics,你能夠和你這個Agent可以聊多少個來回。Cortana也好、Siri也好,Google Now大概就是三個來回,相當於對話一個半來回。你問Siri,西雅圖的天氣怎麼樣?它說,還是下雨,你就沒什麼問題問了。但小冰就不一樣,小冰我們今天的最高對話次數是23個來回,你不斷有這樣的機會可以和它交流,在交流當中再去學習。我想強調的,並不是我們只做一個不做另外一個,就是助理(服務)和情感(陪伴)我們兩邊都要做。

第二就是你講的2B的問題,我也聽很多人講,對於一個提供商用AI服務的初創公司來講,面對像微軟這樣能稿提供很好的AI服務的公司,小公司有沒有這樣的一些商業的機會繼續活下去?這個問題我自己是這麼看:今天提供這樣所謂的API,我也覺得一般小公司可能比較難做,因為有很大的投入,收費的方式各方面還要跟很多大公司競爭。

我認為很重要的一件事,接下來商業的機會還是在於所謂的business AI。因為它每一個vertical都必須要用AI,要去做這樣的東西,你得一定要真的深入到某一個垂直行業中,必須要有很特別的data,你必須要有這樣的用戶,能夠用到AI的應用部署出去,這樣你可以做反饋。大多數的AI今天的技術不可能做到100%,甚至都不可能做到90%,它裡面有很多的錯誤。比如Alexa、Siri、Cortana,今天來講,很多時候它都沒有真正回答你的問題。但是你需要有足夠多的用戶,他願意繼續用你這樣的AI應用,給你提供反饋,給你提供數據。我自己是很看好垂直行業的。

認知計算會成為Azure重中之重;深度學習可以從安卓如何崛起中借鑑

問:您剛才的演講裡面主要是兩大塊,一塊是AI怎麼幫助開發者更好的去開發更customize應用場景,另外一塊說重新定義(redefine)。我想問一下,微軟通過人工智能對產品重新定義具體怎麼做,有什麼樣的規劃?

沈向洋博士:這個問題非常好,我今天講的主要是三個方面。AI的三大方面,第一,你要有非常強大的運算能力;第二,你要有非常了不起的算法;第三,你一定要有自己的數據。

我用微軟的例子來介紹一下,在微軟,我們當然相信,微軟所有的產品都必須要AI化,重新去定義這樣的產品。我們現在很注重的地方是兩個方面,一個是在所有的Office產品,在主旨演講中我給大家看了 PowerPoint一個功能,就是翻譯(translate)。其實PowerPoint他們還做了另外一個,我自己非常喜歡的,所謂的圖說生成(image caption):來一張照片,PowerPoint圖說生成可以自動給你出圖片說明,這個我們已經做得相當好了。

PowerPoint很多人用。這樣的數據可以幫助我們不斷改善一些算法。前不久我們也發佈Word,Word裡面使用AI技術,這也非常非常重要。

這裡面還有很多AI的技術都才剛剛開始,我自己覺得Office最激動人心的技術就是所謂的機器閱讀。前不久微軟買了一個加拿大的初創公司叫做Maluuba ,主要就是做這方面的工作,用自然語言、深度學習的方法來做這個東西。深度學習裡面一個很重要的問題,就是回答問題。我覺得對Office的影響會非常巨大,所以我們AI部門的同事和Office的同事一起在做。

另外一個就是在雲這裡,大家合作非常多,你到Azure.com主頁的產品裡面,Cognitive Services的內容放置最顯著的位置上,這是Scott和我,跟我們產品團隊的同事review了以後決定,Cognitive Services會變成Azure的重中之重。Windows還有很多AI,像HoloLens還有很多AI的技術,計算機視覺、計算機語音方面。

陸奇去了百度,你們會跟他們合作嗎

問:您剛才講到微軟在vertical領域跟一些服務商、應用商之間的合作,在平臺方面,像谷歌、亞馬遜、百度這方面的合作,怎樣去解決社會責任和公司商業利益方面?另外,陸博士去了百度之後,百度和微軟在中國人工智能的會有什麼合作嗎?

沈向洋博士:你這幾個問題都問的非常好,微軟比較特別,我們有一個微軟研究院,研究院本身是非常開放的,所有科研的東西每年我們都發很多論文,幾乎所有的公司都沒法跟我們比,到今天為止,過去這20多年下來,在所有的計算機領域最一流的位置上,最佳論文獎獲得者,微軟研究院遙遙領先全球第一。我們今天微軟對社會仍然有這樣的責任,繼續做最了不起的計算機科研,包括AI這方面,並且以開放的方法去做。

從一個商業公司的角度來講,我們還是有兩個方面,你看的很準確,第一我們提供一個平臺和工具,大家都可以用的,包括科研人員、大學的老師、學生都可以用。我們公司也做垂直行業,office AI會越做越好,比如講雲裡面的應用,比如database,這些東西我們都可以繼續做。你作為一個商業的話,跟其他產品競爭很正常。這些大的公司之間,大家可以怎麼合作,可能有幾個不同的層面。

在工具層面,我舉個例子,比如講TensorsFlow,有一些新的工具出來,像深度學習做到這樣的地步,大家都覺得有道理,它就自然會出現一些工具出來。在TensorFlow出現的同時,至少有4、5個工具,比如講亞馬遜最近收了公司去做MXNet,大家各有所長。TensorFlow谷歌推的比較早,推的比較猛,用戶很多。很重要的一點,我們作為一個community,大家應該把一些力量聚集起來。

我覺得大家可以從安卓興起的過程當中學習很多東西,在深度學習下一波浪潮當中怎樣才可以做得更好,我不覺得微軟一家公司可以把這些東西都做出來。

國內公司你提到,我們就是跟國內的公司非常開放的,你剛才提到陸博士,我剛才提到很多其他的同事去其他的公司,大家的關係都非常好。大家可能知道去年11月的時候,我回去微軟亞洲研究院成立了一個院友會,亞勤、我、洪小文,我們一起組織其他人一起過來,大家這麼多年是很好的朋友,即使大家不在同一個公司一起工作的話,我覺得最重要的是大家還在一個行業,大家應該互相幫助,我當然是希望每一個同事在微軟都做的很好,希望以前的同事可以繼續做的很好。

問:微軟會不會越來越多的考慮Open Source的工具?

沈向洋博士:肯定,微軟其實現在已經非常開源了,你看我們CNTK現在完全是開源的。開源是一種文化,有不同的方法可以做開源。我自己是覺得開源對這個世界的科技發展產生了巨大的深遠影響。微軟發展很迅速,我們完全是擁抱開源。

文章來源:微信公眾號新智元

相關推薦

推薦中...