戴文淵:他曾是百度最年輕的科學家 三年從T8升到T10的大神

文|湯倩

戴文淵:他曾是百度最年輕的科學家 三年從T8升到T10的大神

戴文淵—第四範式—CEO

戴文淵,大學時帶領三人團隊奪得ACM世界冠軍和三個亞洲冠軍;曾是百度最年輕的高級科學家,三年從T8升到T10。現在,作為人工智能領域的代表,他和他創立的第四範式正在成為整個行業的標杆。

機器學習領域的技術天才

2005年,在上海舉行的ACM中,戴文淵所在的上海交通大學代表中國隊參賽。作為歷史最悠久、規模最大、級別最高的的國際大學生程序設計競賽,ACM素來被冠以"程序設計的奧林匹克"之稱。在那年的比賽中,戴文淵和他的三人小組在五個小時內完成了十道題中的八道,以高出第二名整整一道題的成績獲得世界冠軍。

隨後,戴文淵在交大繼續碩士和博士連讀的學生生涯,並指導學弟學妹多次拿到ACM的亞洲冠軍。同時,他在人工智能的研究領域也是頗有建樹,學術論文多次被NIPS, ICML, AAAI, KDD等國際頂級學術會議收錄。

隨著互聯網的飛速發展和數據量的增加,戴文淵認為人工智能落地的時機正在慢慢來到,AI有可能從實驗室實現產業落地,於是他決定找些企業聊聊自己的想法。在機緣巧合之下,戴文淵接觸到了當時百度鳳巢的負責人,因為相同的理想和情懷,2009年5月,戴文淵決定正式加入百度鳳巢。入職時,他的title以是高級工程師,而在試用期過後,就破例升至T8級別。對於年輕的戴文淵而言,T8級別不僅體現了百度對於戴文淵在AI領域的發現和創新的肯定,也意味著百度對其未來所能創造價值的深切厚望。

三年升到T10的技術大神

2009年,百度鳳巢已經推出了一段時間,雖然整個鳳巢的收入還在穩步增長,但在技術上卻遭遇了瓶頸,效率很難得到提高。為了尋找和開拓新的收入增長點,鳳巢組建了數個小團隊,包括博弈論小組,大數據小組,以及戴文淵的AI小組等。最終,由戴文淵與幾位實習生組成的AI小組取得了巨大的成績,並最終把其他幾組人才吸引過來。

戴文淵:他曾是百度最年輕的科學家 三年從T8升到T10的大神

在百度時期

對百度來說,過去的廣告投放流程是專家制定策略,形成規則。儘管當時百度已經有約一萬條規則,但這個數量對百度的搜索數據而言還是很小的。戴文淵利用機器學習技術,讓機器在很短的時間裡輕鬆寫到一千萬條策略,在制定更精細廣告投放規則的同時,相對人工的效率提升了一千倍,帶來的收入較以往平均水平提升了40%。

在隨後幾年時間內,戴文淵一直專注於通過開發機器制定規則。到2013年,百度鳳巢已經擁有一千億條規則,而他也已經是一位帶領數百名研發人員的T10科學家,在百度內部被稱為“戴神”。但是,在入職百度滿四年時,他選擇了離開。因為戴文淵認為自己身上的標籤應該是人工智能,而非廣告。當時在百度,他只能把人工智能落地化到廣告這一個場景,而他想把人工智能的福利帶給更多人。

AI for everyone,提供人工智能服務

從百度離職後,戴文淵去了香港,加盟華為,擔任諾亞方舟實驗室主任科學家,做TOB的企業服務,嘗試用企業服務的方式做AI,把華為大數據產品提供給客戶。“我當時的工作性質有點類似於售前工程師,把產品的價值傳遞給客戶,在專業人士和普通人士之間建立一座橋樑,將產品轉變成普通人可以理解的模式。

戴文淵:他曾是百度最年輕的科學家 三年從T8升到T10的大神

第四範式

2014年,戴文淵離開華為,次年便和機器學習領域的頂尖科學家、資深工程師、金融和諮詢專家一起,創立了行業領先的人工智能技術與服務提供企業——第四範式,並擔任CEO。

戴文淵說道,“第四範式這個詞最早是在2005年提出來的,即用機器和數據寫規則。在“第四範式”之前還有:第一範式原始人記錄自然現象,鑽木取火下次重複;第二範式理論科學,總結出規律,後人知道規律就可以,比如牛頓物理學等;第三範式計算機推演,做的更復雜,比如核試驗,天氣預報等。所以,我們第四範式就是致力於要讓機器幹牛頓的事,看到數據總結規律”。

第四範式秉持“AI for everyone”的理念,基於應用場景開發出顯著提升競爭力的行業解決方案。 戴文淵認為這個業務發展將經歷三個階段:第一個階段將算法作為“屠龍刀”,即打造平臺,開發產品和服務;第二個階段“摘葉飛花皆可傷人”,即應用階段,不拘泥某種具體算法,即使很low的算法也能玩出很棒的花樣,比如幫助企業進行決策,是否投放一條廣告、要不要向市場推出一種產品;第三個階段“無招勝有招”,平臺會分層,找最合適的技術,自行造出一把新的“屠龍刀”。

“我們正在嘗試用AI改變很多行業的傳統工作方法”,戴文淵說,“以金融行業為例,AI可以成為最好的風控專家,銀行現有的反欺詐專家系統無法與AI媲美。近期,我們為一家大型銀行設計和上線了反欺詐模型。我們的工程師通過快速理解客戶的需求,依靠機器設計和實現目標模型,幫助該行的反欺詐工作效率較以往提升了四倍之多”。

在第四範式現在的員工中,研發人員佔比70%,除了算法科學家之外,還有大量開發工程師在負責產品落地化。為了實現“AI for everyone”,第四範式自主研發出國內首個面向應用者的人工智能開發平臺——“先知”,該平臺為企業提供快速完成AI轉型的便捷方式。基於“先知”,企業工程師甚至是業務人員,能夠在1人月內開發出適用於本行業的人工智能應用。“我們就是這樣一家很酷的企業”,戴文淵笑道,“我們的願景是讓人工智能觸手可及”。

人工智能行業還不到冰山一角

在戴文淵看來,現在人工智能的應用場景還是冰山一角,距離多領域、多場景的廣泛爆發和商業化落地則還有很長的路要走。用他的話說:“按照現在的趨勢來看,在軟件、互聯網層面,人工智能的影響會發展地非常快,但就機器人、無人駕駛等涉及實體產品的領域,發展速度則會相對較慢,因為產業鏈長而複雜”。

同時,現在有越來越多的科學家和學者開始人工智能領域的創業,對整個人工智能的產學結合會產生很大影響。戴文淵認為,最後創業成功的跨界科學家,他們不僅能夠及時緊跟科學理論的前沿發展,而且還能靠近當代商業,具備敏銳洞察力,推動AI技術高速發展。

百老匯最大的價值在於情感維繫

對於百老匯,戴文淵直言,雖然離開百度很久,但一直注重與同為百度出身的各界人士的交往和溝通,之後也加入了百老匯創業群,參加過百老匯2016年年會。戴文淵說道:“百老匯的價值是,它是一種情感維繫。大家在一起聊起以前做過的事情,是一件很好玩,很開心的事情。”

高級大數據研發工程師

職位描述:

  • 設計、開發、優化機器學習場景下的工作流引擎、通用數據處理框架和通用計算組件;

  • 探索、設計、開發機器學習場景下高效穩定的大數據並行處理算法 ;

  • 探索、調研、開發人工智能應用中的相關數據技術,豐富產品功能;

任職要求

  • 3+年的大數據系統或後端研發經驗;紮實的算法和數據結構功底,熟練掌握Java、Scala、C++中至少一門編程語言;

  • 掌握分佈式系統原理,掌握Hadoop相關技術,熟悉主流框架(如MapReduce,Spark),並有2年+的Hadoop開發經驗;

  • 具備一定的系統設計能力,主持或參與設計過大數據業務系統架構,併成功發佈/上線;

  • 參與過系統底層優化項目或編譯器後端優化項目者優先;

  • 具有開源項目貢獻者,尤其是Hadoop或編譯器相關項目優先;

  • 具有ACM-ICPC等程序設計競賽參賽、獲獎經歷者優先。

自然語言處理研究員

工作地點:北京

職位描述:

  • 負責大規模非結構化的文本信息挖掘、語義理解相關的研發工作

  • 負責領域知識圖譜的構建

  • 負責團隊基礎NLP工具開發和維護

  • 探索、使用業界最前沿的方法提升現有NLP能力

任職要求

  • 計算機相關專業本科及以上學歷

  • 自然語言處理、機器學習、數據挖掘或相關專業

  • 基礎紮實,編碼過關,熟悉常用的算法和數據結構

  • 熟悉Linux操作系統開發環境,熟悉數據分析

  • 具有海量數據處理經驗者優先

  • 加分項:

  • 在自然語言領域國際頂級會議等發表過論文

  • 熟悉中文NLP不同子領域問題及解決方案技術

  • 熟悉End-to-End中文NLP解決方案優先

  • 有過中文NLP、QA、知識圖譜方向項目、實踐經驗者優先

  • 在自然語言領域國際頂級會議等發表過論文

  • 熟悉中文NLP不同子領域問題及解決方案技術

  • 熟悉End-to-End中文NLP解決方案優先

  • 有過中文NLP、QA、知識圖譜方向項目、實踐經


相關推薦

推薦中...