在阿里AI實驗室做NLP高級算法工程師是一種什麼樣的體驗?

在阿里AI實驗室做NLP高級算法工程師是一種什麼樣的體驗?

最近應屆生的拼搶大戰的號角已經吹響。正如昨天那篇雄文,年薪25萬也只是個白菜價......這讓營長真心羞愧啊.....同樣敲鍵盤的...不說也罷

絕不將小小的憂桑帶入工作。

這幾天,群裡一直有很多小夥伴在打聽在不同的熱門公司工作,都有啥不一樣的體驗。

為了能幫助各位還在象牙塔的程序員哥哥們提前瞭解,營長決心不遺餘力地多多走訪一些業內的熱門公司,跟每天在裡面工作的資深大牛們聊一聊,扒一扒,看看在這些公司工作,到底是個腫麼樣的體驗。

這次要帶來的是在阿里AI實驗室工作的阿里人工智能實驗室高級算法專家姜飛俊(btw,這位哥哥已經接受邀請,回頭線上也來分享一些做天貓精靈的技術體會,還是先上個帥照吧。

在阿里AI實驗室做NLP高級算法工程師是一種什麼樣的體驗?

阿里人工智能實驗室高級算法專家姜飛俊

搬好小馬紮坐好了,廢話少說,問答開始~

1. 自從來到阿里做自然語言理解的工程師,睡眠時間還能保證嗎?

在阿里挺多年了,已經習慣了這種工作節奏,一般我們在項目關鍵節點的時候會比較忙,別的時候其實還好的,所以正常情況下每天的睡眠時間還是有保證的。

2. 每天睜開眼後,最大的壓力是什麼?

現在線上每天有非常多的用戶在使用我們的nlp服務,第一在阿里的技術體系裡,服務的可用性是底線,所以一部分壓力來自擔心我們服務會不會出故障,第二用戶對自然語言理解的要求是比較高的,我們每天都會收到用戶的反饋,然後我們讓機器去優化語言理解的能力。

3. 作為一個阿里人工智能實驗室的高級算法專家,您每天的工作日程,包括休息日,您會做些什麼呢?

我們每天早上會開一個晨會,彙總下過去24小時收集到的用戶反饋,然後討論下解決的方案,接下來就會安排相應同學去解決這些問題。同時我們自然語言理解模型的優化也是一個持續的過程,這裡面涉及到我們對深度學習網絡結構的調整還有訓練方法的優化,所以我們每天會有一定的時間去跟蹤最新的技術動態和論文,同時我們也會按照制定的研發計劃做實驗,逐步推進技術的進步。

4. 您喜歡阿里實驗室裡面的工作氛圍嗎?跟您一起在實驗室工作的有多少人呢?都有哪些方向?

目前人工智能實驗室研究的方向包括了自然語言理解、知識圖譜、語音識別、聲音信號處理、計算機視覺、機器人控制、硬件研發、雲端技術研發。同時我們還有市場部和產品部門的同學,來自各種背景的同學聚集在一起,有很多可以彼此分享的內容,對大家的知識和閱歷都是一個很好的擴展。

5. 有人說,自然語言理解是AI領域排名第一的難題和挑戰,您認同嗎?

確實自然語言理解是目前非常難的問題,相比語音和圖像的感知智能,語言是認知智能,人類的知識乃至我們的文明都是通過文字來記載的,所以如果機器可以實現完善的自然語言理解,那麼這個和科幻片中的人工智能就很接近了。

所以我認為自然語言理解也是可以分層來看的,目前我們在天貓精靈裡做的大量的任務型的理解,是第一個層次的理解能力,我們認為基於目前的技術,這部分已經可以做得比較好了,換句話說,接下來大量的任務可以通過語言來指揮機器去完成。再往深入一點,就是信息獲取和問答的能力,這涉及到對人類知識的大規模建模,以及對用戶問題的深度理解,所以還是目前非常有挑戰的問題。第三個層面,就是讓機器和人進行自然的交流,機器能有情商,可以感知到用戶的情緒,機器也能有一定的性格,目前來看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來都給人一種智障的感覺。

所以總結來講,對機器自然語言理解能力的提升,還有非常漫長的路要走,甚至需要基礎科學的突破。

6. 在自然語言理解這個領域,您最欣賞和佩服的人是誰?

在這裡領域我最佩服和欣賞的是深度學習四大天王之一的Prof. Yoshua Bengio。Bengio教授帶領的團隊在自然語言理解領域的深度網絡上做了很多大膽的創新,也取得了很不錯的成果,始終走在自然語言理解探索的最前沿。

7. 在天貓精靈這款產品的開發中,您在裡面具體會承擔哪些方面的工作呢?

我及我的團隊主要負責天貓精靈的自然語言理解技術,在這裡我主要承擔三部分的工作,第一個是模型的設計及優化,選擇合適的算法方案來實現最優的效果,第二個是設計這套自然語言理解系統,從無到有,經歷了多代的演進,我們搭建了這套我們認為是比較適合目前的語音交互的自然語言理解系統,第三個是解決問題,當遇到具體的問題時,我需要去分析這個問題在哪個模塊去解決是最合適的。同時我也會跟進團隊同學的工作,並且review code。

8. 您來實驗室之前,以及工作了這麼久之後,對自然語言理解用於解決實際問題上,會不會有一些不同的新的認知和感悟?

我是人工智能實驗室創始團隊成員,之前一直在阿里集團大數據部門從事圖像識別、推薦系統等算法工作。

在人工智能實驗室一直從事自然語言理解領域的工作,在解決實際問題的時候,可以分享下最大的感悟吧,就是細節是魔鬼,整個算法系統涉及到大量的算法子模塊,我們在進行效果優化的過程中,發現一些容易被我們忽略的細節,如果進行了優化,會對整體效果帶來明顯的提升,感悟就是要嚴謹的分析問題然後要去懷疑細節。

9. 在您解決實際問題中,會綜合用到其他哪些技能呢?比如,知識圖譜?

在解決實際問題的時候,我們會去嘗試各種文本的技術,當然知識圖譜對我們的自然語言理解是非常重要的。知識圖譜可以給我們很多先驗知識,它包含了對這個世界的認知信息,是我們進行意圖判斷很重要的參考。

10. 對於對自然語言處理非常感興趣的,正在努力學習,希望未來從事這個領域相關工作的同學,從您自身出發,有沒有想要分享的一些心得感悟?

自然語言理解需要兩方面的能力,機器學習的能力,當然也包括目前炙手可熱的深度學習方法,和對語言本身特點的理解,所以我覺得這兩部分的內容的學習和實踐都很重要。

11.如果讓您給未來會從事自然語言理解實戰相關工作的同學提三個中肯的建議,您覺得是什麼?

第一個,對機器學習和深度學習方法能有很紮實的掌握,更深入一點,比如凸優化等數學理論能有所掌握。

第二個,語音本身是很有魅力的,是一種人類創造出來的符號語言,所以對語言本身的理解,是我們目前發現自然語言理解技術進一步前進很需要去思考的。

第三個,其實和所有的算法工作是一樣的,就是要養成思辨的思維習慣(critical thinking)和獨立的思考能力(independent thinking)。

12. 目前NLP領域,大致會分為哪些具體的工作,一般來說,不同的工種,不同的工作年限,不同的學歷,工資待遇大致會是什麼範圍?

我們這邊,大致會有三種類型的工作,一種是做算法模型的,包括深度學習模型還是傳統的模型,第二種是做自然語言理解系統的搭建的,第三種是利用自然語言理解技術去實現業務邏輯和產品功能的。目前來講這部分工程師的待遇還是相當有競爭力的。

13. 如果想加入您的團隊,您會有哪些要求呢?

對技術的熱愛,也就是對做的技術有熱情,會用心去思考所做技術的每個細節。有紮實的技術基礎,算法的基礎和代碼的基礎。

14. 如果重新選擇,還會選擇NLP嗎?

是的,還會選擇nlp,因為這部分的技術是我們走向真正的智能所需要去突破的核心技術。這是這幾年發展速度會非常快的領域。

15. 從技術上,以及個人理解上,您會將NLP的發展分為幾個階段?下一個階段NLP將會是一個怎樣的趨勢?

我其實在回答第5個問題的時候已經回答了這個問題:

我認為自然語言理解也是可以分層來看的,目前我們在天貓精靈裡做的大量的任務型的理解,是第一個層次的理解能力,我們認為基於目前的技術,這部分已經可以做得比較好了,換句話說,接下來大量的任務可以通過語言來指揮機器去完成。再往深入一點,就是信息獲取和問答的能力,這涉及到對人類知識的大規模建模,以及對用戶問題的深度理解,所以還是目前非常有挑戰的問題。第三個層面,就是讓機器和人進行自然的連續交流,機器能有情商,可以感知到用戶的情緒,機器也能有一定的性格,目前來看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來都給人一種智障的感覺。

目前來看,第一個階段,任務型的nlp已經可以比較好的達成了,第二個階段,知識庫的建設和知識應用於自然語言交互,會是接下來很重要的趨勢。

16. 如果用一句話總結您所做的工作,用一句非常走心的話,別太套路,您覺得是什麼?

用最前沿的技術,讓人可以直接用語言與機器進行自然交流,讓內容和服務變得隨口既來,讓更多的人能享受到智能時代所帶來的便捷。

儘管營長一再強調,最後一個問題不要套路啊,要走心啊,但似乎姜飛俊哥哥的回答,還是落入俗套了,不好玩不好玩。不過,單從長相來看,這顏值在技術員中也是中上了,有木有

告訴營長,你們還想知道哪個熱門公司,哪些崗位的日常工作情況,營長會去評論區仔細篩查,選中的營長可就幫你打前哨去啦~~不留言的先站住,好歹為營長的專門利人的服務精神點個贊再準你退下。

相關推薦

推薦中...