'如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎?'

"

今天在知乎看到了這個問題:如何看待 2020 屆校招算法崗「爆炸」的情況?於是嘗試回答了一發。

先說說我的個人結論:候選人數目爆炸,但是優秀的候選人並沒有增加太多。公司不是不想招人,是招不到合適的人。女神不是不想找男朋友,是不想找個屌絲做男朋友。另外,找工作其實是門玄學,對於絕大多數資質普通的應屆生來說,找工作不僅拼實力,也很大程度靠運氣。

我在某“手機 + AIoT”廠商做推薦算法,七八月份也在陸陸續續面試校招提前批,從我個人面試的體驗來看,候選人確實變多了,而且很多都是從其他理工科背景轉行過來的,但是優秀的候選人並不多。可能我們是二線公司,最牛逼的那波應屆畢業生都去面BAT、TMD、曠視這種聽起來高大上的公司了,我們這邊接到的內推簡歷以及2019年入職的新人背景並不是頂尖985高校。我們工資不高,但據說往年都有北京戶口這樣一個大福利。。。

下面我將從一些個人體驗來解釋我上面的結論。

算法崗到底缺不缺人

缺人!

貿易戰、整體經濟下行、AI商業化困難,2019年的人工智能行業似乎並不是那麼樂觀,各大公司也被先後爆料出裁員醜聞。加上這幾年各路媒體一直炒作算法崗薪資奇高,導致大批學生投機轉行人工智能,給人的感覺是算法崗已經供過於求。儘管如此,我個人感覺2019年末的這個時間點上,算法崗依然缺人,而且缺那些有實戰經驗的牛逼人才。

我們一個同事一年社招面試了上百人,發了二三十個offer,最後只來了一兩個。另一個同事天天刷Boss直聘,幾乎每週面試兩三個候選人。面試又不能漲工資提業績,誰閒著沒事不好好幹活,天天陪候選人面試聊人生聊理想啊。如果不缺人,還要面什麼試。

只要一個公司還在向前發展,那他們的算法崗絕對缺人。否則,華為不會百萬年薪招博士,阿里不會搞個阿里星,百度不會推出少帥計劃。否則,不會有這麼多人在知乎這個問題上發招聘啟事。

然而,對於應聘者來說,尤其是應屆畢業生,他們的信息是不對稱的。應屆生相關經驗薄弱,人脈又少,不知道哪個公司最缺人,不知道公司想招什麼樣人,不知道自己要增強哪方面的技能...候選人和招聘單位之間有很大的信息不對稱。因此,面試找工作似乎成了一種撞大運的玄學,包括我在內,大部分人其實都不是華為百萬、阿里星或少帥計劃,找工作這個過程很可能是靠運氣。這個運氣包括:有沒有人幫忙內推;目標公司是否在那個時間點說要重點發展某項業務並增加人力資源支持;你的技能是否正好與目標崗位大致匹配;甚至是大神都被其他公司搶走了,正好給你留下了這個坑。

比如,我們大組2019年新來的一個同學是春季補招進來的,並非頂尖985,當時發了offer,但也考慮到這人有其他offer,很可能不會過來了,結果人家還真來了。這週一剛面的一個北郵小夥,不懂算法,沒接觸過大數據,但是對Java開發比較熟悉,負責人說先拉過來做做系統開發的工作,結果也給了提前批offer。看著知乎上很多應屆朋友天天抱怨算法崗爆炸,你說我們招聘的這波操作氣不氣人。

另外,我們作為求職方,一般會騎驢找馬,手握多方offer,然後做選擇。對於招聘方,也是一樣左右權衡,試圖招聘到最佳的候選人。

所以說,算法崗缺人,但是如果沒有好的內推渠道,沒有針對這個崗位的技能,很可能就是陪跑。

面試體驗:缺乏實戰經驗

從我面試的體驗來看,還沒有遇到神仙打架的場景。可能最牛的那些人都去阿里星,百度少帥了吧。我面試的幾個候選人,多是統計、電子、通信背景的,並不是100%計算機背景,學校一般是二線985。有一兩份大廠數據分析崗或小廠算法崗實習的候選人,一般有一定的算法基礎,機器學習問題回答得都還可以。簡歷上寫了一大堆高大上的DNN模型,實際問起來,只是把網上的樣例程序拿過來,在某個數據集上跑跑,對模型的理解並不深刻。沒有實習經驗的候選人一般對大數據使用不多,不瞭解Hadoop和Spark,即使用過,也說不清Spark一些稍微細節的原理。其他專業轉行的候選人相對編碼能力一般。有一個候選人說自己刷了200道LeetCode,但還是不能立馬寫出二叉樹前序遍歷。另一個候選人說,我係統學過大數據Spark,都記在我的筆記本上了,你這個問題我學過,等我我翻開本子給你找一下答案。再之前面暑期實習,候選人說自己對自然語言處理感興趣,於是我問如果讓你從頭到尾訓練一個詞向量,你怎麼做,這位小哥支支吾吾說不上來。

從學校到職場,對一個人的技能要求差距還是蠻大的。我也是從學生時代過來,我知道對於大多數普通學生來說,沒太多實戰經驗,天天只刷題,看西瓜書,是搞不清楚一些底層原理,更不可能做一個線上系統的。“無他,唯手熟爾!”很多東西沒那麼難,多練練,就熟悉了。但恰恰應屆生缺少這些練習的場景。破解這個困局的最好方式就是找實習,最好是大廠實習。

我也知道不能用對社招標準要求校招候選人。但從實際工作角度,校招過來的員工從入門到上手工作,一般要三四個月的熟悉時間。公司老闆為了節省成本,肯定希望招聘一個各方面能力優秀的校招生,以儘量縮短這個熟悉時間。

算法崗到底考察候選人什麼技能

"

今天在知乎看到了這個問題:如何看待 2020 屆校招算法崗「爆炸」的情況?於是嘗試回答了一發。

先說說我的個人結論:候選人數目爆炸,但是優秀的候選人並沒有增加太多。公司不是不想招人,是招不到合適的人。女神不是不想找男朋友,是不想找個屌絲做男朋友。另外,找工作其實是門玄學,對於絕大多數資質普通的應屆生來說,找工作不僅拼實力,也很大程度靠運氣。

我在某“手機 + AIoT”廠商做推薦算法,七八月份也在陸陸續續面試校招提前批,從我個人面試的體驗來看,候選人確實變多了,而且很多都是從其他理工科背景轉行過來的,但是優秀的候選人並不多。可能我們是二線公司,最牛逼的那波應屆畢業生都去面BAT、TMD、曠視這種聽起來高大上的公司了,我們這邊接到的內推簡歷以及2019年入職的新人背景並不是頂尖985高校。我們工資不高,但據說往年都有北京戶口這樣一個大福利。。。

下面我將從一些個人體驗來解釋我上面的結論。

算法崗到底缺不缺人

缺人!

貿易戰、整體經濟下行、AI商業化困難,2019年的人工智能行業似乎並不是那麼樂觀,各大公司也被先後爆料出裁員醜聞。加上這幾年各路媒體一直炒作算法崗薪資奇高,導致大批學生投機轉行人工智能,給人的感覺是算法崗已經供過於求。儘管如此,我個人感覺2019年末的這個時間點上,算法崗依然缺人,而且缺那些有實戰經驗的牛逼人才。

我們一個同事一年社招面試了上百人,發了二三十個offer,最後只來了一兩個。另一個同事天天刷Boss直聘,幾乎每週面試兩三個候選人。面試又不能漲工資提業績,誰閒著沒事不好好幹活,天天陪候選人面試聊人生聊理想啊。如果不缺人,還要面什麼試。

只要一個公司還在向前發展,那他們的算法崗絕對缺人。否則,華為不會百萬年薪招博士,阿里不會搞個阿里星,百度不會推出少帥計劃。否則,不會有這麼多人在知乎這個問題上發招聘啟事。

然而,對於應聘者來說,尤其是應屆畢業生,他們的信息是不對稱的。應屆生相關經驗薄弱,人脈又少,不知道哪個公司最缺人,不知道公司想招什麼樣人,不知道自己要增強哪方面的技能...候選人和招聘單位之間有很大的信息不對稱。因此,面試找工作似乎成了一種撞大運的玄學,包括我在內,大部分人其實都不是華為百萬、阿里星或少帥計劃,找工作這個過程很可能是靠運氣。這個運氣包括:有沒有人幫忙內推;目標公司是否在那個時間點說要重點發展某項業務並增加人力資源支持;你的技能是否正好與目標崗位大致匹配;甚至是大神都被其他公司搶走了,正好給你留下了這個坑。

比如,我們大組2019年新來的一個同學是春季補招進來的,並非頂尖985,當時發了offer,但也考慮到這人有其他offer,很可能不會過來了,結果人家還真來了。這週一剛面的一個北郵小夥,不懂算法,沒接觸過大數據,但是對Java開發比較熟悉,負責人說先拉過來做做系統開發的工作,結果也給了提前批offer。看著知乎上很多應屆朋友天天抱怨算法崗爆炸,你說我們招聘的這波操作氣不氣人。

另外,我們作為求職方,一般會騎驢找馬,手握多方offer,然後做選擇。對於招聘方,也是一樣左右權衡,試圖招聘到最佳的候選人。

所以說,算法崗缺人,但是如果沒有好的內推渠道,沒有針對這個崗位的技能,很可能就是陪跑。

面試體驗:缺乏實戰經驗

從我面試的體驗來看,還沒有遇到神仙打架的場景。可能最牛的那些人都去阿里星,百度少帥了吧。我面試的幾個候選人,多是統計、電子、通信背景的,並不是100%計算機背景,學校一般是二線985。有一兩份大廠數據分析崗或小廠算法崗實習的候選人,一般有一定的算法基礎,機器學習問題回答得都還可以。簡歷上寫了一大堆高大上的DNN模型,實際問起來,只是把網上的樣例程序拿過來,在某個數據集上跑跑,對模型的理解並不深刻。沒有實習經驗的候選人一般對大數據使用不多,不瞭解Hadoop和Spark,即使用過,也說不清Spark一些稍微細節的原理。其他專業轉行的候選人相對編碼能力一般。有一個候選人說自己刷了200道LeetCode,但還是不能立馬寫出二叉樹前序遍歷。另一個候選人說,我係統學過大數據Spark,都記在我的筆記本上了,你這個問題我學過,等我我翻開本子給你找一下答案。再之前面暑期實習,候選人說自己對自然語言處理感興趣,於是我問如果讓你從頭到尾訓練一個詞向量,你怎麼做,這位小哥支支吾吾說不上來。

從學校到職場,對一個人的技能要求差距還是蠻大的。我也是從學生時代過來,我知道對於大多數普通學生來說,沒太多實戰經驗,天天只刷題,看西瓜書,是搞不清楚一些底層原理,更不可能做一個線上系統的。“無他,唯手熟爾!”很多東西沒那麼難,多練練,就熟悉了。但恰恰應屆生缺少這些練習的場景。破解這個困局的最好方式就是找實習,最好是大廠實習。

我也知道不能用對社招標準要求校招候選人。但從實際工作角度,校招過來的員工從入門到上手工作,一般要三四個月的熟悉時間。公司老闆為了節省成本,肯定希望招聘一個各方面能力優秀的校招生,以儘量縮短這個熟悉時間。

算法崗到底考察候選人什麼技能

如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎?

數據科學金字塔 來源:hackernoon.com

我個人理解,除了那些頂級的數據科學家外,工業界99%的人都是在做業務相關的事情,要對業務指標負責。說白了,公司僱傭你,是為了讓你所做的事情能夠幫公司賺錢,你發多少頂會的paper,如果不能幫老闆賺錢,都沒用

有人在討論論文到底有沒有用。這個問題很好回答,有沒有用,主要看這個崗位和你的論文有沒有關係。你投推薦算法,但是發了一些計算機視覺的論文,面試官內心的OS是這玩意又不能立馬幫我們組提高產出,招進來培養半天,還不一定留得住,招進來幹啥,於是簡歷石沉大海……所以,這裡又涉及到剛才說的信息不匹配和運氣成分的問題。

還有人討論為啥要考編程題。你一沒大廠實習經歷,二沒具體業務經驗,不懂大數據,又對機器學一知半解,這些都沒關係,只要腦子聰明,邏輯思維強,進來可以再學嘛。但是,面試官怎麼衡量你聰不聰明?怎麼看你是不是個可栽培的好苗子?那就寫個小題目吧。其實很多公司不怕候選人不懂機器學習,怕的是候選人不會寫代碼,或不想寫代碼。

在我看來,一個算法工程師在實際工作中主要關心兩點:

  1. 構建機器學習模型
  2. 將模型發佈到生產系統

很多朋友看到網上的機器學習例子中,只需要調用一下model.fit()函數就能訓練一個模型,認為機器學習非常簡單。實際上,一個機器學習流程很長,包括:模型選擇、數據預處理、特徵工程、樣本生成、模型調優以及模型上線。整個工作對工程師的各項技能要求也非常高。

"

今天在知乎看到了這個問題:如何看待 2020 屆校招算法崗「爆炸」的情況?於是嘗試回答了一發。

先說說我的個人結論:候選人數目爆炸,但是優秀的候選人並沒有增加太多。公司不是不想招人,是招不到合適的人。女神不是不想找男朋友,是不想找個屌絲做男朋友。另外,找工作其實是門玄學,對於絕大多數資質普通的應屆生來說,找工作不僅拼實力,也很大程度靠運氣。

我在某“手機 + AIoT”廠商做推薦算法,七八月份也在陸陸續續面試校招提前批,從我個人面試的體驗來看,候選人確實變多了,而且很多都是從其他理工科背景轉行過來的,但是優秀的候選人並不多。可能我們是二線公司,最牛逼的那波應屆畢業生都去面BAT、TMD、曠視這種聽起來高大上的公司了,我們這邊接到的內推簡歷以及2019年入職的新人背景並不是頂尖985高校。我們工資不高,但據說往年都有北京戶口這樣一個大福利。。。

下面我將從一些個人體驗來解釋我上面的結論。

算法崗到底缺不缺人

缺人!

貿易戰、整體經濟下行、AI商業化困難,2019年的人工智能行業似乎並不是那麼樂觀,各大公司也被先後爆料出裁員醜聞。加上這幾年各路媒體一直炒作算法崗薪資奇高,導致大批學生投機轉行人工智能,給人的感覺是算法崗已經供過於求。儘管如此,我個人感覺2019年末的這個時間點上,算法崗依然缺人,而且缺那些有實戰經驗的牛逼人才。

我們一個同事一年社招面試了上百人,發了二三十個offer,最後只來了一兩個。另一個同事天天刷Boss直聘,幾乎每週面試兩三個候選人。面試又不能漲工資提業績,誰閒著沒事不好好幹活,天天陪候選人面試聊人生聊理想啊。如果不缺人,還要面什麼試。

只要一個公司還在向前發展,那他們的算法崗絕對缺人。否則,華為不會百萬年薪招博士,阿里不會搞個阿里星,百度不會推出少帥計劃。否則,不會有這麼多人在知乎這個問題上發招聘啟事。

然而,對於應聘者來說,尤其是應屆畢業生,他們的信息是不對稱的。應屆生相關經驗薄弱,人脈又少,不知道哪個公司最缺人,不知道公司想招什麼樣人,不知道自己要增強哪方面的技能...候選人和招聘單位之間有很大的信息不對稱。因此,面試找工作似乎成了一種撞大運的玄學,包括我在內,大部分人其實都不是華為百萬、阿里星或少帥計劃,找工作這個過程很可能是靠運氣。這個運氣包括:有沒有人幫忙內推;目標公司是否在那個時間點說要重點發展某項業務並增加人力資源支持;你的技能是否正好與目標崗位大致匹配;甚至是大神都被其他公司搶走了,正好給你留下了這個坑。

比如,我們大組2019年新來的一個同學是春季補招進來的,並非頂尖985,當時發了offer,但也考慮到這人有其他offer,很可能不會過來了,結果人家還真來了。這週一剛面的一個北郵小夥,不懂算法,沒接觸過大數據,但是對Java開發比較熟悉,負責人說先拉過來做做系統開發的工作,結果也給了提前批offer。看著知乎上很多應屆朋友天天抱怨算法崗爆炸,你說我們招聘的這波操作氣不氣人。

另外,我們作為求職方,一般會騎驢找馬,手握多方offer,然後做選擇。對於招聘方,也是一樣左右權衡,試圖招聘到最佳的候選人。

所以說,算法崗缺人,但是如果沒有好的內推渠道,沒有針對這個崗位的技能,很可能就是陪跑。

面試體驗:缺乏實戰經驗

從我面試的體驗來看,還沒有遇到神仙打架的場景。可能最牛的那些人都去阿里星,百度少帥了吧。我面試的幾個候選人,多是統計、電子、通信背景的,並不是100%計算機背景,學校一般是二線985。有一兩份大廠數據分析崗或小廠算法崗實習的候選人,一般有一定的算法基礎,機器學習問題回答得都還可以。簡歷上寫了一大堆高大上的DNN模型,實際問起來,只是把網上的樣例程序拿過來,在某個數據集上跑跑,對模型的理解並不深刻。沒有實習經驗的候選人一般對大數據使用不多,不瞭解Hadoop和Spark,即使用過,也說不清Spark一些稍微細節的原理。其他專業轉行的候選人相對編碼能力一般。有一個候選人說自己刷了200道LeetCode,但還是不能立馬寫出二叉樹前序遍歷。另一個候選人說,我係統學過大數據Spark,都記在我的筆記本上了,你這個問題我學過,等我我翻開本子給你找一下答案。再之前面暑期實習,候選人說自己對自然語言處理感興趣,於是我問如果讓你從頭到尾訓練一個詞向量,你怎麼做,這位小哥支支吾吾說不上來。

從學校到職場,對一個人的技能要求差距還是蠻大的。我也是從學生時代過來,我知道對於大多數普通學生來說,沒太多實戰經驗,天天只刷題,看西瓜書,是搞不清楚一些底層原理,更不可能做一個線上系統的。“無他,唯手熟爾!”很多東西沒那麼難,多練練,就熟悉了。但恰恰應屆生缺少這些練習的場景。破解這個困局的最好方式就是找實習,最好是大廠實習。

我也知道不能用對社招標準要求校招候選人。但從實際工作角度,校招過來的員工從入門到上手工作,一般要三四個月的熟悉時間。公司老闆為了節省成本,肯定希望招聘一個各方面能力優秀的校招生,以儘量縮短這個熟悉時間。

算法崗到底考察候選人什麼技能

如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎?

數據科學金字塔 來源:hackernoon.com

我個人理解,除了那些頂級的數據科學家外,工業界99%的人都是在做業務相關的事情,要對業務指標負責。說白了,公司僱傭你,是為了讓你所做的事情能夠幫公司賺錢,你發多少頂會的paper,如果不能幫老闆賺錢,都沒用

有人在討論論文到底有沒有用。這個問題很好回答,有沒有用,主要看這個崗位和你的論文有沒有關係。你投推薦算法,但是發了一些計算機視覺的論文,面試官內心的OS是這玩意又不能立馬幫我們組提高產出,招進來培養半天,還不一定留得住,招進來幹啥,於是簡歷石沉大海……所以,這裡又涉及到剛才說的信息不匹配和運氣成分的問題。

還有人討論為啥要考編程題。你一沒大廠實習經歷,二沒具體業務經驗,不懂大數據,又對機器學一知半解,這些都沒關係,只要腦子聰明,邏輯思維強,進來可以再學嘛。但是,面試官怎麼衡量你聰不聰明?怎麼看你是不是個可栽培的好苗子?那就寫個小題目吧。其實很多公司不怕候選人不懂機器學習,怕的是候選人不會寫代碼,或不想寫代碼。

在我看來,一個算法工程師在實際工作中主要關心兩點:

  1. 構建機器學習模型
  2. 將模型發佈到生產系統

很多朋友看到網上的機器學習例子中,只需要調用一下model.fit()函數就能訓練一個模型,認為機器學習非常簡單。實際上,一個機器學習流程很長,包括:模型選擇、數據預處理、特徵工程、樣本生成、模型調優以及模型上線。整個工作對工程師的各項技能要求也非常高。

如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎?

機器學習流水線 來源:towardsdatascience.com

對於模型訓練和線上發佈,各公司差異也比較較大。對於數據量較小的場景,可以直接用“Python + Shell + SQL”的方式構建機器學習數據流,使用scikit-learn或TensorFlow這樣的框架。對於數據量大的場景,還是必須依賴大數據處理框架Spark或Flink,並使用分佈式訓練工具。大公司一般為適配自己的數據量和業務場景,都會有一套自己的模型訓練和上線工具,並配有專人來開發和維護這套機器學習框架。因此,在一個大公司裡,可能有一部分人負責模型訓練,主要是模型調參和特徵工程;一部分人負責模型上線,主要保障模型能夠提供穩定的在線服務;一部分人負責機器學習框架開發;機器學習並不是萬能的,所以還需要一部分人使用人工策略來解決機器算法無法解決的那部分問題。聽起來好像所有人的職責都帶機器學習幾個字,實際做的事情區別很大,所側重各有不同。

在實際工作中絕大多數算法工程師要做的事情包括數據清洗、ETL、AB實驗、模型上線等一系列問題。因為我們的算法崗不僅要懂機器學習,也要用會使用Spark這樣的大數據框架來生成樣本、構建數據流,因此比較偏向有大數據經驗的同學。而且大廠的模型上線很可能需要用C++寫一遍,因此還需要一些人做線上預測模塊。這時候,你會Spark或者精通C++,都可能比你會一些深度學習模型更有優勢。

"

今天在知乎看到了這個問題:如何看待 2020 屆校招算法崗「爆炸」的情況?於是嘗試回答了一發。

先說說我的個人結論:候選人數目爆炸,但是優秀的候選人並沒有增加太多。公司不是不想招人,是招不到合適的人。女神不是不想找男朋友,是不想找個屌絲做男朋友。另外,找工作其實是門玄學,對於絕大多數資質普通的應屆生來說,找工作不僅拼實力,也很大程度靠運氣。

我在某“手機 + AIoT”廠商做推薦算法,七八月份也在陸陸續續面試校招提前批,從我個人面試的體驗來看,候選人確實變多了,而且很多都是從其他理工科背景轉行過來的,但是優秀的候選人並不多。可能我們是二線公司,最牛逼的那波應屆畢業生都去面BAT、TMD、曠視這種聽起來高大上的公司了,我們這邊接到的內推簡歷以及2019年入職的新人背景並不是頂尖985高校。我們工資不高,但據說往年都有北京戶口這樣一個大福利。。。

下面我將從一些個人體驗來解釋我上面的結論。

算法崗到底缺不缺人

缺人!

貿易戰、整體經濟下行、AI商業化困難,2019年的人工智能行業似乎並不是那麼樂觀,各大公司也被先後爆料出裁員醜聞。加上這幾年各路媒體一直炒作算法崗薪資奇高,導致大批學生投機轉行人工智能,給人的感覺是算法崗已經供過於求。儘管如此,我個人感覺2019年末的這個時間點上,算法崗依然缺人,而且缺那些有實戰經驗的牛逼人才。

我們一個同事一年社招面試了上百人,發了二三十個offer,最後只來了一兩個。另一個同事天天刷Boss直聘,幾乎每週面試兩三個候選人。面試又不能漲工資提業績,誰閒著沒事不好好幹活,天天陪候選人面試聊人生聊理想啊。如果不缺人,還要面什麼試。

只要一個公司還在向前發展,那他們的算法崗絕對缺人。否則,華為不會百萬年薪招博士,阿里不會搞個阿里星,百度不會推出少帥計劃。否則,不會有這麼多人在知乎這個問題上發招聘啟事。

然而,對於應聘者來說,尤其是應屆畢業生,他們的信息是不對稱的。應屆生相關經驗薄弱,人脈又少,不知道哪個公司最缺人,不知道公司想招什麼樣人,不知道自己要增強哪方面的技能...候選人和招聘單位之間有很大的信息不對稱。因此,面試找工作似乎成了一種撞大運的玄學,包括我在內,大部分人其實都不是華為百萬、阿里星或少帥計劃,找工作這個過程很可能是靠運氣。這個運氣包括:有沒有人幫忙內推;目標公司是否在那個時間點說要重點發展某項業務並增加人力資源支持;你的技能是否正好與目標崗位大致匹配;甚至是大神都被其他公司搶走了,正好給你留下了這個坑。

比如,我們大組2019年新來的一個同學是春季補招進來的,並非頂尖985,當時發了offer,但也考慮到這人有其他offer,很可能不會過來了,結果人家還真來了。這週一剛面的一個北郵小夥,不懂算法,沒接觸過大數據,但是對Java開發比較熟悉,負責人說先拉過來做做系統開發的工作,結果也給了提前批offer。看著知乎上很多應屆朋友天天抱怨算法崗爆炸,你說我們招聘的這波操作氣不氣人。

另外,我們作為求職方,一般會騎驢找馬,手握多方offer,然後做選擇。對於招聘方,也是一樣左右權衡,試圖招聘到最佳的候選人。

所以說,算法崗缺人,但是如果沒有好的內推渠道,沒有針對這個崗位的技能,很可能就是陪跑。

面試體驗:缺乏實戰經驗

從我面試的體驗來看,還沒有遇到神仙打架的場景。可能最牛的那些人都去阿里星,百度少帥了吧。我面試的幾個候選人,多是統計、電子、通信背景的,並不是100%計算機背景,學校一般是二線985。有一兩份大廠數據分析崗或小廠算法崗實習的候選人,一般有一定的算法基礎,機器學習問題回答得都還可以。簡歷上寫了一大堆高大上的DNN模型,實際問起來,只是把網上的樣例程序拿過來,在某個數據集上跑跑,對模型的理解並不深刻。沒有實習經驗的候選人一般對大數據使用不多,不瞭解Hadoop和Spark,即使用過,也說不清Spark一些稍微細節的原理。其他專業轉行的候選人相對編碼能力一般。有一個候選人說自己刷了200道LeetCode,但還是不能立馬寫出二叉樹前序遍歷。另一個候選人說,我係統學過大數據Spark,都記在我的筆記本上了,你這個問題我學過,等我我翻開本子給你找一下答案。再之前面暑期實習,候選人說自己對自然語言處理感興趣,於是我問如果讓你從頭到尾訓練一個詞向量,你怎麼做,這位小哥支支吾吾說不上來。

從學校到職場,對一個人的技能要求差距還是蠻大的。我也是從學生時代過來,我知道對於大多數普通學生來說,沒太多實戰經驗,天天只刷題,看西瓜書,是搞不清楚一些底層原理,更不可能做一個線上系統的。“無他,唯手熟爾!”很多東西沒那麼難,多練練,就熟悉了。但恰恰應屆生缺少這些練習的場景。破解這個困局的最好方式就是找實習,最好是大廠實習。

我也知道不能用對社招標準要求校招候選人。但從實際工作角度,校招過來的員工從入門到上手工作,一般要三四個月的熟悉時間。公司老闆為了節省成本,肯定希望招聘一個各方面能力優秀的校招生,以儘量縮短這個熟悉時間。

算法崗到底考察候選人什麼技能

如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎?

數據科學金字塔 來源:hackernoon.com

我個人理解,除了那些頂級的數據科學家外,工業界99%的人都是在做業務相關的事情,要對業務指標負責。說白了,公司僱傭你,是為了讓你所做的事情能夠幫公司賺錢,你發多少頂會的paper,如果不能幫老闆賺錢,都沒用

有人在討論論文到底有沒有用。這個問題很好回答,有沒有用,主要看這個崗位和你的論文有沒有關係。你投推薦算法,但是發了一些計算機視覺的論文,面試官內心的OS是這玩意又不能立馬幫我們組提高產出,招進來培養半天,還不一定留得住,招進來幹啥,於是簡歷石沉大海……所以,這裡又涉及到剛才說的信息不匹配和運氣成分的問題。

還有人討論為啥要考編程題。你一沒大廠實習經歷,二沒具體業務經驗,不懂大數據,又對機器學一知半解,這些都沒關係,只要腦子聰明,邏輯思維強,進來可以再學嘛。但是,面試官怎麼衡量你聰不聰明?怎麼看你是不是個可栽培的好苗子?那就寫個小題目吧。其實很多公司不怕候選人不懂機器學習,怕的是候選人不會寫代碼,或不想寫代碼。

在我看來,一個算法工程師在實際工作中主要關心兩點:

  1. 構建機器學習模型
  2. 將模型發佈到生產系統

很多朋友看到網上的機器學習例子中,只需要調用一下model.fit()函數就能訓練一個模型,認為機器學習非常簡單。實際上,一個機器學習流程很長,包括:模型選擇、數據預處理、特徵工程、樣本生成、模型調優以及模型上線。整個工作對工程師的各項技能要求也非常高。

如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎?

機器學習流水線 來源:towardsdatascience.com

對於模型訓練和線上發佈,各公司差異也比較較大。對於數據量較小的場景,可以直接用“Python + Shell + SQL”的方式構建機器學習數據流,使用scikit-learn或TensorFlow這樣的框架。對於數據量大的場景,還是必須依賴大數據處理框架Spark或Flink,並使用分佈式訓練工具。大公司一般為適配自己的數據量和業務場景,都會有一套自己的模型訓練和上線工具,並配有專人來開發和維護這套機器學習框架。因此,在一個大公司裡,可能有一部分人負責模型訓練,主要是模型調參和特徵工程;一部分人負責模型上線,主要保障模型能夠提供穩定的在線服務;一部分人負責機器學習框架開發;機器學習並不是萬能的,所以還需要一部分人使用人工策略來解決機器算法無法解決的那部分問題。聽起來好像所有人的職責都帶機器學習幾個字,實際做的事情區別很大,所側重各有不同。

在實際工作中絕大多數算法工程師要做的事情包括數據清洗、ETL、AB實驗、模型上線等一系列問題。因為我們的算法崗不僅要懂機器學習,也要用會使用Spark這樣的大數據框架來生成樣本、構建數據流,因此比較偏向有大數據經驗的同學。而且大廠的模型上線很可能需要用C++寫一遍,因此還需要一些人做線上預測模塊。這時候,你會Spark或者精通C++,都可能比你會一些深度學習模型更有優勢。

如何看待 2020 屆校招算法崗「爆炸」?算法崗已經供過於求了嗎?

算法工程師技能圖譜

算法工程師最核心技能還是機器學習和統計學,這關乎機器學習模型能夠在何種程度上優化目標、帶來多大的效果提升。例如一個推薦算法工程師有可能在面試中被問到的機器學習知識包括但不限於:

  • GBDT的原理如何
  • 進行特徵選擇
  • 如何評估模型效果
  • softmax函數的定義
  • 如何將embedding應用到推薦系統中

因為算法工程師工作很雜,所以一般對候選人的各方面技能要求都很高。昨天晚上,團隊領導在群裡還說到,團隊每個人,無論是不是做純算法,各技能點都要滿格:包括編程能力、邏輯思維、大數據等等。算法工程師,首先應該是一名合格的工程師。

崗位選擇建議

關於崗位選擇建議,這個問題下很多人已經提到算法崗僧多粥少,建議大家轉行做開發。我是覺得算法崗還是缺少優質人才的,公司的headcount也一直都有,但是這些坑都是留給那些最優秀的人。因為這兩年媒體對算法崗的火熱追捧,導致大批學生準備轉行,加上部分公司業務增長疲軟,崗位數目不如前幾年那麼多,整個行業不可避免地水漲船高。

在數據科學行業,其實不止算法工程師這個崗位。例如我們團隊,有很多人做數據分析、大數據開發、工程架構等等。算法不能解決所有問題,也需要一部分人在算法基礎上做人工策略。純算法崗只佔一小部分。建議校園出來的學生閱讀一下我之前這篇文章,瞭解業界是如何劃分崗位的:求職 | 想轉行數據科學,收好這份崗位選擇指南與技能圖譜分析

因此,我建議應屆同學一方面增強自己的核心技能,補齊短板,另一方面根據自己的背景實力選擇適合自己的崗位。

當然,面對玄學問題,要放平心態:山重水複已無路,柳暗花明又一村。

"

相關推薦

推薦中...