'討厭機器學習!ML五大缺陷引熱議'

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑二:付費牆

想做機器學習,數據集和算力缺一不可。

擁有更強大的計算資源,你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎?

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑二:付費牆

想做機器學習,數據集和算力缺一不可。

擁有更強大的計算資源,你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎?

討厭機器學習!ML五大缺陷引熱議

誠然在許多工業領域,資金投入一樣非常重要,錢總能帶來更快更好的進步,但在機器學習領域,問題遠不止於此。

只要肯燒錢,即使你的數據集分類器是一坨垃圾,你的模型也可能比別人學得更快更好——這才是問題所在。

哦,做數據集也要花錢呢!

這還不夠讓人討厭的嗎?

靈魂質疑三:code/改進機器學習代碼令人沮喪

黑盒是老生常談了,但你可知道,它竟給程序員造成了精神折磨?

碼代碼解決問題給人一種創造的快感,但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎?不會的。我調參了,我的分類準確度提升了,可它是為什麼提升的?鬼知道!

這位工程師舉了個例子,Ta曾花費了數週的時間在改變輸入數據的形態和設置,調整每個層的節點數量這樣的事情上,然而,這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu,神奇的事情出現了,只是改變了字母,網絡的準確度就超越了過去幾周裡所有的嘗試!

這樣的感覺太糟糕了,就好像你並把握不住你的代碼。你做出了調整並且也知道會有所改進,可這個改進在何時何地以何種程度出現,沒人能給出準確的答案。

花費在這種事情上的時間越久,失望的感覺就會捆得人越緊,到底是我玩機器學習,還是機器學習玩我?

工程師可不是無情的調參機器啊。

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑二:付費牆

想做機器學習,數據集和算力缺一不可。

擁有更強大的計算資源,你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎?

討厭機器學習!ML五大缺陷引熱議

誠然在許多工業領域,資金投入一樣非常重要,錢總能帶來更快更好的進步,但在機器學習領域,問題遠不止於此。

只要肯燒錢,即使你的數據集分類器是一坨垃圾,你的模型也可能比別人學得更快更好——這才是問題所在。

哦,做數據集也要花錢呢!

這還不夠讓人討厭的嗎?

靈魂質疑三:code/改進機器學習代碼令人沮喪

黑盒是老生常談了,但你可知道,它竟給程序員造成了精神折磨?

碼代碼解決問題給人一種創造的快感,但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎?不會的。我調參了,我的分類準確度提升了,可它是為什麼提升的?鬼知道!

這位工程師舉了個例子,Ta曾花費了數週的時間在改變輸入數據的形態和設置,調整每個層的節點數量這樣的事情上,然而,這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu,神奇的事情出現了,只是改變了字母,網絡的準確度就超越了過去幾周裡所有的嘗試!

這樣的感覺太糟糕了,就好像你並把握不住你的代碼。你做出了調整並且也知道會有所改進,可這個改進在何時何地以何種程度出現,沒人能給出準確的答案。

花費在這種事情上的時間越久,失望的感覺就會捆得人越緊,到底是我玩機器學習,還是機器學習玩我?

工程師可不是無情的調參機器啊。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑四:依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼,可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子,非機器學習的方式是從頭開始建立對學習資料的理解,紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題,而後瘋狂刷題。

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑二:付費牆

想做機器學習,數據集和算力缺一不可。

擁有更強大的計算資源,你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎?

討厭機器學習!ML五大缺陷引熱議

誠然在許多工業領域,資金投入一樣非常重要,錢總能帶來更快更好的進步,但在機器學習領域,問題遠不止於此。

只要肯燒錢,即使你的數據集分類器是一坨垃圾,你的模型也可能比別人學得更快更好——這才是問題所在。

哦,做數據集也要花錢呢!

這還不夠讓人討厭的嗎?

靈魂質疑三:code/改進機器學習代碼令人沮喪

黑盒是老生常談了,但你可知道,它竟給程序員造成了精神折磨?

碼代碼解決問題給人一種創造的快感,但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎?不會的。我調參了,我的分類準確度提升了,可它是為什麼提升的?鬼知道!

這位工程師舉了個例子,Ta曾花費了數週的時間在改變輸入數據的形態和設置,調整每個層的節點數量這樣的事情上,然而,這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu,神奇的事情出現了,只是改變了字母,網絡的準確度就超越了過去幾周裡所有的嘗試!

這樣的感覺太糟糕了,就好像你並把握不住你的代碼。你做出了調整並且也知道會有所改進,可這個改進在何時何地以何種程度出現,沒人能給出準確的答案。

花費在這種事情上的時間越久,失望的感覺就會捆得人越緊,到底是我玩機器學習,還是機器學習玩我?

工程師可不是無情的調參機器啊。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑四:依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼,可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子,非機器學習的方式是從頭開始建立對學習資料的理解,紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題,而後瘋狂刷題。

討厭機器學習!ML五大缺陷引熱議

誠然刷題可能會讓成績更好看,但問題是在考試結束之後,在實際解決問題之時,真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是,在機器學習的邏輯裡,如果答題出錯,那麼一定是因為這道題沒出過。

在實際應用場景當中,神經網絡會把數據集裡的固有偏差變成自己的特質,在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五:建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論,許多人產生了共鳴:

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜,要是不開源代碼,我壓根不想讀他們的文章。在這個領域裡,許多結果根本無法重現。

付費牆這件事我也很想吐槽。看英偉達的論文裡說的:噢,看我們這個網絡多麼鵝妹子嚶,你只需要8個V100就能復現我們的工作喲。簡直想打人。


"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑二:付費牆

想做機器學習,數據集和算力缺一不可。

擁有更強大的計算資源,你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎?

討厭機器學習!ML五大缺陷引熱議

誠然在許多工業領域,資金投入一樣非常重要,錢總能帶來更快更好的進步,但在機器學習領域,問題遠不止於此。

只要肯燒錢,即使你的數據集分類器是一坨垃圾,你的模型也可能比別人學得更快更好——這才是問題所在。

哦,做數據集也要花錢呢!

這還不夠讓人討厭的嗎?

靈魂質疑三:code/改進機器學習代碼令人沮喪

黑盒是老生常談了,但你可知道,它竟給程序員造成了精神折磨?

碼代碼解決問題給人一種創造的快感,但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎?不會的。我調參了,我的分類準確度提升了,可它是為什麼提升的?鬼知道!

這位工程師舉了個例子,Ta曾花費了數週的時間在改變輸入數據的形態和設置,調整每個層的節點數量這樣的事情上,然而,這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu,神奇的事情出現了,只是改變了字母,網絡的準確度就超越了過去幾周裡所有的嘗試!

這樣的感覺太糟糕了,就好像你並把握不住你的代碼。你做出了調整並且也知道會有所改進,可這個改進在何時何地以何種程度出現,沒人能給出準確的答案。

花費在這種事情上的時間越久,失望的感覺就會捆得人越緊,到底是我玩機器學習,還是機器學習玩我?

工程師可不是無情的調參機器啊。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑四:依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼,可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子,非機器學習的方式是從頭開始建立對學習資料的理解,紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題,而後瘋狂刷題。

討厭機器學習!ML五大缺陷引熱議

誠然刷題可能會讓成績更好看,但問題是在考試結束之後,在實際解決問題之時,真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是,在機器學習的邏輯裡,如果答題出錯,那麼一定是因為這道題沒出過。

在實際應用場景當中,神經網絡會把數據集裡的固有偏差變成自己的特質,在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五:建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論,許多人產生了共鳴:

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜,要是不開源代碼,我壓根不想讀他們的文章。在這個領域裡,許多結果根本無法重現。

付費牆這件事我也很想吐槽。看英偉達的論文裡說的:噢,看我們這個網絡多麼鵝妹子嚶,你只需要8個V100就能復現我們的工作喲。簡直想打人。


討厭機器學習!ML五大缺陷引熱議

贊成。讓模型變快基本就是純靠經驗,課程和教材都沒啥幫助。不過倒是有一些技術標準可以用來診斷模型裡偏差 vs. 方差的問題。

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑二:付費牆

想做機器學習,數據集和算力缺一不可。

擁有更強大的計算資源,你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎?

討厭機器學習!ML五大缺陷引熱議

誠然在許多工業領域,資金投入一樣非常重要,錢總能帶來更快更好的進步,但在機器學習領域,問題遠不止於此。

只要肯燒錢,即使你的數據集分類器是一坨垃圾,你的模型也可能比別人學得更快更好——這才是問題所在。

哦,做數據集也要花錢呢!

這還不夠讓人討厭的嗎?

靈魂質疑三:code/改進機器學習代碼令人沮喪

黑盒是老生常談了,但你可知道,它竟給程序員造成了精神折磨?

碼代碼解決問題給人一種創造的快感,但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎?不會的。我調參了,我的分類準確度提升了,可它是為什麼提升的?鬼知道!

這位工程師舉了個例子,Ta曾花費了數週的時間在改變輸入數據的形態和設置,調整每個層的節點數量這樣的事情上,然而,這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu,神奇的事情出現了,只是改變了字母,網絡的準確度就超越了過去幾周裡所有的嘗試!

這樣的感覺太糟糕了,就好像你並把握不住你的代碼。你做出了調整並且也知道會有所改進,可這個改進在何時何地以何種程度出現,沒人能給出準確的答案。

花費在這種事情上的時間越久,失望的感覺就會捆得人越緊,到底是我玩機器學習,還是機器學習玩我?

工程師可不是無情的調參機器啊。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑四:依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼,可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子,非機器學習的方式是從頭開始建立對學習資料的理解,紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題,而後瘋狂刷題。

討厭機器學習!ML五大缺陷引熱議

誠然刷題可能會讓成績更好看,但問題是在考試結束之後,在實際解決問題之時,真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是,在機器學習的邏輯裡,如果答題出錯,那麼一定是因為這道題沒出過。

在實際應用場景當中,神經網絡會把數據集裡的固有偏差變成自己的特質,在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五:建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論,許多人產生了共鳴:

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜,要是不開源代碼,我壓根不想讀他們的文章。在這個領域裡,許多結果根本無法重現。

付費牆這件事我也很想吐槽。看英偉達的論文裡說的:噢,看我們這個網絡多麼鵝妹子嚶,你只需要8個V100就能復現我們的工作喲。簡直想打人。


討厭機器學習!ML五大缺陷引熱議

贊成。讓模型變快基本就是純靠經驗,課程和教材都沒啥幫助。不過倒是有一些技術標準可以用來診斷模型裡偏差 vs. 方差的問題。

討厭機器學習!ML五大缺陷引熱議

也有人不以為然:

我認為這些方法並沒有變化得那麼快。注意力機制是在2013年提出的,但它對機器翻譯來說依然非常重要。同樣的例子還有LSTM,90年代末期它就出現了。

甚至是RNN,儘管用的比以前少了(這也是有爭議的),但ResNet在概念上仍對LSTM有很大影響。

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑二:付費牆

想做機器學習,數據集和算力缺一不可。

擁有更強大的計算資源,你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎?

討厭機器學習!ML五大缺陷引熱議

誠然在許多工業領域,資金投入一樣非常重要,錢總能帶來更快更好的進步,但在機器學習領域,問題遠不止於此。

只要肯燒錢,即使你的數據集分類器是一坨垃圾,你的模型也可能比別人學得更快更好——這才是問題所在。

哦,做數據集也要花錢呢!

這還不夠讓人討厭的嗎?

靈魂質疑三:code/改進機器學習代碼令人沮喪

黑盒是老生常談了,但你可知道,它竟給程序員造成了精神折磨?

碼代碼解決問題給人一種創造的快感,但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎?不會的。我調參了,我的分類準確度提升了,可它是為什麼提升的?鬼知道!

這位工程師舉了個例子,Ta曾花費了數週的時間在改變輸入數據的形態和設置,調整每個層的節點數量這樣的事情上,然而,這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu,神奇的事情出現了,只是改變了字母,網絡的準確度就超越了過去幾周裡所有的嘗試!

這樣的感覺太糟糕了,就好像你並把握不住你的代碼。你做出了調整並且也知道會有所改進,可這個改進在何時何地以何種程度出現,沒人能給出準確的答案。

花費在這種事情上的時間越久,失望的感覺就會捆得人越緊,到底是我玩機器學習,還是機器學習玩我?

工程師可不是無情的調參機器啊。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑四:依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼,可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子,非機器學習的方式是從頭開始建立對學習資料的理解,紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題,而後瘋狂刷題。

討厭機器學習!ML五大缺陷引熱議

誠然刷題可能會讓成績更好看,但問題是在考試結束之後,在實際解決問題之時,真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是,在機器學習的邏輯裡,如果答題出錯,那麼一定是因為這道題沒出過。

在實際應用場景當中,神經網絡會把數據集裡的固有偏差變成自己的特質,在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五:建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論,許多人產生了共鳴:

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜,要是不開源代碼,我壓根不想讀他們的文章。在這個領域裡,許多結果根本無法重現。

付費牆這件事我也很想吐槽。看英偉達的論文裡說的:噢,看我們這個網絡多麼鵝妹子嚶,你只需要8個V100就能復現我們的工作喲。簡直想打人。


討厭機器學習!ML五大缺陷引熱議

贊成。讓模型變快基本就是純靠經驗,課程和教材都沒啥幫助。不過倒是有一些技術標準可以用來診斷模型裡偏差 vs. 方差的問題。

討厭機器學習!ML五大缺陷引熱議

也有人不以為然:

我認為這些方法並沒有變化得那麼快。注意力機制是在2013年提出的,但它對機器翻譯來說依然非常重要。同樣的例子還有LSTM,90年代末期它就出現了。

甚至是RNN,儘管用的比以前少了(這也是有爭議的),但ResNet在概念上仍對LSTM有很大影響。

討厭機器學習!ML五大缺陷引熱議

機器學習的准入門檻很低了,有時候甚至能從Google和AWS上拿到免費的GPU時間。即使是在計算機科學領域,ML也不是最貴的。更何況ML是非常開放的,很多最新研究成果都能輕鬆獲取。

"

魚羊 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在當今的人工智能領域,機器學習已成主宰,獨領時代風騷。

討厭機器學習!ML五大缺陷引熱議

但登上技術王座並不意味著地位永固,萬眾歸心。

偏偏就有人不買賬,恨不能拿著大喇叭向全世界宣佈:討厭機器學習!

甚至還有理有據,靈魂拷問機器學習。

振臂一呼,追隨者眾。對機器學習的質疑掀起波瀾,引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研(shou)究(nue)者。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑一:今年的技術明年就out

當年還說RNN好,轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒,轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的,可無休止的更新會讓一天的專注學習全都付諸流水。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑二:付費牆

想做機器學習,數據集和算力缺一不可。

擁有更強大的計算資源,你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎?

討厭機器學習!ML五大缺陷引熱議

誠然在許多工業領域,資金投入一樣非常重要,錢總能帶來更快更好的進步,但在機器學習領域,問題遠不止於此。

只要肯燒錢,即使你的數據集分類器是一坨垃圾,你的模型也可能比別人學得更快更好——這才是問題所在。

哦,做數據集也要花錢呢!

這還不夠讓人討厭的嗎?

靈魂質疑三:code/改進機器學習代碼令人沮喪

黑盒是老生常談了,但你可知道,它竟給程序員造成了精神折磨?

碼代碼解決問題給人一種創造的快感,但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎?不會的。我調參了,我的分類準確度提升了,可它是為什麼提升的?鬼知道!

這位工程師舉了個例子,Ta曾花費了數週的時間在改變輸入數據的形態和設置,調整每個層的節點數量這樣的事情上,然而,這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu,神奇的事情出現了,只是改變了字母,網絡的準確度就超越了過去幾周裡所有的嘗試!

這樣的感覺太糟糕了,就好像你並把握不住你的代碼。你做出了調整並且也知道會有所改進,可這個改進在何時何地以何種程度出現,沒人能給出準確的答案。

花費在這種事情上的時間越久,失望的感覺就會捆得人越緊,到底是我玩機器學習,還是機器學習玩我?

工程師可不是無情的調參機器啊。

討厭機器學習!ML五大缺陷引熱議

靈魂質疑四:依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼,可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子,非機器學習的方式是從頭開始建立對學習資料的理解,紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題,而後瘋狂刷題。

討厭機器學習!ML五大缺陷引熱議

誠然刷題可能會讓成績更好看,但問題是在考試結束之後,在實際解決問題之時,真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是,在機器學習的邏輯裡,如果答題出錯,那麼一定是因為這道題沒出過。

在實際應用場景當中,神經網絡會把數據集裡的固有偏差變成自己的特質,在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五:建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論,許多人產生了共鳴:

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜,要是不開源代碼,我壓根不想讀他們的文章。在這個領域裡,許多結果根本無法重現。

付費牆這件事我也很想吐槽。看英偉達的論文裡說的:噢,看我們這個網絡多麼鵝妹子嚶,你只需要8個V100就能復現我們的工作喲。簡直想打人。


討厭機器學習!ML五大缺陷引熱議

贊成。讓模型變快基本就是純靠經驗,課程和教材都沒啥幫助。不過倒是有一些技術標準可以用來診斷模型裡偏差 vs. 方差的問題。

討厭機器學習!ML五大缺陷引熱議

也有人不以為然:

我認為這些方法並沒有變化得那麼快。注意力機制是在2013年提出的,但它對機器翻譯來說依然非常重要。同樣的例子還有LSTM,90年代末期它就出現了。

甚至是RNN,儘管用的比以前少了(這也是有爭議的),但ResNet在概念上仍對LSTM有很大影響。

討厭機器學習!ML五大缺陷引熱議

機器學習的准入門檻很低了,有時候甚至能從Google和AWS上拿到免費的GPU時間。即使是在計算機科學領域,ML也不是最貴的。更何況ML是非常開放的,很多最新研究成果都能輕鬆獲取。

討厭機器學習!ML五大缺陷引熱議

其實,機器學習還是一個非常年輕的領域,它潛力巨大,但這也意味著存在許多未知。隨著基礎研究的推進,這個黑盒在未來很可能漸漸透明,發揮更加強大的超能力。

你覺得呢?

— 完 —

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

"

相關推薦

推薦中...