'討厭機器學習！ML五大缺陷引熱議'

人工智能技術工程師高能小子終極裝備 GPU 程序員 Google 量子位 2019-07-18

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

靈魂質疑二：付費牆

想做機器學習，數據集和算力缺一不可。

擁有更強大的計算資源，你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎？

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

靈魂質疑二：付費牆

想做機器學習，數據集和算力缺一不可。

擁有更強大的計算資源，你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎？

誠然在許多工業領域，資金投入一樣非常重要，錢總能帶來更快更好的進步，但在機器學習領域，問題遠不止於此。

只要肯燒錢，即使你的數據集分類器是一坨垃圾，你的模型也可能比別人學得更快更好——這才是問題所在。

哦，做數據集也要花錢呢！

這還不夠讓人討厭的嗎？

靈魂質疑三：code/改進機器學習代碼令人沮喪

黑盒是老生常談了，但你可知道，它竟給程序員造成了精神折磨？

碼代碼解決問題給人一種創造的快感，但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎？不會的。我調參了，我的分類準確度提升了，可它是為什麼提升的？鬼知道！

這位工程師舉了個例子，Ta曾花費了數週的時間在改變輸入數據的形態和設置，調整每個層的節點數量這樣的事情上，然而，這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu，神奇的事情出現了，只是改變了字母，網絡的準確度就超越了過去幾周裡所有的嘗試！

這樣的感覺太糟糕了，就好像你並把握不住你的代碼。你做出了調整並且也知道會有所改進，可這個改進在何時何地以何種程度出現，沒人能給出準確的答案。

花費在這種事情上的時間越久，失望的感覺就會捆得人越緊，到底是我玩機器學習，還是機器學習玩我？

工程師可不是無情的調參機器啊。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

靈魂質疑二：付費牆

想做機器學習，數據集和算力缺一不可。

擁有更強大的計算資源，你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎？

誠然在許多工業領域，資金投入一樣非常重要，錢總能帶來更快更好的進步，但在機器學習領域，問題遠不止於此。

只要肯燒錢，即使你的數據集分類器是一坨垃圾，你的模型也可能比別人學得更快更好——這才是問題所在。

哦，做數據集也要花錢呢！

這還不夠讓人討厭的嗎？

靈魂質疑三：code/改進機器學習代碼令人沮喪

黑盒是老生常談了，但你可知道，它竟給程序員造成了精神折磨？

碼代碼解決問題給人一種創造的快感，但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎？不會的。我調參了，我的分類準確度提升了，可它是為什麼提升的？鬼知道！

這位工程師舉了個例子，Ta曾花費了數週的時間在改變輸入數據的形態和設置，調整每個層的節點數量這樣的事情上，然而，這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu，神奇的事情出現了，只是改變了字母，網絡的準確度就超越了過去幾周裡所有的嘗試！

花費在這種事情上的時間越久，失望的感覺就會捆得人越緊，到底是我玩機器學習，還是機器學習玩我？

工程師可不是無情的調參機器啊。

靈魂質疑四：依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼，可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子，非機器學習的方式是從頭開始建立對學習資料的理解，紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題，而後瘋狂刷題。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

靈魂質疑二：付費牆

想做機器學習，數據集和算力缺一不可。

擁有更強大的計算資源，你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎？

誠然在許多工業領域，資金投入一樣非常重要，錢總能帶來更快更好的進步，但在機器學習領域，問題遠不止於此。

只要肯燒錢，即使你的數據集分類器是一坨垃圾，你的模型也可能比別人學得更快更好——這才是問題所在。

哦，做數據集也要花錢呢！

這還不夠讓人討厭的嗎？

靈魂質疑三：code/改進機器學習代碼令人沮喪

黑盒是老生常談了，但你可知道，它竟給程序員造成了精神折磨？

碼代碼解決問題給人一種創造的快感，但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎？不會的。我調參了，我的分類準確度提升了，可它是為什麼提升的？鬼知道！

這位工程師舉了個例子，Ta曾花費了數週的時間在改變輸入數據的形態和設置，調整每個層的節點數量這樣的事情上，然而，這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu，神奇的事情出現了，只是改變了字母，網絡的準確度就超越了過去幾周裡所有的嘗試！

花費在這種事情上的時間越久，失望的感覺就會捆得人越緊，到底是我玩機器學習，還是機器學習玩我？

工程師可不是無情的調參機器啊。

靈魂質疑四：依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼，可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子，非機器學習的方式是從頭開始建立對學習資料的理解，紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題，而後瘋狂刷題。

誠然刷題可能會讓成績更好看，但問題是在考試結束之後，在實際解決問題之時，真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是，在機器學習的邏輯裡，如果答題出錯，那麼一定是因為這道題沒出過。

在實際應用場景當中，神經網絡會把數據集裡的固有偏差變成自己的特質，在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五：建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論，許多人產生了共鳴：

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜，要是不開源代碼，我壓根不想讀他們的文章。在這個領域裡，許多結果根本無法重現。
付費牆這件事我也很想吐槽。看英偉達的論文裡說的：噢，看我們這個網絡多麼鵝妹子嚶，你只需要8個V100就能復現我們的工作喲。簡直想打人。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

靈魂質疑二：付費牆

想做機器學習，數據集和算力缺一不可。

擁有更強大的計算資源，你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎？

誠然在許多工業領域，資金投入一樣非常重要，錢總能帶來更快更好的進步，但在機器學習領域，問題遠不止於此。

只要肯燒錢，即使你的數據集分類器是一坨垃圾，你的模型也可能比別人學得更快更好——這才是問題所在。

哦，做數據集也要花錢呢！

這還不夠讓人討厭的嗎？

靈魂質疑三：code/改進機器學習代碼令人沮喪

黑盒是老生常談了，但你可知道，它竟給程序員造成了精神折磨？

碼代碼解決問題給人一種創造的快感，但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎？不會的。我調參了，我的分類準確度提升了，可它是為什麼提升的？鬼知道！

這位工程師舉了個例子，Ta曾花費了數週的時間在改變輸入數據的形態和設置，調整每個層的節點數量這樣的事情上，然而，這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu，神奇的事情出現了，只是改變了字母，網絡的準確度就超越了過去幾周裡所有的嘗試！

花費在這種事情上的時間越久，失望的感覺就會捆得人越緊，到底是我玩機器學習，還是機器學習玩我？

工程師可不是無情的調參機器啊。

靈魂質疑四：依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼，可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子，非機器學習的方式是從頭開始建立對學習資料的理解，紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題，而後瘋狂刷題。

誠然刷題可能會讓成績更好看，但問題是在考試結束之後，在實際解決問題之時，真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是，在機器學習的邏輯裡，如果答題出錯，那麼一定是因為這道題沒出過。

在實際應用場景當中，神經網絡會把數據集裡的固有偏差變成自己的特質，在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五：建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論，許多人產生了共鳴：

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜，要是不開源代碼，我壓根不想讀他們的文章。在這個領域裡，許多結果根本無法重現。
付費牆這件事我也很想吐槽。看英偉達的論文裡說的：噢，看我們這個網絡多麼鵝妹子嚶，你只需要8個V100就能復現我們的工作喲。簡直想打人。

贊成。讓模型變快基本就是純靠經驗，課程和教材都沒啥幫助。不過倒是有一些技術標準可以用來診斷模型裡偏差 vs. 方差的問題。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

靈魂質疑二：付費牆

想做機器學習，數據集和算力缺一不可。

擁有更強大的計算資源，你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎？

誠然在許多工業領域，資金投入一樣非常重要，錢總能帶來更快更好的進步，但在機器學習領域，問題遠不止於此。

只要肯燒錢，即使你的數據集分類器是一坨垃圾，你的模型也可能比別人學得更快更好——這才是問題所在。

哦，做數據集也要花錢呢！

這還不夠讓人討厭的嗎？

靈魂質疑三：code/改進機器學習代碼令人沮喪

黑盒是老生常談了，但你可知道，它竟給程序員造成了精神折磨？

碼代碼解決問題給人一種創造的快感，但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎？不會的。我調參了，我的分類準確度提升了，可它是為什麼提升的？鬼知道！

這位工程師舉了個例子，Ta曾花費了數週的時間在改變輸入數據的形態和設置，調整每個層的節點數量這樣的事情上，然而，這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu，神奇的事情出現了，只是改變了字母，網絡的準確度就超越了過去幾周裡所有的嘗試！

花費在這種事情上的時間越久，失望的感覺就會捆得人越緊，到底是我玩機器學習，還是機器學習玩我？

工程師可不是無情的調參機器啊。

靈魂質疑四：依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼，可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子，非機器學習的方式是從頭開始建立對學習資料的理解，紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題，而後瘋狂刷題。

誠然刷題可能會讓成績更好看，但問題是在考試結束之後，在實際解決問題之時，真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是，在機器學習的邏輯裡，如果答題出錯，那麼一定是因為這道題沒出過。

在實際應用場景當中，神經網絡會把數據集裡的固有偏差變成自己的特質，在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五：建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論，許多人產生了共鳴：

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜，要是不開源代碼，我壓根不想讀他們的文章。在這個領域裡，許多結果根本無法重現。
付費牆這件事我也很想吐槽。看英偉達的論文裡說的：噢，看我們這個網絡多麼鵝妹子嚶，你只需要8個V100就能復現我們的工作喲。簡直想打人。

贊成。讓模型變快基本就是純靠經驗，課程和教材都沒啥幫助。不過倒是有一些技術標準可以用來診斷模型裡偏差 vs. 方差的問題。

也有人不以為然：

我認為這些方法並沒有變化得那麼快。注意力機制是在2013年提出的，但它對機器翻譯來說依然非常重要。同樣的例子還有LSTM，90年代末期它就出現了。
甚至是RNN，儘管用的比以前少了（這也是有爭議的），但ResNet在概念上仍對LSTM有很大影響。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

靈魂質疑二：付費牆

想做機器學習，數據集和算力缺一不可。

擁有更強大的計算資源，你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎？

誠然在許多工業領域，資金投入一樣非常重要，錢總能帶來更快更好的進步，但在機器學習領域，問題遠不止於此。

只要肯燒錢，即使你的數據集分類器是一坨垃圾，你的模型也可能比別人學得更快更好——這才是問題所在。

哦，做數據集也要花錢呢！

這還不夠讓人討厭的嗎？

靈魂質疑三：code/改進機器學習代碼令人沮喪

黑盒是老生常談了，但你可知道，它竟給程序員造成了精神折磨？

碼代碼解決問題給人一種創造的快感，但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎？不會的。我調參了，我的分類準確度提升了，可它是為什麼提升的？鬼知道！

這位工程師舉了個例子，Ta曾花費了數週的時間在改變輸入數據的形態和設置，調整每個層的節點數量這樣的事情上，然而，這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu，神奇的事情出現了，只是改變了字母，網絡的準確度就超越了過去幾周裡所有的嘗試！

花費在這種事情上的時間越久，失望的感覺就會捆得人越緊，到底是我玩機器學習，還是機器學習玩我？

工程師可不是無情的調參機器啊。

靈魂質疑四：依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼，可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子，非機器學習的方式是從頭開始建立對學習資料的理解，紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題，而後瘋狂刷題。

誠然刷題可能會讓成績更好看，但問題是在考試結束之後，在實際解決問題之時，真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是，在機器學習的邏輯裡，如果答題出錯，那麼一定是因為這道題沒出過。

在實際應用場景當中，神經網絡會把數據集裡的固有偏差變成自己的特質，在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五：建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論，許多人產生了共鳴：

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜，要是不開源代碼，我壓根不想讀他們的文章。在這個領域裡，許多結果根本無法重現。
付費牆這件事我也很想吐槽。看英偉達的論文裡說的：噢，看我們這個網絡多麼鵝妹子嚶，你只需要8個V100就能復現我們的工作喲。簡直想打人。

贊成。讓模型變快基本就是純靠經驗，課程和教材都沒啥幫助。不過倒是有一些技術標準可以用來診斷模型裡偏差 vs. 方差的問題。

也有人不以為然：

我認為這些方法並沒有變化得那麼快。注意力機制是在2013年提出的，但它對機器翻譯來說依然非常重要。同樣的例子還有LSTM，90年代末期它就出現了。
甚至是RNN，儘管用的比以前少了（這也是有爭議的），但ResNet在概念上仍對LSTM有很大影響。

機器學習的准入門檻很低了，有時候甚至能從Google和AWS上拿到免費的GPU時間。即使是在計算機科學領域，ML也不是最貴的。更何況ML是非常開放的，很多最新研究成果都能輕鬆獲取。

魚羊發自凹非寺

量子位報道 | 公眾號 QbitAI

在當今的人工智能領域，機器學習已成主宰，獨領時代風騷。

但登上技術王座並不意味著地位永固，萬眾歸心。

偏偏就有人不買賬，恨不能拿著大喇叭向全世界宣佈：討厭機器學習！

甚至還有理有據，靈魂拷問機器學習。

振臂一呼，追隨者眾。對機器學習的質疑掀起波瀾，引發了一片熱議。

五問機器學習

質疑源自一位不願透露姓名的人工智能研（shou）究（nue）者。

靈魂質疑一：今年的技術明年就out

當年還說RNN好，轉頭就投入了CNN的懷抱。

如果不做技術的弄潮兒，轉眼機器學習的大浪就把你拍死在沙灘上。

技術迭代是正常的，可無休止的更新會讓一天的專注學習全都付諸流水。

靈魂質疑二：付費牆

想做機器學習，數據集和算力缺一不可。

擁有更強大的計算資源，你就可以快人一步地訓練並測試方案。

那不就是比誰更能燒錢嗎？

誠然在許多工業領域，資金投入一樣非常重要，錢總能帶來更快更好的進步，但在機器學習領域，問題遠不止於此。

只要肯燒錢，即使你的數據集分類器是一坨垃圾，你的模型也可能比別人學得更快更好——這才是問題所在。

哦，做數據集也要花錢呢！

這還不夠讓人討厭的嗎？

靈魂質疑三：code/改進機器學習代碼令人沮喪

黑盒是老生常談了，但你可知道，它竟給程序員造成了精神折磨？

碼代碼解決問題給人一種創造的快感，但神經網絡的黑盒屬性破壞了這一切。

做一個煉丹師會快樂嗎？不會的。我調參了，我的分類準確度提升了，可它是為什麼提升的？鬼知道！

這位工程師舉了個例子，Ta曾花費了數週的時間在改變輸入數據的形態和設置，調整每個層的節點數量這樣的事情上，然而，這一切毫無效果。

有一天Ta把稠密層上的激活函數從relu換成了selu，神奇的事情出現了，只是改變了字母，網絡的準確度就超越了過去幾周裡所有的嘗試！

花費在這種事情上的時間越久，失望的感覺就會捆得人越緊，到底是我玩機器學習，還是機器學習玩我？

工程師可不是無情的調參機器啊。

靈魂質疑四：依賴數據集

沒有數據集的神經網絡是沒有靈魂的空殼，可數據集會存在什麼樣的bias可說不好。

拿考試複習來舉個例子，非機器學習的方式是從頭開始建立對學習資料的理解，紮實的理解足以解決任何可能出現的問題。

而機器學習的方式則是蒐集教授前幾年出的試題，而後瘋狂刷題。

誠然刷題可能會讓成績更好看，但問題是在考試結束之後，在實際解決問題之時，真正掌握了知識的人更有可能發揮堅實的作用。

更糟糕的是，在機器學習的邏輯裡，如果答題出錯，那麼一定是因為這道題沒出過。

在實際應用場景當中，神經網絡會把數據集裡的固有偏差變成自己的特質，在遇到以前沒有見過的情況時它就變成了那個不靠譜的豬隊友。

靈魂質疑五：建議使用機器學習解決問題的人和真正的ML工程師缺乏聯繫

引發熱議

五點質疑引起熱烈討論，許多人產生了共鳴：

我非常煩惱的是有些人文章寫得稀爛還沾沾自喜，要是不開源代碼，我壓根不想讀他們的文章。在這個領域裡，許多結果根本無法重現。
付費牆這件事我也很想吐槽。看英偉達的論文裡說的：噢，看我們這個網絡多麼鵝妹子嚶，你只需要8個V100就能復現我們的工作喲。簡直想打人。

贊成。讓模型變快基本就是純靠經驗，課程和教材都沒啥幫助。不過倒是有一些技術標準可以用來診斷模型裡偏差 vs. 方差的問題。

也有人不以為然：

我認為這些方法並沒有變化得那麼快。注意力機制是在2013年提出的，但它對機器翻譯來說依然非常重要。同樣的例子還有LSTM，90年代末期它就出現了。
甚至是RNN，儘管用的比以前少了（這也是有爭議的），但ResNet在概念上仍對LSTM有很大影響。

機器學習的准入門檻很低了，有時候甚至能從Google和AWS上拿到免費的GPU時間。即使是在計算機科學領域，ML也不是最貴的。更何況ML是非常開放的，很多最新研究成果都能輕鬆獲取。

其實，機器學習還是一個非常年輕的領域，它潛力巨大，但這也意味著存在許多未知。隨著基礎研究的推進，這個黑盒在未來很可能漸漸透明，發揮更加強大的超能力。

你覺得呢？

— 完 —

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話界面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

'討厭機器學習！ML五大缺陷引熱議'

五問機器學習

五問機器學習

五問機器學習

五問機器學習

五問機器學習

五問機器學習

引發熱議

五問機器學習

引發熱議

五問機器學習

引發熱議

五問機器學習

引發熱議

五問機器學習

引發熱議

相關推薦