麻省理工學院發現更容易訓練的小型神經網絡

儘管人工智能取得了所有進步,但大多數基於人工智能的產品仍然依賴於“深度神經網絡”,這種網絡往往非常龐大且訓練成本過高。麻省理工學院的研究人員希望改變這種狀況。在今天發表的一篇論文中,研究人員發現,神經網絡包含的子網絡小10倍,教學成本更低,速度更快。

麻省理工學院發現更容易訓練的小型神經網絡

為了訓練大多數神經網絡,工程師為他們提供大量數據集,但這可能需要數天和昂貴的GPU。來自麻省理工學院計算機科學與人工智能實驗室(CSAIL)的研究人員發現,在那些受過訓練的網絡中,較小的子網絡可以做出同樣準確的預測。CSAIL所謂的“彩票假設”基於這樣一種觀點,即培訓大多數神經網絡就像購買彩票中的所有門票以保證獲勝一樣。相比之下,培訓子網就像購買中獎票一樣。

問題在於,研究人員還沒有想出如何在不構建完整神經網絡的情況下找到這些子網,然後修剪掉不必要的位。如果他們能夠找到一種方法來跳過這一步並直接進入子網,這個過程可以節省數小時的工作量,並使訓練神經網絡可供個別程序員使用 - 而不僅僅是大公司。但是,確定如何有效地找到子網並理解為什麼有些人在學習上比其他人更好,這可能會使研究人員忙碌多年。

相關推薦

推薦中...