《自然:神經科學》論文:動物視覺系統裡的RNN能加速物體識別

《自然:神經科學》論文:動物視覺系統裡的RNN能加速物體識別

雷鋒網 AI 科技評論按:頂級期刊《Nature Neuroscience》(自然:神經科學)近日刊登了一篇新論文,論文標題是「Evidence that recurrent circuits are critical to the ventral stream's execution of core object recognition behavior」(證據表明循環結構對核心物體識別行為中處理腹側神經流的過程有關鍵影響)。論文中把動物視覺系統在物體識別任務中的表現建模為深度學習模型,並對比真實動物和深度學習模型的行為,嘗試進一步推測真實動物視覺系統的功能和結構。

這類研究得到的發現不僅有神經生物學意義,也可以幫助機器學習領域的研究人員們從其他角度理解深度神經網絡的結構和行為特點,比如,根據這篇論文中的結論,動物視覺系統中的RNN結構可以加速有挑戰性的圖像的識別,這種現象能否用來進一步改進人工神經網絡呢?

這篇論文的作者們來自哥倫比亞大學和MIT。

論文摘要:

對動物的研究表明,靈長類動物的視覺系統中有密集的循環式腹側神經流,並最終在顳下皮層(IT Cortex)彙集,這構成了它們的核心物體識別行為。目前對這種行為建模效果最好的模型是深度卷積神經網絡(CNN),但 CNN 卻是不帶有循環結構的。這就給研究人員們帶來了一個疑問:如果動物神經系統追蹤的循環結構對它們的行為如此重要,那麼靈長類的識別系統就應當在同時需要前饋顳下皮層響應以及額外的循環信號處理的圖像識別任務中得到高於只有前饋的深度 CNN 網絡的表現。

在這項研究中,作者們首先使用行為學方法找到了數百張這樣的「有挑戰」的圖像(能體現出循環結構的優勢)。其次,藉助大規模電生理學方法,作者們把其它動物中的有足夠識別能力的物體識別方案和靈長類進行了行為學角度對比,發現識別有挑戰性的圖像時,前者的信號在顳下皮層彙集的時間要比靈長類遲大約 30ms。然而深度 CNN 的行為卻很難預測這種行為學角度有顯著區別的滯後顳下皮層響應。值得一提的是,非常深的 CNN 和淺一些的循環結構 CNN 對這些滯後響應的預測就要好一些,這表明額外的非線性變換與循環結構之間存在一定的功能等效性。

作者們提由此提出,循環結構的信號通路對於快速物體識別起到了關鍵作用,這也得到了實驗證實;除此之外,實驗結果還為未來的循環結構模型開發提供了強有力的限定條件。

由於論文是閉源的,對於論文正文內容我們只能介紹這麼多。

論文地址:https://www.nature.com/articles/s41593-019-0392-5

實驗數據:https://github.com/kohitij-kar/image_metrics

準備實驗所用代碼:http://brain-score.org/

雷鋒網 AI 科技評論此前也有長文介紹過神經科學研究和人工神經網絡之間的聯繫,見 《殊途同歸還是漸行漸遠?MIT神經科學教授James DiCarlo談如何通過人類神經理解神經網絡》

雷鋒網 AI 科技評論報道。

相關推薦

推薦中...