微軟亞洲研究院CVPR圓桌:機器學習火成這樣,如何讓計算機視覺“獨立”發展?

微軟亞洲研究院CVPR圓桌:機器學習火成這樣,如何讓計算機視覺“獨立”發展?

「微軟亞洲研究院創研論壇——CVPR 2017 論文分享會」於上週順利舉行。由微軟亞洲研究院主辦,清華大學媒體與網絡技術教育部-微軟重點實驗室承辦,中國圖象圖形學會視覺大數據專委會、中國計算機學會計算機視覺專委會協辦。

會議期間,主辦方邀請了在計算機視覺領域非常優秀的學術界、工業界代表們,針對在 CVPR 2017 發表的論文內容進行了分享。

本次圓桌討論環節由微軟亞洲研究院主管研究員羅翀主持,並邀請到了五位在計算機視覺領域的研究者們分享他們的心得見解。

  • 陳熙霖,中國科學院計算技術研究所研究員

  • 王蘊紅,北京航空航天大學計算機學院副院長

  • 曾文軍,微軟亞洲研究院首席研究員

  • 林宙辰,北京大學信息科學技術學院教授

  • 齊國君,美國中佛羅里達大學計算機系助理教授

微軟亞洲研究院CVPR圓桌:機器學習火成這樣,如何讓計算機視覺“獨立”發展?

從左至右:陳熙霖、王蘊紅、曾文軍、林宙辰、齊國君

討論點一:深度學習並非萬能

雷鋒網 AI 科技評論瞭解到,在本次研討會上,第一個問題首先提及了深度學習對計算機視覺領域所產生的影響。誠然,深度學習的火熱讓很多經典問題的解決得到了很大的提升,但它作為一種「有效的」工具,是否真是萬能的呢?

陳熙霖博士認為,計算機視覺實際上是一個很寬泛的領域,而不能單純地用一個工具來代替一個領域。在解決問題的時候,還是需要結合問題背景進行考慮,再確定是否要用深度學習,否則很可能永遠達不到最終目的。

王蘊紅教授肯定了陳博士的說法,她認為研究人員在解決問題時,不應該把自己當成一個調參的工具。「在這個時候我們依然要關注到問題的本身是什麼,怎麼樣才能夠解決問題。所以任何一個工具都不是經久不衰的,但解決問題是經久不衰的,所以我們應該更多關注的是能力的培養。」

此外,林宙辰教授表示,深度學習與傳統方法也開始有了一些結合,且前者的優點在某些問題上並不突出,因此還是應該需要注重專業知識的培養和積累。

討論點二:arXiv 的利弊

此前雷鋒網 AI 科技評論曾經對 Yoav 與 Yann LeCun 關於 arXiv 的論戰做了一番解析(詳情可閱讀雷鋒網此前文章《Yoav Goldberg 與 Yann LeCun 論戰背後:arXiv 是個好平臺,但和學術會議是兩碼事》),得出的結論是,arXiv 作為一個投遞論文的平臺,能夠第一時間分享學者們的最新成果,但實際上它與論文的篩選與評比還是有不同的。本次圓桌上同樣提及了這個問題,那麼學者們都持什麼樣的觀點呢?

幾位老師的觀點整體上比較一致,都認為 arXiv 作為一種交流工具,在學術領域還是起到了積極作用,但需要防止佔坑現象的發生;此外,作為讀者也應當仔細甄別,避免被誤導的傾向。這與雷鋒網 AI 科技評論在徵詢其它老師們所得到的結論是相同的。

討論點三:在視覺領域領域,如何設計基於強化學習的獎勵函數?

羅翀老師提及,強化學習通過設置獎勵函數,可以使算法的表現越來越好。如果我們也想用同樣的方式訓練計算機視覺的檢測、分割與視頻捕捉,其中的機制應當如何設計?

「如果要想拿視覺做一個類似於 AlphaGo 的評價函數,那麼它不是單獨視覺能解決的,而是需要把視覺能力的評估(Assessment)融入到一個智能系統中,然後由這個系統給出獎勵或懲罰,甚至於給一個群體之間的反饋。這樣的評價函數是可以做的,但它不是單獨來自於計算機視覺的。」陳熙霖博士如是說,這個觀點與齊國君教授的想法不謀而合,後者也認為視覺絕對不是一個單一系統,他表示可參考邊學習邊生成樣本的方法(藉助 GAN 或遊戲的方法)來學習新的信息,產生一個閉環。

曾文軍博士則提及了微軟亞洲研究院機器學習組去年 NIPS 時的一個工作——對偶學習(雷鋒網 AI 科技評論按:關於對偶學習,雷鋒網邀請到了微軟亞洲研究院主管研究員秦濤博士給我們做了一次硬創公開課《對偶學習的對稱之美》),他表示這個同樣是基於閉環的原理而進行學習的。

討論點四:CVPR 於華人研究者

與 AAAI 2017 的論文投遞情況一樣,今年 CVPR 2017 華人同樣佔據了越來越多的份額,但華人論文在學術會議中的佔比提升,卻並沒有很多令全球學術圈印象深刻的研究工作。

關於這一點,數位研究者們都認為,重點還是要關注研究工作的價值與影響力,而不僅僅停留在數目和入選率上。此外,林宙辰教授還指出,學者除了發表論文外,也應該積極參與交流,成為制定領域規則的主導者、發聲者。

討論點五:在深度學習的影響下,如何讓計算機視覺社群獨立發展?

正如王蘊紅教授所提及的,「計算機視覺的傳統問題依然存在,機器學習只解決了一部分,但是有很多問題還依然沒有解決。」而曾文軍博士也表示,只靠現有的深度學習,還有很多無法解釋的東西(如黑箱問題等)。因此需要採用傳統的自上而下的方法,加上知識圖譜與邏輯內容,才有可能解決實際問題。

林宙辰教授表示,機器學習與計算機視覺相比,對特徵的獲取並不關心,而這正是後者所具備且著重研究的。此外,「有很多地方,計算機視覺會有它的獨特之處。像立體視覺就需要基於一定的物理模型,所以我們不是簡單地做一些端到端的東西就可以了。這兩個領域的融合是『自古以來』就有的,並不是新產生的現象。」

而齊國君教授則指出,機器學習和計算機視覺並不是對立的競爭關係,更應該是一種依存與促進的關係。「機器學習在很多領域都有應用,但我覺得其中最成功、最有影響力的應用還是在計算機視覺,包括一系列的方法,比如深度學習中的卷積神經網絡,這是一個純粹的視覺問題,後來才引申出一系列新的應用領域。」

更多關於「微軟亞洲研究院創研論壇——CVPR 2017 論文分享會」的精彩內容,歡迎觀看直播回放。

地址:http://www.xuetangx.com/event/cvpr2017

相關推薦

推薦中...