「Science」DeepMind關係推理ANN,在圖像理解中擊敗人類

人工智能 機器學習 天鵝 足球 新智元 2017-06-17
「Science」DeepMind關係推理ANN,在圖像理解中擊敗人類

新智元編譯

「Science」DeepMind關係推理ANN,在圖像理解中擊敗人類

您要買的新家附近有多少個公園?和你的晚餐最配的葡萄酒是什麼?這些問題需要關係推理,這對於 AI 來說是難點。現在,谷歌 DeepMind 的研究人員已經開發了一種簡單的算法來處理這種推理,而且它已經在複雜的圖像理解測試中打敗了人類。

人類通常相當擅長關係推理,一種使用邏輯來連接和比較位置、序列和其他實體的思維方法。但 AI 的兩種主要類型——統計和符號——要開發類似的能力一直很慢。統計型 AI 或機器學習在模式識別方面很厲害,但它並不使用邏輯。而符號型的 AI 可以使用預先制定的規則來理解關係,但是在臨場處理中表現並不好。

新的研究提出了一種方法來彌補這一鴻溝:用於關係推理的人工神經網絡。類似於神經元在大腦中的連接方式,神經網絡將微小的程序拼接在一起,協同地在數據中找到模式。它擁有處理圖像、分析語言甚至學習遊戲的專門架構。在這種情況下,新的“關係網絡”設計用來比較各個場景中的每一對對象。DeepMind 的計算機科學家Timothy Lillicrap 表示:“我們在明確地迫使網絡發現事物之間存在的關係。”

他和他的團隊通過幾項任務挑戰了他們的關係網絡。第一個是回答關於單個圖像中對象之間的關係問題,比如立方體、球和圓柱體。舉例來說:“藍色的東西前面有一個物體; 它是否與灰色金屬球右邊微小的青色物體具有相同的形狀?”對於這個任務,關係網絡與另外兩種類型的神經網絡組合:一個用於識別圖像中的對象,一個解釋問題。在許多圖像和問題上,其他機器學習算法在 42% 到 77% 的時間是正確的。人類取得了 92% 的好成績。新的關係網絡組合則在 96% 的時間內是正確的,超過了人類得分。研究人員上週在 arXiv 上發表了一篇論文,公佈了這一結果。

DeepMind 團隊還在基於語言的任務中試驗了這一神經網絡。它收到了一系列陳述,如“Sandra 拿起了足球”和“Sandra 去了辦公室”,問題是:“足球在哪裡?”(辦公室)。它在大多數類型問題上與其它 AI 算法表現近似,但它在推理問題上表現搶眼:“Lily 是天鵝。Lily 是白色的。Greg 是天鵝。Greg 是什麼顏色的?”(白色)。在這些問題上,關係網絡得分為 98%,而其競爭算法得分約為 45%。最後,該算法分析了 10 個球跳動的動畫,其中一些通過不可見的彈簧或杆連接。僅使用運動模式,它能夠識別超過 90% 的連接。然後使用相同的訓練來識別由移動點所代表的人類。

“他們做法的優勢之一就是在概念上非常簡單”,波士頓大學計算機科學家 Kate Saenko 談到,她雖沒有參與這項工作,但本人也曾與人合作開發了一種用於回答關於圖像的複雜問題的算法。Lillicrap 談到這種簡單,最大的優勢就是它包含在一個單一的等式裡,可與其他網絡結合,就像在對象比較任務中一樣。論文中稱之為“一個簡單的即插即用模塊”,使得系統的其他部分可專注於它們所擅長的工作。

“結果非常不錯”,斯坦福大學的計算機科學家 Justin Johnson 評論道,他參與開發了對象比較任務及其中一個應用效果良好的算法。 Saenko 補充說,關係網絡未來可以用於研究社交網絡,分析監控畫面,或引導自動駕駛車。

Johnson也談到,為接近人類反應的靈活度,這一系統應學會應答更具挑戰性的問題。要實現這一點,就不能僅做兩個一組的對比,而是需要三個一組的對比,多組對比組的對比,或在一個更大範圍內的某些組的對比(基於效率)。“我希望可以實現自己生成策略的模型”,他表示:“ DeepMind 正在致力於一種特定類別推理的建模,並非普遍意義上的關係推理。但是向著正確方向邁進的及其重要的一步”。

原文地址:http://www.sciencemag.org/news/2017/06/computers-are-starting-reason-humans

相關推薦

推薦中...