「IEEE Spectrum」神經網絡視覺分類算法的意外弱點

機器學習機器人宇宙圖像處理新智元新智元 2017-08-26

20萬，這是新智元如今達到的用戶總數。在飛向智能宇宙的旅程中，感謝每一位和新智元同行的朋友。您的關注和支持是“新智元號”星艦永不枯竭的燃料。

人類非常難以理解機器人是如何“看”世界的。機器的攝像頭像我們的眼睛一樣工作，但在攝像頭拍攝的圖像和對於這些圖像能夠處理的信息之間的空間裡，充滿了黑盒機器學習算法。訓練這些算法通常包括向機器顯示一組不同的圖像（比如停止標誌），然後看看機器能否從這些圖片中提取足夠的常見特徵，從而可靠地識別出那些沒有在訓練集中出現過的停止標誌。

這樣做很好，但機器學習算法識別出的停止標識具有的特徵，往往不是“裡面有字母 STOP 的紅色八角形”，而是所有停止標誌都共享的特徵，不過人類是看不懂的。要是你覺得這很難想象的話，那是因為這個事實實際上反映了我們的大腦和人工神經網絡在解釋/理解這個世界時的根本斷層。

而結果就是，對圖像進行輕微的改動就可能導致機器學習算法識別出與原本完全不同（有時甚至是莫名其妙的）結果。

一般而言，這些輕微的改動是人類肉眼所無法察覺的，而且通常需要相對複雜的分析和圖像處理才能實現。

下面是一組我們常見的“對抗圖像”“汙染”：

本來是大熊貓的原圖（左），經過人類肉眼不可見的調整（中），結果計算機就識別為長臂猿（右，置信度 99.3%）。

用在道路標誌上就成了這樣：

上面一排是合法的標誌，下面則是經過一些手段，讓神經網絡分類器產生錯誤識別的結果。

很顯然，這樣的改動，雖然有效（且危險），但實踐起來卻很難，因為你一般很難直接獲得你想要混淆的神經網絡的輸入。此外，在自動駕駛的情況下，神經網絡能夠在不同距離和不同的角度分析一大堆符號的圖像。而對抗圖像往往會在整個圖像（即道路標誌和圖像中的背景）中都包含增加的改動，所以這種“汙染”在現實生活中往往很難不起到作用。

僅用貼紙或塗鴉騙過神經網絡分類器

但是，最近華盛頓大學、密歇根大學、石溪大學和加州大學伯克利分校的一組研究人員發表了一篇文章，表明在物理世界中進行輕微的改變，也能誘騙視覺分類算法。你只需要在停車標誌上加一點噴漆或一些貼紙，就能夠愚弄一個深度神經網絡分類器，讓神經網絡將停止標誌看成是限速標誌。

下面是兩幅僅用貼紙就讓神經網絡產生混淆的例子：

因為貼紙的面積相對整個標識而言很小，所以由此造成的干擾也就更加嚴重。據研究人員介紹：

“根據我們的評估方法，100％的圖像分類器將停止標誌錯誤地歸到限速 45 的類別中。對於右轉標誌……我們的攻擊讓錯誤分類的成功率為 100％，其中 66.67％的圖像被歸類為停車標誌，33.7％的圖像被歸為添加車道標誌。[塗鴉] 攻擊的成功率為 73.33％。[偽裝抽象藝術攻擊] 則實現了 100％的錯誤分類率。”

為了實施這些攻擊，研究人員使用公開的道路標誌數據集，在 TensorFlow 上對他們的道路標誌分類器進行了訓練。他們認為，攻擊者會對分類器有“白盒”訪問，這意味著攻擊者不會混淆或篡改數據，而是把“雜物”添加進去，看看會出來什麼。這樣，即使無法直接入侵分類器，攻擊者仍然可以使用這種反饋來創建一個相當準確的模型來分類它們。最後，研究人員將想要攻擊的標誌的圖像加上他們的分類器，並將其加入到攻擊算法中，這樣算法就能輸出對抗圖像了。

自動駕駛的未來或是完全去除人類因素

當然，自動駕駛汽車使用的分類器會比研究人員成功騙過的分類器更加複雜，魯棒性更高。（在實驗中，研究人員只使用了大約 4,500 個標誌作為訓練輸入）。儘管如此，也無法否認像這樣的攻擊不會奏效——即使是最先進的基於深度神經網絡的算法，也可能做出很愚蠢的判斷，而原因我們並不能輕易察覺。因此，自動駕駛汽車最好使用多模態系統進行道路標誌識別，就跟自動駕駛汽車使用多模態系統進行障礙物檢測一樣：僅依靠一種傳感器（無論是雷達，激光雷達，還是攝像頭），都是十分危險的。因此，要同時使用多種傳感器，確保它們涵蓋彼此的特定漏洞。

因此，如果要為自動駕駛汽車做一個視覺分類器，那麼也加入一些 GPS 位置的信號。或者，可以添加專用的紅色八角形檢測系統。但是，我的建議是，把全部的道路標誌都撤銷（徹底不依靠道路標誌），把人類因素完全剔除，把所有的道路完全交給機器人。這樣問題就解決了。

相關論文：Robust Physical-World Attacks on Machine Learning Models（https://arxiv.org/abs/1707.08945）

編譯來源：http://spectrum.ieee.org/cars-that-think/transportation/sensors/slight-street-sign-modifications-can-fool-machine-learning-algorithms

點擊閱讀原文可查看職位詳情，期待你的加入~

相關推薦

'能否加速破解暗物質之謎？大型強子對撞機，再加上機器學習算法'

"博科園：本文為粒子物理學類大型強子對撞機的每一次質子碰撞都不同，但只有少數是特殊的。這種特殊的碰撞產生了不尋常的粒子（可能是新粒子、違反物理現象等）或者有助於填補我們對宇宙不完整的認識。發現這些碰撞比眾所周知的大海撈針要困難得多，但改變的革新正在路上。費米實驗室的科學家和...

機器學習算法技術 Azure 電腦硬件物理中央處理器麻省理工學院歐洲 GPU 設計摩托車彼得·希格斯 2019-09-19

'英偉達新算法6-DoF GraspNet可助機器人拿起任意物體'

"據外媒報道，英偉達研究院在利用深度學習訓練各種任務模型方面取得了長足進展。最近，該公司讓BERT實現了有史以來最快的訓練時間並還對有史以來最大的基於轉型的模型進行了訓練。然而正如預期的那樣，基於深度學習的算法首先需要一個龐大的數據集，這在許多情況下是一種奢侈品。除了繼續使...

英偉達算法機器人人工智能人生第一份工作韓國技術設計 2019-09-15

'「知識」圖論與圖學習（二）：圖算法'

"圖（graph）近來正逐漸變成機器學習的一大核心領域，比如你可以通過預測潛在的連接來理解社交網絡的結構、檢測欺詐、理解汽車租賃服務的消費者行為或進行實時推薦。近日，數據科學家 Maël Fabien 在其博客上發佈了涉及圖論、圖算法和圖學習的系列文章《圖論與圖學習》。本文...

算法機器學習社交網絡 Python Neo4J 維基百科文章信息檢索 2019-09-14

'機器學習&深度學習基礎（tensorflow版本實現的算法概述0）'

"tensorflow集成和實現了各種機器學習基礎的算法，可以直接調用。代碼集：https://github.com/ageron/handson-ml監督學習1）決策樹（Decision Tree）和隨機森林決策樹：決策樹是一種樹形結構，為人們提供決策依據，決策樹可以用...

機器學習算法深度學習隨機森林 2019-09-14

'2019WAIC 算法產業化落地，思必馳劍指AI語音未來'

"前沿算法探索和實踐不僅是純學術性的研究，更是引領人工智能產業化落地方的風向標，前沿算法的產業化落地變得尤為重要。人工智能60多年的發展歷程中，算法一直推動學術和產業向前發展的核心力量。今天，人工智能已經從價值驗證期走向規模化落地期。2019世界人工智能大會於8月29-31...

算法 2019世界人工智能大會技術人工智能語音識別技術機器人耳機硬件智能硬件人機交互音箱機器學習上海餐飲 2019-09-12

'程序員的靈魂！算法'

"寫作有金線，金線之上，作家的文字才可能會被流傳下來。編程也是一樣，卓越的程序員和普通程序員之間也有一條看不見的金線，金線之上的程序員，才能做出更具規模，更有創新，更優性能，更智能的軟件和服務。這條金線是什麼呢？數據結構和算法。每個程序員都知道數據結構和算法的重要性，但是真...

算法程序員工程師數據結構數學機器學習編程語言人工智能技術程序設計電腦推薦技術人生第一份工作 2019-09-12

'將門好聲音 | 安全生產重於泰山！基於能量函數的安全控制算法'

"內容來自將門機器人控制規劃社群From: CMU Intelligent Control Lab作者：魏天昊；編輯：T.R.本文為新欄目——將門好聲音第8期。作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。...

算法機器人中國好聲音數學設計 GitHub 人工智能無人駕駛讀書 2019-09-11

'機器學習之誤差反向傳播算法'

"機器學習之誤差反向傳播算法我們知道神經網絡是由大量的參數即權重構成，神經網絡的學習過程則是這些參數的變化更新過程。誤差反向傳播算法就是用於更新這些參數的。這裡我們假設激活函數為Sigmoid。Ps: 在吳恩達機器學習反向傳播算法課程中，而不是：這是因為吳恩達中使用的損失...

機器學習算法吳恩達人工智能 2019-09-09

'今天的內容你可能看不懂，全是關於AI算法的終極討論'

"人工智能下一站是哪裡？深度學習還能紅多久？全球最頂尖的科學家，共論AI的未來。他們的眼光，越過當下，落在那個AI與人類共存的未來。數據、算法、算力，人工智能三要素。如果說數據和算力是必要條件，決定了AI的過去，那麼算法作為“靈魂”，定義了AI的未來。自人工智能概念被提出6...

人工智能算法深度學習機器學習電腦技術加拿大周志華語音識別技術大學卡內基梅隆大學讀書高能小子終極裝備人生第一份工作 2019-09-07

'機器學習在ABR算法中的應用縱覽'

"本文整理自LiveVideoStack線上分享第三季，第五期，由清華大學計算機系網絡技術研究所博士生王莫為為大家介紹近些年ABR算法的發展，探討基於機器學習的ABR算法的優劣勢，並結合AiTrans比賽分析其在直播場景中的應用問題。文/王莫為整理/LiveVideoSta...

算法機器學習技術深度學習愛奇藝清華大學 YouTube 創作者來直播人工智能歷史 2019-09-07

'計算機視覺逼近賽點，高估值AI公司的焦慮與未來'

"指紋解鎖、刷臉識別、自動翻譯多國語言、機器人診斷看病……我們可以深刻感受到，人工智能在改變我們的生活方式和認知。人工智能市場蓬勃發展，作為人工智能三大領域之一的計算機視覺應用市場規模也持續擴大。根據新思界產業研究中心發佈的《2018-2022年中國計算機視覺市場可行性研究...

人工智能技術風險投資人生第一份工作移動互聯網金融投資創業機器人市場營銷商湯 2019-09-07

'影響未來的十大算法之一：機器學習與數據挖掘的PageRank算法'

"由於公司架構調整和業務方向的轉變，我所在的項目組即將接手一個機器學習和數據挖掘的項目，為了後續更好地開展工作，也為了能提高自己的專業技能，我決定開始學習機器和數據挖掘方面的知識。那麼，問題就來了：到底應該從哪裡開始學起呢？最開始我也買了一些機器學習相關的入門書籍，跟著聽一...

算法機器學習數據挖掘 Google 拉里·佩奇斯坦福大學 Python 發現佩奇在線教育 2019-09-03

'算法能拯救爛片嗎？好萊塢正用AI決定拍什麼樣電影'

"作者 | James Vincent 譯者 | Monanfei；編輯 | 琥珀出品 | AI科技大本營（id：rgznai100）電影世界充滿了耐人尋味的事情。眾所周知，Will Smith 拒絕出演 The Matrix 中的 Neo 一角，而 Nicolas Cag...

人工智能奇幻電影算法二十世紀福克斯好萊塢技術軟件珍妮佛·勞倫斯艾瑪·沃特森黑客帝國創業 Excel 2019暴雪打折季文化蒂姆·伯頓 Word 機器人歷史金融 2019-09-03

'揭祕人工智能深度學習算法的奧祕'

"話說當前最熱門的技術是什麼？我想非人工智能莫屬。雖說大導演斯皮爾伯格在2001年就拍攝了好萊塢大片《人工智能》，但他怎麼又能想到十幾年後人類在人工智能領域紮紮實實得走出了一大步——以阿爾法機器人為代表的人工智能橫空出世，在圍棋上戰勝了人類最強棋手。具備學習思考能力的機器人...

人工智能深度學習算法電腦機器學習技術機器人九陽神功文章 2019-09-03

'中國製造路在何方：機器人應用市場全球第一，卻仍未掌握核心算法'

"隨著中國人口紅利持續下降的趨勢，以及中國製造向著更加先進更加自動化的中國“智”造邁進，工業機器人已經成為中國裝備市場最大的需求之一，甚至自2017年中國機器人的市場需求已經佔到了全球機器人市場的三分之一。但可惜的是，即便中國製造對於工業機器人需求如此之高，而且也有很多中國...

機器人算法技術硬件日本體育上海 2019-09-02

'算法不精，國產工業機器人有點“笨”'

"兩臺機器人分別控制雙層托盤，讓其不斷地傾斜、轉動，另一臺機器人控制機械臂在托盤上十個障礙物間不停地穿行而不受阻礙。這段工業機器人演示視頻讓人看得眼花繚亂。“這可是人家2009年的技術，我們現在也無法做到”，資深機器人從業者馬龍感慨地說。想要完成如此複雜的動作，工業機器人的...

機器人算法技術軟件操作系統馬龍硬件孫堯 Google 蘋果公司智能手機 2019-08-30

'宋仲基宋慧喬沒能找到對的人，算法能幫我們找到麼？'

"文章轉載自公眾號 HyperAI超神經，作者神經小姐姐By 超神經場景描述：尋找能夠相伴一生的靈魂伴侶是很多人的美好願望，但現實往往殘酷。為此，基於大數據，機器學習，AI 算法的婚戀網站和應用紛紛出招，它們能夠幫助廣大單身男女解決這個問題嗎？關鍵詞：AI 虛擬媒人...

算法人工智能宋仲基宋慧喬大數據軟件人生第一份工作韓國推薦技術神經科學戀愛不完美媽媽微軟社交網絡工程師李晨機器人賈玲文章蘋果公司 2019-08-22

'「乾貨」自動色階、對比度、直方圖均衡等算法改進優化'

"自動色階自動色階就是自動定義每個通道中最亮和最暗的像素作為白和黑，然後按比例重新分配其間的像素值。對比度對比度指的是一幅圖像中明暗區域最亮的白和最暗的黑之間不同亮度層級的測量，差異範圍越大代表對比越大，差異範圍越小代表對比越小，好的對比率120:1就可容易地顯示生動、豐富...

算法圖像處理設計師最in買手君 2019-08-21

'這應該是全網最全的 Python 算法集！（附415集全套教程分享）'

"本文較長，建議大家仔細閱讀！2019年最新python教程如果你處於想學python或者正在學習python，那麼你的python教程應該不少了吧，但是是最新的嗎？說不定你學的可能是兩年前人家就學過的內容，在這小編分享一波2019最新的python全套教程最後小編為大家準...

Python 算法腳本語言卡爾·高斯 GPS 讀書機器學習 GitHub 機器人工程師 2019-08-19

'機器學習10種經典算法的Python實現'

"廣義來說，有三種機器學習算法1、監督式學習工作機制：這個算法由一個目標變量或結果變量（或因變量）組成。這些變量由已知的一系列預示變量（自變量）預測而來。利用這一系列變量，我們生成一個將輸入值映射到期望輸出值的函數。這個訓練過程會一直持續，直到模型在訓練數據上獲得期望的精...

算法機器學習 Python 隨機森林不完美媽媽 2019-08-18

推薦中...