用深度學習理解遙感圖像,識別效率提升90倍 | 中科院遙感地球所

乾明 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

高爾夫球場,長期以來的高端社交地,但其存在的背後,卻是對資源環境的侵襲。

不僅大量佔用土地資源、耗費水資源,而且在維護草坪的時候大量使用化肥農藥,會造成嚴重汙染。

有多嚴重呢?

曾任江蘇省副省長的徐鳴此前接受《中國經濟週刊》專訪給出了一個對比:

“一個高爾夫球場的汙染比一座普通工廠的汙染還要嚴重。”

從2004年開始,有關部門就開始出臺一系列政策限制球場建設,並在2017年前後開展了專項清理整治。

但整治效果該如何核查?

球場相對分散,且佔地面積比較大, 通過遙感圖像來檢測,是較優方案,高分辨率光學遙感影像的普及也為球場檢測提供了有力數據支持。

哪怕這些數據都有,檢測起來卻不容易。

下面就是一張遙感圖像,忽略綠框,你能發現其中的高爾夫球場有多少,都在哪嗎?


用深度學習理解遙感圖像,識別效率提升90倍 | 中科院遙感地球所


一個熟練解譯人員從這樣的遙感圖像中檢測出來所有的高爾夫球場,需要15分鐘左右。

而現在,深度學習技術改變了這項工作的面貌。

只需10秒,就能夠在這樣的圖中,自動檢測出高爾夫球場。

相比之下,效率提高90倍。識別的準確度也達到了84%。

這並不是個案特例,而是整個應用方向的集體提升,正切切實實發生在中科院遙感地球所。

這一躍遷是怎麼發生的?又是一個怎樣的過程?

AI在圖像識別領域中已經頗有建樹許多年,為什麼到現在能力才體現出來?

想要回答這些問題,需要先回答——

為什麼原來處理遙感圖像很慢?

利用遙感圖像監測地表,是一個持續的過程。

中科院遙感地球所研究人員說,其中最大的難點就在於,同一個地方的環境和氣候,每年都會發生變化。

這會對理解遙感圖像的算法造成極大的影響。

最直接的體現就是,原本針對這些地方構建的算法,過了一年之後,就要有針對性地調優,適應這些變化,不然就會“罷工”。

而且, 這些算法都與人的經驗有很強的關聯性,如果設計算法的人離職,整個算法就難以為繼了。

需要注意的是,這些算法並不是自動化的,仍舊需要人工去配合。

中國960萬平方公里,想要完成一遍,至少需要千餘人集中工作2到3個月。

怎麼辦?可以用深度學習。現在, 遙感所是這樣做的:

針對一個地方構建樣本庫,然後基於樣本庫中的圖像訓練深度學習模型。

第二年,這一地方的環境和氣候發生變化,只需要把新的圖像加進樣本庫,然後重新把模型訓練一遍就可以了。

同時,這樣也能夠減少對人的依賴,模型的調整不再受限於專家經驗,而是依靠數據的變化。

而且,數據越來越多,也不再是累贅,而是提高模型精度的“養料”。

雖然現在看來,這一切都很高效且非常簡單。

但在從傳統的人工+算法模式到現在深度學習的模式切換中,還經歷了不少困難。

用AI理解遙感圖像,有什麼難的?

圖像識別,可以說是當前AI領域比較成熟的技術了,各種用於圖像理解的深度學習模型層出不窮,而且在特定領域已達到了人類同等水準。

但問題在於,這些深度模型,主要是針對自然圖像的,如果直接用於理解遙感圖像效果就會大打折扣。

因為這兩類圖像之間有很大的差別。

首先,遙感圖像波段比較多,除了自然圖像的RGB三個波段之外,遙感圖像至少還要多出一個近紅外波段,一些衛星獲取的遙感影像有8個波段,高光譜圖像甚至有多達200多個波段。

其次,圖像的尺度差異也非常大,與自然圖像中利用尺度金字塔進行多尺度的識別相比,遙感圖像的尺度差異甚至要達到1:30 以上,才能較好地識別各個目標地物。

第三,有局部空間特徵失真的問題。自然圖像的失真,主要是因為傳感器的邊緣失真和鏡頭失真,整體是可控的。但遙感圖像成像的失真,是由於在圖像獲取中的誤差產生的,相對來說是不可控的。

這些問題的存在,讓現有的深度學習算法很難直接應用到遙感圖像理解任務中。不僅模型需要進一步優化,還需要框架提供支持:

不僅要在遙感影像讀入方面提供多波段的支持,還需要添加針對遙感影像的圖像增強算法,考慮到多波段的顏色增強,以及局部空間特徵變形增強等等方面。

這些,正是百度在其深度學習框架PaddlePaddle中所做的事情,藉助這一框架,中科院遙感地球所,也正在完成一輪新的技術迭代。

應用正越來越廣泛

具體到我們一開始提到的高爾夫球場識別問題,中科院遙感所的研究人員藉助PaddlePaddle框架的支持,使用了Faster R-CNN目標檢測模型。

在專業、標準的高爾夫球場遙感數據集中,只需要10秒,就能夠檢測出遙感圖像中的所有球場。

用人工+算法來識別,則需要15分鐘。

深度學習新方法讓工作效率提高了90倍,檢出準確率也能夠達到84%。


用深度學習理解遙感圖像,識別效率提升90倍 | 中科院遙感地球所


而且,深度學習並不僅僅只是用於自動化檢測高爾夫球場,還正在被用於理解遙感圖像中的機場,建設在山區中的風力和光伏發電站。

藉助深度學習技術,研究人員能夠根據遙感圖像快速識別出一個地區有多少太陽能面板,就有可能對這一地區能夠發多少電有清晰的預估,併為電網建設提供決策支持,避免“有電沒網”或者“有網沒電”的窘境。

根據國家能源局給出的數據,僅2018年,光伏發電就浪費了54.9億度,相當於200多萬家庭一年的用電量(按一家庭每月用電200度來計算)。

這背後的社會價值可見一斑。

而且,理解遙感圖像,只是PaddlePaddle解決實際問題的一個範例。

在計算機視覺領域,這個框架已經能夠支持模型完成圖像分類、目標檢測、圖像語義分割、場景文字識別、圖像生成、人體關鍵點檢測、視頻分類、度量學習等任務。

最後,附上一篇使用指南。如果你感興趣,可以收藏觀看~

計算機視覺八大任務全概述:PaddlePaddle工程師詳解熱門視覺模型

— 完 —

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

相關推薦

推薦中...