FPGA與圖像處理

機器學習圖像處理 CPU GPU 人工智能朗銳智科 2018-11-29

機器視覺是人工智能領域中的一個重要分支，目前正處於不斷髮展的階段。機器視覺在常規意義上就是通過光學裝置和非接觸傳感器自動的接受和處理一個真實場景的圖像，通過分析圖像獲得所需信息或用於控制機器運動的裝置，可以看出智能圖像技術處理在機器視覺中佔有舉足輕重的地位。

基於軟件的圖像處理方法存在著一些侷限性，尤其是計算速度和算法效率方面。所以大家很自然的就想到了FPGA作為嵌入式圖像應用的平臺。許多圖像處理本身就是並行計算的，並且FPGA的編程硬件，本質上也是並行的。但是利用FPGA硬件進行圖像處理存在很多的困難，需要學到很多的技巧。

用FPGA做圖像處理最關鍵的一點優勢就是：FPGA能進行實時流水線運算，能達到最高的實時性。因此在一些對實時性要求非常高的應用領域，做圖像處理基本就只能用FPGA。例如在一些分選設備中圖像處理基本上用的都是FPGA，因為在其中相機從看到物料圖像到給出執行指令之間的延時大概只有幾毫秒，這就要求圖像處理必須很快且延時固定，只有FPGA進行的實時流水線運算才能滿足這一要求。

所以要了解FPGA進行圖像處理的優勢就必須理解FPGA所能進行的實時流水線運算和DSP，GPU等進行的圖像處理運算有何不同。DSP，GPU，CPU對圖像的處理基本是以幀為單位的，從相機採集的圖像數據會先存在內存中，然後GPU會讀取內存中的圖像數據進行處理。假如採集圖像的幀率是30幀，那麼DSP，GPU要是能在1/30秒內完成一幀圖像的處理，那基本上就能算是實時處理。

FPGA對圖像進行實時流水線運算是以行為單位的。FPGA可以直接和圖像傳感器芯片連接獲得圖像數據流，如果是RAW格式的則還可以進行差值以獲得RGB圖像數據。FPGA能進行實時流水線處理的關鍵是它可以用其內部的Block Ram緩存若干行的圖像數據。這個Block Ram可以說是類似於CPU裡面的Cache，但Cache不是你能完全控制的，但Block Ram是完全可控的，可以用它實現各種靈活的運算處理。這樣FPGA通過緩存若干行圖像數據就可以對圖像進行實時處理，數據就這樣一邊流過就一邊處理好了，不需要送入DDR緩存了之後再讀出來處理。

這樣的數據流處理顯然是順序讀取數據的，那麼也就只能實現那些順序讀取數據的算法，也就是圖像處理中那一大類用3x3到NxN的算子進行的濾波、取邊緣、膨脹腐蝕等算法。可能大家會覺得這些運算似乎都是最基本的圖像處理運算，只是個前端的預處理，似乎用處不大。但問題是隻有FPGA做這樣的運算才是速度最快效率最高的，比如用CPU做一個取邊緣的算法根本就達不到實時。另外別小看了這種NxN算子法，它可以有各種組合和玩法，可以實現分選多種顏色，甚至分辨簡單形狀等功能。FPGA進行的這種算子法處理是並行流水線算法，其延時是固定的，比如用3x3的算子進行處理其給出結果的延時是兩行圖像的時間。還有這個算子法和現在卷積神經網絡中最前面的卷積層運算是類似的。

FPGA中的Block Ram是重要和稀缺資源，能緩存的圖像數據行數是有限的，所以這個NxN的算子中的N不能特別大。當然FPGA也可以接DDR把圖像緩存到其中再讀出來進行處理，但這種處理模式就和CPU差不多了，達不到最高的實時性。其實有些我們認為需要隨機讀取數據的圖像處理算法也是可以並行流水線化的。

在密集運算中，耽誤時間和消耗功耗的操作往往不是運算本身，而是把數據從內存中搬來搬去。GPU，CPU在進行運算時要把數據從內存中取出來，算好了在放回去。這樣內存帶寬往往成了運算速度的瓶頸，數據搬運過程中的功耗佔的比重也不會小。FPGA則可以通過堆很多計算硬件的方法把要做的運算都展開，然後數據從中流過，完成一個階段的運算之後就直接流入第二個階段，不需要把一個計算階段完成後的數據再送回內存中，再讀出來交給下一個階段的運算。這樣就會節省很多時間和功耗。現在用FPGA做圖像處理就是這樣乾的，比如先用一個3x3的算子進行濾波，再用一個3x3的算子進行取邊緣，在FPGA流水線算法中，濾波處理完了數據立即就會進行取邊緣處理，是不需要像CPU那樣存回內存再讀出來的。

FPGA進行圖像處理的前景還是挺廣闊的，越來越多的工業應用場合都要求更高的實時性，而這正是FPGA所適合的。還有機器學習領域，神經網絡這種層狀的，不需要很隨機的讀取數據的運算是比較適合用FPGA來做的。不過FPGA不擅長浮點運算，如果能整出不需要浮點運算的神經網絡，那麼FPGA在這方面的應用將會更大。

相關推薦

'Python的十大圖像處理工具，讓圖像簡潔直觀有魅力'

"今天，在我們的世界裡充滿了數據，人們不能避免直接或間接地處理各種數據，圖像數據是海量數據的重要組成部分。但是，無論是用於何種用途，這些圖像都需要進行處理。圖像處理是對數字圖像進行分析和處理的過程，旨在改進或提取其中的某些信息，然後將其用於某些行業領域。圖像處理中的常見任務...

Python 圖像處理 OpenCV 編程語言 R語言操作系統算法 C語言設計 2019-09-06

'英特爾AGILEX FPGA如何與CXL相互相容'

"自從英特爾幾年前以167億美元的價格收購Altera以來，FPGA產品組合的推出基本上是英特爾時代之前的產物。然而長時間未有強有力的產品推出，致使Altera原有市場被賽靈思等主要競爭對手所蠶食。不過這幾年的時間，英特爾也並沒有閒著，而是在花時間和精力進行與Altera的...

英特爾 Altera 軟件中央處理器人工智能技術物聯網 GPU 戴爾賽靈思惠普618一戰到底 Google EMC 電腦硬件華為公司思科系統通信微軟阿里巴巴集團 Facebook 設計 2019-09-02

'350億個晶體管全球最大FPGA 賽靈思Virtex UltraScale+ VU19P'

"領先的FPGA供應商Xilinx宣佈，推出全球容量最大的FPGA產品——Virtex UltraScale+ VU19P。據介紹，這個使用臺積電16nm工藝打造的FPGA擁有350億個晶體管、900萬個系統邏輯單元、每秒高達1.5 Terabit的DDR4存儲器帶寬、每秒...

賽靈思技術設計 ARM 人工智能軟件硬件算法可視化技術市場營銷臺灣積體電路製造公司 2019-08-25

'達摩院發佈新一代AI語音FPGA芯片，處理速度成百倍提升'

"在美國舊金山舉行的芯片行業頂級學術會議HOTCHIPS上，阿里巴巴達摩院發佈了新一代AI語音FPGA芯片技術——Ouroboros，該技術能將語音生成算法的計算效率提高百倍以上。阿里達摩院介紹，在使用AI語音合成算法WaveNet生成1秒語音的情況下，如果底層硬件採用的是...

人工智能語音合成技術算法 GPU 語音識別技術雲計算設計中央處理器硬件阿里巴巴集團 2019-08-23

'基於FPGA實現多種小波變換'

"基於提升框架的小波變換方法，利用FPGA 可編程特性可實現多種小波變換。提升框架（LS ：Lifting Scheme）是由Sweldens 等人在近幾年提出的一種小波變換方法，用它的框架結構能有效地計算DWT。對於較長的濾波器，LS 的操作次數比濾波器組的操作方式減少...

設計算法數學圖像處理技術硬件 Scheme 2019-08-22

'5G通信商用開啟，國產FPGA能否分一杯羹？'

"近日，中國首款5G商用手機在京東和蘇寧正式開售，這也意味著國內5G商用正式拉開序幕，一場通信史上的重大變革也正在發生！與4G通信相比，即將到來的5G時代，對通信網絡提出了更高的要求，具備高速度、泛在網、低功耗、低延時等特性。目前相關技術和標準還在持續演進和迭代中，市場上還...

我的第一部5G手機通信技術中國移動華為公司中國聯通運營商 MWC 無人駕駛算法設計人工智能中國電信無人機日本 OPPO 2019-08-21

'從航空航天，網絡和通信到人工智能的嵌入式FPGA的演變等'

"雖然FPGA芯片自20世紀80年代開始供貨，但嵌入式FPGA僅在大約五年前才推出。然而，由於其驚人的靈活性和功能集，它很快就在市場上佔據了一席之地。它現在可以從多家供應商，各種代工廠（臺積電，GlobalFoundries，SMIC和三星）以及180,40,28,22,1...

人工智能技術 Mac電腦 ARM 航空設計通信編譯器分佈式計算數據庫三星集團 2019-08-11

'英特爾推出FPGA加速卡D5005自帶32GB DDR4內存，助力高性能計算'

"現在隨著GPU通用計算能力增強，一些計算任務已經可以交由GPU去處理了。除了GPU外，現在還有一類芯片也在承擔著高性能計算的任務，就是FPGA（可編程邏輯門電路）。英特爾現在就推出了全新的高端FPGA加速卡D5005，以加速一些特定應用。圖片來自Servethehome英...

英特爾 GPU 技術 ARM 設計 Xeon 惠普618一戰到底人工智能硬件 2019-08-10

'2019智博會FPGA智能創新國際大賽·武漢分賽區12強出爐'

"2019中國國際智能產業博覽會FPGA智能創新國際大賽，於6月20日正式啟動。武漢分賽區由 Plug and Play 中國、英特爾創新加速器、英特爾 FPGA 中國創新中心，北京海雲捷迅科技有限公司共同承辦。歷經一個多月的招募與篩選，69支優質團隊通過審核進入終審環節，...

技術智能家居武漢英特爾人工智能生物技術操作系統大數據重慶移動互聯網人機交互雲計算硬件杭州物聯網算法 SaaS 蘇州 GPU 虛擬現實語音識別技術上海設計軟件通信機器人深圳哈佛大學湖南長沙大學人生第一份工作人臉識別 2019-07-28

'衝擊3000萬美元，這家國產FPGA廠商今年要爆發……'

"FPGA是在PAL、GAL、CPLD等可編程器件的基礎上進一步發展的產物，它由輸入/輸出塊、可配置邏輯塊和可編程互聯三部分組成，同一片FPGA，不同的編程數據，可以產生不同的電路功能，因此FPGA的使用非常靈活。它可以應用在航空航天/國防、消費電子、工業、通信、數據中心、...

賽靈思通信設計人工智能技術臺灣積體電路製造公司上海 Altera 軟件英特爾 3D打印打印機 Flash 無人機 2019-07-21

'Microchip擴展了低功耗FPGA視頻和圖像處理解決方案'

"Microchip通過其Microsemi子公司宣佈推出智能嵌入式視覺計劃，該計劃旨在通過Microchip的低功耗PolarFire現場可編程門陣列（FPGA）為智能機器視覺系統的設計提供解決方案Microchip正在擴展其高分辨率智能嵌入式視覺FPGA產品，增加了新的...

微芯片科技圖像處理設計 HDMI 人工智能 Mac電腦照相機算法犯罪現場調查知識產權 2019-07-17

英特爾攜手WWT重塑FPGA，為世界帶來靈活的加速體驗

日前，WWT官方發表了一篇博客，介紹了WWT如何同英特爾合作，利用高級技術中心，展示全新的FPGA技術，讓整個FPGA開發及導入變得更簡單，更智能，更強大...

英特爾技術 Cassandra 數據庫網絡安全人工智能軟件跳槽那些事兒經濟 NoSQL Xeon 中央處理器 Apache SQL 2019-07-13

這將是FPGA的下一代形態？

早前，Xilinx宣佈其新一代基於ACAP架構的芯片系列Versal已經正式出貨給第一批客戶，並將在今年下半年正式大規模出貨。這也意味著Xilinx研發多...

人工智能賽靈思 ARM Altera 操作系統雲計算 GPU 設計 2019-07-03

常用的十大 python 圖像處理工具

本文為 AI 研習社編譯的技術博客，原標題：10 Python image manipulation tools.作者 | Parul Pandey翻譯...

Python 圖像處理 OpenCV C語言編程語言操作系統技術算法人工智能 2019-07-03

這將是FPGA的下一代形態？|半導體行業觀察

來源：內容由公眾號半導體行業觀察（ID：icbank）原創，謝謝！早前，Xilinx宣佈其新一代基於ACAP架構的芯片系列Versal已經正式出貨給...

ARM 人工智能賽靈思 Altera 操作系統雲計算設計 2019-07-02

常用的十大python圖像處理工具

原文標題：10 Python image manipulation tools.作者 | Parul Pandey翻譯 | 安其羅喬爾、JimmyHua今...

Python 圖像處理 OpenCV C語言編程語言操作系統算法 2019-07-02

AppStore今日限免背景虛化圖像處理應用等3款軟件

AppStore今日限免3款app（20190628）如果我的分享對你有點幫助麻煩關注我幫我轉發一下大家的支持是我努力的動力限時免費有可能隨時恢復原價限時...

Mac App Store 軟件圖像處理 iOS iPad iPhone 英語 2019-06-30

國產FPGA再獲助力，上海安路D輪融資獲得大基金領投

近日,上海安路信息科技有限公司(簡稱“上海安路”)完成了D輪增資。本輪增資中,老股東華大半導體、中信資本和公司創始團隊行使了優先認購權,引入的新股東為“國...

上海投資技術證券投資基金軟件設計人生第一份工作中信資本人工智能中信銀行通信清華大學 2019-06-29

Python 圖像處理這樣學小白也易懂，還能順便學習 Photoshop

Pillow 是知名 Python 圖像處理庫 PIL 的一個知名分支，支持 Python 3，有很強大的圖像處理能力，但其 API 卻並不複雜，本文不是...

Photoshop Python 圖像處理 Windows 10 Windows Adobe Systems 操作系統 Microsoft Visual Studio 設計軟件 2019-06-28

由 AI 芯片到目標檢測板，「西安交大」是如何斬獲 DAC FPGA 賽道亞軍？

雷鋒網 AI 科技評論按：2019 年 6 月 5 日，由電子自動化設計頂級會議 DAC 2019 主辦的「低功耗目標檢測系統設計挑戰賽」於美國拉斯維加斯...

人工智能設計西安交通大學算法硬件賽靈思機器人西安技術 ARM 軟件中央處理器 GPU 彙編語言 Python 2019-06-28

推薦中...