初學者指南:圖像識別和深度學習

機器學習 人工智能 智能手機 CNN 科技 離開了編程我會死 2018-12-07

圖像識別和深度學習的基礎知識

看起來很多最新的技術創新都依賴於圖像識別,這是正確的。近年來,智能手機中的面部識別技術,自動駕駛汽車的自動模式以及成像技術取得了長足的進步。他們都使用能夠理解前方物體的解決方案 - 因此它通常被稱為“計算機視覺”。這些計算機能夠根據他們“看到”的內容做出準確的決策。

初學者指南:圖像識別和深度學習

它是如何做到的呢?在本文中,我們將提供有關圖像識別如何工作的高級解釋,以及為其提供支持的深度學習技術。以下是針對那些沒有高級工程背景的人(網上有大量深入的信息),但仍然對圖像識別技術感興趣。

初學者指南:圖像識別和深度學習

深度學習和神經網絡:隨著時間變得更聰明的算法

圖像識別中的許多現代創新都依賴於深度學習技術,一種先進的機器學習類型,以及人工智能的現代奇蹟。典型的機器學習接收數據,推動算法,然後進行預測; 這給人的印象是計算機正在“思考”並得出自己的結論。深度學習的不同之處在於,如果有足夠的時間,它能夠確定結論是否正確。

初學者指南:圖像識別和深度學習

這對於圖像識別非常重要,因為您需要像自動駕駛汽車這樣的東西來區分路標和行人。深度學習技術的工作原理是神經網絡。

神經網絡使用彼此相鄰的算法。這使得每種算法都取決於其他周圍算法的結果。這創建了一個過程,試圖模擬我們用作人類的邏輯推理(以及我們稱之為“人工智能”的原因)。對於圖像識別,使用的神經網絡類型稱為卷積神經網絡。

初學者指南:圖像識別和深度學習

卷積神經網絡:將圖像分解為數字

當我們看到某些東西時,我們的大腦通過標記,預測和識別特定模式來理解它,使用卷積神經網絡(CNN)的計算機以類似的方式處理信息,但它通過使用數字來處理。在我們通過視覺感知(與我們的其他感官一起)識別模式的地方,CNN通過將圖像分解為數字來實現。

初學者指南:圖像識別和深度學習

CNN的內部工作顯然遠比數字模式更復雜和技術性,但重要的是要知道卷積是什麼:產生第三個函數的兩個函數的組合。使用卷積的神經網絡合並多組信息,將它們彙集在一起​​以創建圖像的精確表示。在彙集之後,圖像在許多數據中被描述,神經網絡可以使用這些數據來預測它是什麼。然後,計算機可以將該預測應用於其他應用程序,例如解鎖手機。

初學者指南:圖像識別和深度學習

如果預測準確,神經網絡將隨著時間的推移而學習。與其他任何東西一樣,計算機需要進行大量培訓才能使其預測正確; 他們不會自動知道如何對現實世界中調用的對象進行分類。

圖像數據集:將經驗應用於更具挑戰性的案例

許多人不瞭解人工智能的東西是人類在製作所謂的數據集方面做了多少工作。這就是深度學習模型的培訓方式:它實踐根據數據集中的信息進行預測,並在實際情況中使用該經驗。圖像識別是人工智能開發和廣泛使用的一種形式,部分原因在於數據集的開發方式。圖像識別的一個值得注意的例子是ImageNet,它是人工智能首批廣泛使用的圖像數據庫之一。

初學者指南:圖像識別和深度學習

ImageNet項目標記了320萬張圖像,並促使研究人員開發自己的算法模型。這些標記圖像創建了一個AI模型可以練習的數據集,識別複雜程度越來越高的圖像並利用更高級的卷積。最終,ImageNet被AlexNet所採用,後者利用了一種至今仍在使用的深度卷積神經網絡架構。

初學者指南:圖像識別和深度學習

為了使AI應用程序能夠處理如此大量的信息並在深度學習模型中有效地使用它,它需要一些非常有效的處理能力。

相關推薦

推薦中...