使用HOG對衛星圖像中的船舶進行分類

機器學習 Kaggle JSON 不靠譜的貓 2019-04-07

我在瀏覽Kaggle數據集時發現了這個有趣的機器學習數據集（https://www.kaggle.com/rhammell/ships-in-satellite-imagery）。該機器學習數據集包括從衛星圖像中提取的船舶圖像以及一些負面實例。查看此機器學習數據集，我們就可以看到正實例被裁剪為具有相同的寬度和高度。

衛星捕獲船舶的圖像

這些數據的一個明顯應用將是訓練一種“船舶探測器”，這種探測器可以從更大的衛星圖像上利用計算機視覺探測船舶。

我們可以訓練機器學習模型來檢測大型衛星圖像中的船隻

為了實現這一目標，我想到了一種基於方向梯度直方圖(HOG)的方法，這是傳統機器學習方法中使用的一種特徵表示方法。

機器學習數據集由2000個圖像樣本組成。我們可以使用HOG特徵和SVM實現分類器，可以提供相當好的結果。由於船舶的外觀統一、簡單，所以我們無需依靠複雜的模型就能得到良好的結果。

方向梯度直方圖

方向梯度的直方圖，也稱為HOG，在計算機視覺任務中被大量使用，特別是在檢測行人和類似任務時

Hala特徵表示由Dalal和Triggs引入，作為行人檢測任務的表示方法。該方法建立在圖像的局部強度梯度或邊緣方向可以表徵局部物體外觀的思想的基礎上。HOG特徵在行人檢測等各種目標識別任務中都取得了成功。當我們考慮將其用作開發更復雜的特徵方法（如DPM）的基礎時，該方法的重要性是顯而易見的。

圖像被分成小單元，例如8×8像素。在單元內的每個像素處計算梯度向量。梯度向量被分類為直方圖。梯度向量的方向決定了它將落入哪個區域。向量的大小有助於直方圖的頻率。因此，梯度越大，對直方圖值的影響越大。

塊歸一化

在原始論文中，作者提出了一種歸一化方法，使該表示方法對光照具有更強的不變性。該方法是通過組合多個單元來創建塊，即：可以通過組合兩行和兩列單元來創建塊。將單元的直方圖連接在一起，並通過將直方圖除以連接的矢量的大小來歸一化。以這樣的方式創建塊：在兩個塊之間存在一行或一列單元的重疊。

實現HOG特徵分類器

出於我們的目的，讓我們使用scikit-image中的hog實現，因為我們可以在其他分類器中使用計算的HOG特徵。

import numpy as np
import json
from matplotlib import pyplot as plt
from skimage.feature import hog
from skimage import color,img_as_float
from skimage.io import imread
from sklearn import svm
from sklearn.metrics import classification_report,accuracy_score
from skimage.transform import pyramid_gaussian
#This portion deals with extracting the code from the kaggle dataset
f = open(r'../input/shipsnet.json')
dataset = json.load(f)
f.close()
data = np.array(dataset['data']).astype('uint8')
img_length = 80
#Bit of reshaping to get the dataset in order
data = data.reshape(-1,3,img_length,img_length).transpose([0,2,3,1])

為了使用圖像來計算hog特徵，我們需要將圖像轉換為灰度。轉換後的圖像用於計算直方圖。

#Convert the images to grayscale
data_gray = [ color.rgb2gray(i) for i in data]
#pixels per cell
ppc = 16
hog_images = []
hog_features = []
for image in data_gray:
 fd,hog_image = hog(image, orientations=8, pixels_per_cell=(ppc,ppc),cells_per_block=(4, 4),block_norm= 'L2',visualise=True)
 hog_images.append(hog_image)
 hog_features.append(fd)

hog函數返回兩個值。存儲在fd變量中的HOG特徵和可用於表示圖像的HOG特徵的圖像，其存儲在hog_image變量中。如果您不想顯示圖像，只需將visualise參數設置為False，即可將其關閉。

如果我們可視化hog_images對應於之前的圖像，我們將得到這樣的結果

在下一節中，我們準備我們的訓練和測試數據集，比例為80:20。然後我們訓練支持向量機來分類圖像是否包含船。Python代碼如下：

#Extract the labels from the dataset
labels = np.array(dataset['labels']).reshape(len(dataset['labels']),1)
#Create the classifier
clf = svm.SVC()
hog_features = np.array(hog_features)
data_frame = np.hstack((hog_features,labels))
#Shuffle the data set
np.random.shuffle(data_frame)
percentage = 80
partition = int(len(hog_features)*percentage/100)
x_train = data_frame[:partition,:-1]
x_test = data_frame[partition:,:-1]
y_train = data_frame[:partition,-1:].ravel() 
y_test = data_frame[partition:,-1:].ravel()
#Train the classifier with the training data
clf.fit(x_train,y_train)

然後我們使用測試集來評估模型。為了更好地理解數據，最後會報告一些指標。

y_pred = clf.predict(x_test)
print("Accuracy: "+str(accuracy_score(y_test, y_pred)))
print('\n')
print(classification_report(y_test, y_pred))

結論

本研究的目的是探討傳統計算機視覺技術在應用於普通圖像識別任務時的性能。鑑於我們沒有花太多時間調整參數，它還是相當不錯的。使用HOG參數（例如每個單元的像素數和每個塊的單元格）可能會產生不同的結果。這個結果表明我們並不總是需要求助於複雜的學習任務，有時解決方案可能很簡單。在這篇文章中我們只研究了給定圖像的分類，我們還沒有涉及對象定位。有許多方法可以在圖像中查找和定位對象，例如滑動窗口和選擇性搜索以及諸如候選區域之類的新技術。

相關推薦

'使用Python進行機器學習的假設檢驗（附鏈接&代碼）'

"作者：Jose Garcia翻譯：張睿毅校對：張一豪本文約3800字，建議閱讀10分鐘。作者給出了假設檢驗的解讀與Python實現的詳細的假設檢驗中的主要操作。也許所有機器學習的初學者，或者中級水平的學生，或者統計專業的學生，都聽說過這個術語，假設檢驗。我將簡要介紹一下這...

Python 機器學習讀書大學 2019-09-03

'「圖像分類」關於圖像分類中類別不平衡那些事'

"歡迎大家來到圖像分類專欄，類別不平衡時是很常見的問題，本文介紹了類別不平衡圖像分類算法的發展現狀，供大家參考學習。作者&編輯 | 郭冰洋1 簡介小夥伴們在利用公共數據集動手搭建圖像分類模型時，有沒有注意到這樣一個問題呢——每個數據集不同類別的樣本數目幾乎都是一樣的...

算法深度學習設計機器學習 Calvin Klein 2019-08-26

'「圖像分類」簡述無監督圖像分類發展現狀'

"無監督圖像分類問題是圖像分類領域一項極具挑戰的研究課題，本文介紹了無監督圖像分類算法的發展現狀，供大家參考學習。作者 | 郭冰洋編輯 | 言有三1 簡介近年來，深度學習在圖像識別領域取得了前所未有的進步，究其根本，可以歸功於數據集容量的擴充和計算資源的提升。現階段的圖像分...

算法人工智能深度學習機器學習 CNN 能源 2019-08-24

'Protocol Buffers 在 iOS 中的使用'

"Protocol Buffers 在 iOS 中的使用翻譯自：Introduction to Protocol Buffers on iOS對大多數的應用來說，後臺服務、傳輸和存儲數據都是個重要的模塊。開發者在給一個 web service 寫接口時，通常使用 JSON ...

iOS Swift語言編譯器 Xcode 數據結構 JSON Google XML Python 蘋果公司 2019-07-30

'在Web應用中，別再把JWT當做session使用'

"什麼是JWT根據維基百科的定義，JSON WEB Token（JWT，讀作 [/dʒɒt/]），是一種基於JSON的、用於在網絡上聲明某種主張的令牌（token）。JWT通常由三部分組成: 頭信息（header）, 消息體（payload）和簽名（signature）。頭...

JSON Hazelcast 算法 Redis HTML 維基百科 2019-07-25

'重生談《Apex英雄》反作弊幕後正在進行中'

"重生工作室近日在官方博客中分享了一些反作弊工作的進展，博文談及了官方正在研發的一些預防性措施。在官方博文中，重生工作室表示他們知曉遊戲開掛、尤其是在排位中開掛已經成了玩家們熱議的話題，所以官方也談及了一些幕後正在進行的反作弊手段：1、使用機器學習創建行為模型，進而偵測、自...

技術機器學習 2019-07-18

在瀏覽器中使用TensorFlow.js和Python構建機器學習模型

作者：MOHD SANAD ZAKI RIZVI翻譯：吳金笛校對：丁楠雅本文約5500字，建議閱讀15分鐘。本文首先介紹了TensorFlow.js的重要...

瀏覽器機器學習 Python Google HTML JavaScript 文本編輯器電腦 RStudio 深度學習維基百科 2019-07-08

Python中Scikit-Learn庫的分類方法總覽

（此處已添加圈子卡片，請到今日頭條客戶端查看）簡介你是一個正在進入機器學習領域的Python程序員嗎? 掌握Scikit-Learn就是一個開啟你的旅程的...

Python 機器學習算法人工智能隨機森林程序員今日頭條植物 2019-06-29

在Python中使用CSV、JSON和XML的簡便方法

點擊上方關注，All in AI中國Python的卓越靈活性和易用性使其成為最受歡迎的編程語言之一，尤其是對於數據科學家而言。這在很大程度上是因為處理大型...

XML JSON Python 讀書技術 2019-06-18

如何用機器學習算法來進行電影分類？(含Python代碼)

電影分析——K近鄰算法週末，小迪與女朋友小西走出電影院，回味著剛剛看過的電影。小迪：剛剛的電影很精彩，打鬥場景非常真實，又是一部優秀的動作片！小西：是嗎？...

算法 Python 機器學習愛情片動作片戀愛電腦技術歐幾里得數據挖掘無問西東前任攻略唐人街探案 2019-06-05

使用 Python 進行社交媒體情感分析入門

學習自然語言處理的基礎知識並探索兩個有用的 Python 包。-- Michael Mccune（作者）自然語言處理（NLP）是機器學習的一種，它解決了口...

Python 自然語言處理數學文章算法機器學習口譯 Siri 電腦英語 Alexa Internet 2019-05-18

如何在Azure machine learning中使用異常檢測

正如Azure最新的機器學習服務所顯示的那樣，機器學習已不再僅僅是關乎視覺和語音。微軟在機器學習上押下重注的一個關鍵部分是，這些技術需要被民主化，並且能夠轉變為相對容易理解的構建塊，以便微軟的開發人員能夠快速學習並在自己的應用程序中進行使用。這就是Azure認知服務的用武...

Azure 人工智能微軟算法軟件 JSON 技術數據庫語音識別技術信用卡 2019-05-09

如何使用機器學習進行異常檢測和狀態監控？

本文將介紹機器學習和統計分析的幾種不同技術和應用，然後展示如何應用這些方法來對特定用例進行異常檢測和狀態監控。數字化轉型，數字化，工業4.0等.........

機器學習技術銀行 2019-04-20

衛星圖像中的船舶檢測Python實例

衛星圖像是數據科學家可以使用的最豐富的數據源之一。本文將使用Kaggle上的機器學習數據集（https://www.kaggle.com/rhammell...

Python 機器學習 JSON Kaggle 戴爾Latitude 2019-04-19

使用sklearn和Pandas進行特徵選擇

特徵選擇是執行任何機器學習任務時的首要和重要步驟之一。數據集中的特徵表示列。當我們得到機器學習數據集時，不一定每列（特徵）都會對輸出變量產生影響。如果我們...

機器學習 Python 算法波士頓社交網絡 2019-04-08

使用Python Matplotlib進行可視化解釋數據實例

該機器學習數據集(https://ibm.box.com/shared/static/lw190pt9zpy5bd1ptyg2aw15awomz9pu.x...

Python 可視化技術機器學習加拿大 Excel 海地 2019-04-07

使用Keras將音樂分類為不同類型

在本文中，我們將使用機器學習把音樂片段分類為不同類型。我們將使用GTZAN genre collection數據集。此機器學習數據集可以從此處獲取（htt...

機器學習音樂 Python 操作系統嘻哈音樂爵士樂藍調迪斯科 Mac電腦 2019-04-07

使用CNN（卷積神經網絡）和OpenCV進行手勢識別

要構建SLR（手語識別），我們需要三件事：機器學習數據集構建機器學習模型（我們將使用CNN）應用模型平臺（我們將使用OpenCV）1）數據集可以在此處下載...

OpenCV 機器學習人工智能 Python CNN 2019-04-07

在Python中使用JSON

在本教程中，你將通過示例學習如何在Python中解析、讀取和寫入JSON。此外，你還將學習如何將JSON轉換為dict並漂亮地打印它。目錄表什麼是JSON...

JSON Python Java JavaScript 讀書 2019-04-06

使用python進行新聞文檔聚類（潛在語義分析）

在本文中，我將解釋如何使用潛在語義分析（LSA）從一組新聞文章中聚類和查找類似的新聞文檔。LSA是一種NLP技術，用於找出一組文檔中隱藏的概念或主題。數據...

Python NLTK 新聞 JSON Windows 機器學習 HTML 文章英語鏡音雙子 2019-04-05

推薦中...