Python優雅地可視化數據

編程語言 Python 可視化 Windows 計算機視覺與機器學習 2017-06-04

Python優雅地可視化數據

最近看《機器學習系統設計》...前兩章。學到了一些用Matplotlib進行數據可視化的方法。在這裡整理一下。

聲明：由於本文的代碼大部分是參考書中的例子，所以不提供完整代碼，只提供示例片段，也就是隻能看出某一部分用法，感興趣的需要在自己的數據上學習測試。

最開始，當然還是要導入我們需要的包：

# -*- coding=utf-8 -*-
from matplotlib import pyplot as plt
from sklearn.datasets import load_iris
import numpy as np
import itertools

1. 畫散點圖

畫散點圖用plt.scatter(x,y)。

畫連續曲線在下一個例子中可以看到，用到了plt.plot(x,y)。

而plt.xticks(loc，label)可以自定義x軸刻度的顯示，第一個參數表示的是第二個參數label顯示的位置loc。

plt.autoscale(tight=True)可以自動調整圖像顯示的最佳化比例。

plt.scatter(x,y)
plt.title("Web traffic")
plt.xlabel("Time")
plt.ylabel("Hits/hour")
plt.xticks([w*7*24 for w in range(10)],['week %i' %w for w in range(10)])
plt.autoscale(tight=True)
plt.grid()
##plt.show()

畫出散點圖如下：

Python優雅地可視化數據

散點圖

2. 多項式擬合併畫出擬合曲線

## 多項式擬合
fp2 = np.polyfit(x,y,3)
f2 = np.poly1d(fp2)
fx = np.linspace(0,x[-1],1000)
plt.plot(fx,f2(fx),linewidth=4,color='g')
## f2.order: 函數的階數
plt.legend(["d=%i" % f2.order],loc="upper right")
plt.show()

效果圖：

Python優雅地可視化數據

曲線擬合

3. 畫多個子圖

這裡用到的是sklearn的iris_dataset（鳶尾花數據集）。

此數據集包含四列，分別是鳶尾花的四個特徵：

sepal length (cm)——花萼長度
sepal width (cm)——花萼寬度
petal length (cm)——花瓣長度
petal width (cm)——花瓣寬度

這裡首先對數據進行一定的處理，主要就是對特徵名稱進行兩兩排列組合，然後任兩個特徵一個一個做x軸另一個做y軸進行畫圖。

# -*- coding=utf-8 -*-
from matplotlib import pyplot as plt
from sklearn.datasets import load_iris
import numpy as np
import itertools

data = load_iris()
#print(data.data)
#print(data.feature_names)
#print(data.target)

features = data['data']
feature_names = data['feature_names']
target = data['target']
labels = data['target_names'][data['target']]

print(data.data)
print(data.feature_names)

這裡有一個排列組合參考代碼，最後是取出了兩兩組合的情況。

排列組合的結果是feature_names_2包含了排列組合的所有情況，它的每一個元素包含了一個排列組合的所有情況，比如第一個元素包含了所有單個元素排列組合的情況，第二個元素包含了所有的兩兩組合的情況......所以這裡取出了第二個元素，也就是所有的兩兩組合的情況

feature_names_2 = []
#排列組合
for i in range(1,len(feature_names)+1): 
 iter = itertools.combinations(feature_names,i) 
 feature_names_2.append(list(iter)) 
 print(len(feature_names_2[1]))
for i in feature_names_2[1]: 
 print(i)

下面是在for循環裡畫多個子圖的方法。對我來說，這裡需要學習的有不少。比如

for i,k in enumerate(feature_names_2[1]):
這一句老是記不住。
for t,marker,c in zip(range(3),">ox","rgb"):
比如從列表中取出某元素所在的索引的方法：
index1 = feature_names.index(k[0])，也即 index = list.index(element) 的形式。
plt.subplot(2,3,1+i)
比如for循環中畫子圖的方法：
比如for循環的下面這用法：

plt.figure(1)
for i,k in enumerate(feature_names_2[1]):
 index1 = feature_names.index(k[0])
 index2 = feature_names.index(k[1])
 plt.subplot(2,3,1+i)
 for t,marker,c in zip(range(3),">ox","rgb"): 
 plt.scatter(features[target==t,index1],features[target==t,index2],marker=marker,c=c) 
 plt.xlabel(k[0]) 
 plt.ylabel(k[1]) 
 plt.xticks([]) 
 plt.yticks([]) 
 plt.autoscale() 
 plt.tight_layout() 
plt.show()

這裡的可視化效果如下：

Python優雅地可視化數據

多個子圖

4. 畫水平線和垂直線

比如在上面最後一幅圖中，找到了一種方法可以把三種鳶尾花分出來，這是我們需要畫出模型（一條直線）。這個時候怎麼畫呢？

下面需要注意的就是

plt.vlines(x,y_min,y_max)

和

plt.hlines(y,x_min,x_max)

的用法。

plt.figure(2)
for t,marker,c in zip(range(3),">ox","rgb"): 
 plt.scatter(features[target==t,3],features[target==t,2],marker=marker,c=c) 
 plt.xlabel(feature_names[3]) 
 plt.ylabel(feature_names[2]) 
 # plt.xticks([]) 
 # plt.yticks([]) 
 plt.autoscale() 
 plt.vlines(1.6, 0, 8, colors = "c",linewidth=4,linestyles = "dashed")
 plt.hlines(2.5, 0, 2.5, colors = "y",linewidth=4,linestyles = "dashed")
 plt.show()

此時可視化效果如下：

Python優雅地可視化數據

水平線和豎直線

5. 動態畫圖

plt.ion()打開交互模式。plt.show()不再阻塞程序運行。

注意plt.axis()的用法。

plt.axis([0, 100, 0, 1])
plt.ion()for i in range(100):
 y = np.random.random() 
 plt.autoscale() 
 plt.scatter(i, y) 
 plt.pause(0.01)

可視化效果：

Python優雅地可視化數據

動態畫圖

相關推薦

'Python網絡數據採集入門教程'

"在這篇文章中，我們將介紹Python提供的幾乎所有的網絡數據採集工具，你可以將本文看作是我們的《終極網絡數據採集指南》的系列文章。我們將從最基本的工具到最先進的工具進行介紹，並將涵蓋每一個的利弊。當然，我們並不能涵蓋我們討論的每個工具的所有方面，但是這篇文章應該足以讓你瞭...

Python 瀏覽器 Chrome HTML 文章 JavaScript JSON CSS Apache Nginx 操作系統 Reddit OS X 2019-09-19

'Python什麼情況下會生成 pyc文件？通過pyc文件瞭解Python運行原理'

"由於最近一位同學在做分佈式計算時，部分模塊只把 pyc文件拷貝部署至遠程計算節點，導致主節點程序更新後，計算節點拋出了錯誤異常，於是有了這篇文章...示例如下，有兩個py模塊，testops.py 與 testops_imported.py模塊。我們先來看 testops...

Python 分佈式計算 2019-09-18

'用Python實現進制轉換，這一篇教程就夠了！這也太完美了'

"前言Python 實現進制轉換一、導言導語：在計算機進行數據交換時，常常會有一個進制轉換的過程，我們知道計算機只認0 和 1.在內存系統中，基本基於二進制進行運算的，但是有時候數據過於龐大，為了方便存儲管理，計算機會使用十六進制存儲數據，但是怎麼實現數據轉換呢？我們人類由...

Python 電腦 C語言腳本語言工程師迪吉多 2019-09-18

'用 Python 寫一個安卓 APP'

"作者：youerning來源：http://youerning.blog.51cto.com/10513771/1733534前言用 Python 寫安卓 APP 肯定不是最好的選擇，目前用Java和 kotlin 寫的居多，但是肯定也是一個很偷懶的選擇，而且實在不想學習...

Python Android Java Linux Windows 虛擬機 Google Apache VirtualBox iOS Kotlin GitHub 設計 VMware 電腦 2019-09-18

'Python的概念化知識、優化技巧和常見算法性能優化（高級下篇）'

"6、字典實現原理CPython中使用偽隨機探測的散列表作為字典底層數據結構。只有可哈希對象才能作為字典的鍵。如果一個對象有一個在整個生命週期都不變的散列值，而且這個值可以與其他對象進行比較，那麼這個對象就是可哈希Python中所有不可變的內置類型都是可哈希的。可變（列表，...

Python 算法數據結構 XML 編譯器 2019-09-17

'Python中的Lambda，Map和Filter'

"今天的部分介紹了在Python中使用lambda，map和filter函數。我們將介紹每個的基本語法，並通過一些示例來熟悉使用它們。讓我們開始吧！*** Lambda***lambda運算符或lambda函數用於在Python中創建小型的、一次性的匿名函數對象基本語法la...

Python Java 2019-09-17

'8個用於業餘項目的優秀Python庫'

"這些庫可以使你更容易構架個人項目。在Python/Django的世界裡有這樣一個諺語：為語言而來，為社區而留。對絕大多數人來說的確是這樣的，但是，還有一件事情使得我們一直停留在Python的世界裡，不願離開，那就是我們可以很容易地利用一頓午餐或晚上幾個小時的時間，把一個想...

Python Django 數據庫 HTML XML 腳本語言 Java 機器學習搜索引擎編程語言 2019-09-16

'《What the f*ck Python!》那難以理解和反人類直覺的例子及原理'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!前言最近，發現了一個在GitHub關於Python的一個非常有趣的項目。這個項目叫《What t...

Python Calvin Klein JavaScript Stack Overflow 機器學習腳本語言 2019-09-16

'Python Requests作者另一神作，Records通用而優雅的數據庫訪問庫'

"我們在開發過程中經常涉及與數據庫進行交互，比如MySQL、Oracle、PostgreSQL、Sqlite，一般，我們使用其對應的Python 第三方模塊，實現相關數據庫操作，如下MySQL數據庫：mysql-connector，pymysql PostgreSQL數據庫...

數據庫 Python SQL MySQL HTML YAML PostgreSQL Excel 2019-09-16

'阿里在職架構師推出了的一份Python學習清單，這一定是你最需要的'

"站在風口上，豬都能飛起來。人工智能風口，讓Pyhon這門膠水語言轉變成非常火的網紅語言。編程功力深厚的程序員花一兩個星期就能上手Python，而一些新手程序員花幾個月就可以上手。學編程，用Python確實是一個相當不錯的選擇。不過，面對Python網上有紛雜的資料，一些程...

Python MySQL 數據庫 Linux 程序員讀書 Django 面向對象程序編程 CSS HTML JavaScript MongoDB jQuery 人工智能編程語言算法硬件物聯網路由器操作系統 2019-09-16

'python爬蟲模擬微博登錄'

"微博模擬登錄這是本次爬取的網址：https://weibo.com/一、請求分析找到登錄的位置，填寫用戶名密碼進行登錄操作看看這次請求響應的數據是什麼這是響應得到的數據，保存下來exectime: 8nonce: "HW9VSX"pcid: "gz-4ede4c6269a...

Python 微博網絡爬蟲百度 2019-09-16

'PyPy是Python解釋器的替代品，某些 Python 程序來說會快很多倍'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!前言Python因其強大、靈活且易於使用等特性，而贏得了聲譽。這些優點使其在各種各樣的應用程序、...

Python 技術彙編語言機器學習讀書 2019-09-16

'VBA 會被 Python 代替嗎？'

"VBA和Python都可以處理Excel，VBA和Python各有什麼優勢?有傳言說，微軟會使用Python來替代VBA處理Excel，真的會替代麼？在知乎上看到這篇文章，我覺得分析得挺對的，特轉載一下，內容有所刪減。來源：https://zhuanlan.zhihu.c...

Python Excel 電腦微軟 Word 跳槽那些事兒設計軟件技術 PowerShell 人生第一份工作歷史程序設計數據結構財會人工智能金融 2019-09-16

'Python中的Requests模塊，星號和括號'

"requests模塊官方地址：https://github.com/psf/requests官方文檔：https://2.python-requests.org/en/master/用於http請求的模塊，用於網頁數據抓取七個主要方法Python資源共享群：62601...

Python JSON 2019-09-16

'為什麼有人說 Python 的多線程是雞肋？不是真正意義上的多線程？'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!問題：1、Python 多線程為什麼耗時更長？2、為什麼在 Python 裡面推薦使用多進程而不...

Python 機器學習中央處理器腳本語言網絡爬蟲 2019-09-15

'Python學習乾貨史上最全的 Python 爬蟲工具列表大全'

"這個列表包含與網頁抓取和數據處理的Python庫。網絡通用urllib -網絡庫(stdlib)。requests -網絡庫。grab – 網絡庫（基於pycurl）。pycurl – 網絡庫（綁定libcurl）。urllib3 – Python HTTP庫，安全連接池...

Python 網絡爬蟲 HTML Scrapy XML 瀏覽器 CSS XHTML jQuery C語言 JSON Excel 可視化技術 2019-09-15

'Python基礎學習教程系列講解——try_except異常處理機制'

"在Python編程中不可避免的會出現錯誤，在調試階段出現語法之類的錯誤時，Pycharm會在Debug窗口提示錯誤，但是程序在運行時由於內部隱含的問題而引起錯誤，會導致程序終止執行。比如以下例程中，使用urllib庫打開URL時由於網絡問題而發生了錯誤：import ur...

Python PyCharm 2019-09-15

'用Python控制Excel實現自動化辦公！附全套學習教程'

"1.安裝2.操作一個簡單的Excel文檔操作註釋及代碼：操作完成後，數據存儲結果如下：3. 操作簡單Excel文檔並添加數據格式操作代碼如下：附帶數據格式的定義操作效果如圖所示：4.Excel中添加不同類型的數據操作代碼如下：將不同的數據按照指定的格式添加到文件中代碼執行...

Excel Python 2019-09-15

'要看最真實數據來這裡！潔白如玉的戴爾新G3遊戲本優缺點揭祕'

"在主流價位遊戲本市場，除了最主流的聯想拯救者Y7000/Y7000P系列、惠普暗影精靈5/光影精靈5系列，還有一個頗為吸引消費者眼球的系列，那就是戴爾G3，其價格相對於前面兩位稍微便宜點，但重要的是，它的設計很獨特，尤其是白色款，絕對能一瞬間抓住你的眼球。不過這些年，戴爾...

戴爾固態硬盤音箱惠普618一戰到底東芝設計聯想集團金士頓科技 Windows 藍牙 Windows 10 高通 2019-09-15

'入門Python，總遇到這樣那樣的安裝問題，手把手教會你'

"轉發本文並私信我"python"，即可獲得Python資料以及更多系列文章(持續更新的)最近有挺多小夥伴問我要入門 Python 的資料，還有小夥伴完全沒有入門 Python 就直接購買了我的 pandas 專欄。因此我決定寫幾篇 Python 數據處理分析必備的入門知識...

Python 腳本語言 Windows 電腦操作系統文章 2019-09-15

推薦中...