Python機器學習（3）

編程語言機器學習數據結構技術 IT靜熙老師 2017-07-30

上兩篇介紹了numpy、scipy的簡單使用，下面再介紹一個機器學習中經常使用的python庫-pandas。

Pandas提供了一套名為DataFrame的數據結構，比較契合統計分析中的表結構，並且提供了計算接口，可用Numpy或其它方式進行計算。

下面看看其簡單使用：

#encoding=utf8

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
s = pd.Series([1,3,5,np.nan,6,8])
print(s)
dates = pd.date_range('20130101', periods=6)
print(dates)
#創建DataFrame
df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD'))
print(df)
#通過字典創建DataFrame
f2 = pd.DataFrame({ 'A' : 1.,
'B' : pd.Timestamp('20130102'),
'C' : pd.Series(1,index=list(range(4)),dtype='float32'),
'D' : np.array([3] * 4,dtype='int32'),
'E' : pd.Categorical(["test","train","test","train"]),
'F' : 'foo' })
print(f2)
#探索數據
print("前五行：",df.head())
print("後三行：",df.tail(3))
print("index: ",df.index)
print("columns: ",df.columns)
print("values: ",df.values)
print("describe: ",df.describe())
print("轉置：",df.T)
print("按照axis排列：",df.sort_index(axis=0, ascending=False))
print("按照某列排序：",df.sort_values(by='B'))
print("刪除nan：",s.dropna(how='any'))
print("填充nan值：",s.fillna(0))

總之pandas是一個強大的庫，它的複雜用法，還需我們後面通過實踐不斷探索。

學習過程中遇到什麼問題或者想獲取學習資源的話，歡迎加入學習交流群

626062078，我們一起學Python！

Python機器學習（3）

相關推薦

'能否加速破解暗物質之謎？大型強子對撞機，再加上機器學習算法'

"博科園：本文為粒子物理學類大型強子對撞機的每一次質子碰撞都不同，但只有少數是特殊的。這種特殊的碰撞產生了不尋常的粒子（可能是新粒子、違反物理現象等）或者有助於填補我們對宇宙不完整的認識。發現這些碰撞比眾所周知的大海撈針要困難得多，但改變的革新正在路上。費米實驗室的科學家和...

機器學習算法技術 Azure 電腦硬件物理中央處理器麻省理工學院歐洲 GPU 設計摩托車彼得·希格斯 2019-09-19

'Java是什麼？為什麼要學習Java?Java有哪些特點？'

"在正式開始Java學習之前，先來了解幾個關鍵性問題。那就是什麼是Java，為什麼要學習Java，Java 有哪些特點，Java 有哪些機制，如何來學習 Java 等幾個問題。通過這幾個問題讓大家瞭解 Java 的一些內容，從而展開 Java 的學習。1、java是什麼？J...

Java Java虛擬機軟件程序員虛擬機操作系統編程語言網頁遊戲 NetBeans 集成開發環境 Eclipse 設計硬件瀏覽器 UNIX Android 工商銀行文本編輯器 Mac電腦技術中國建設銀行人生第一份工作銀行 2019-09-19

'3分鐘看懂 Facebook Libra為什麼會遭到抵制？'

"6 月 18 日，Facebook 發佈了其數字貨幣項目：Libra blockchain 的白皮書，本文包含：白皮書關鍵信息技術信息項目解析三部分，請按需閱讀。白皮書關鍵信息Libra coin 是什麼？Libra coin 主要解決金融服務的費用和難度的問題，旨在建立...

Facebook 區塊鏈算法數字貨幣匯率萬事達卡技術投資中國人民銀行 Paypal 設計地理 eBay 編程語言數據結構銀行金融 2019-09-19

'機器速記上馬服務奧運會：訊飛成北京冬奧會自動語音轉換供應商'

"2019年9月16日，北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商發佈會在北京冬奧組委園區舉行。科大訊飛股份有限公司正式成為北京2022年冬奧會和冬殘奧會官方自動語音轉換與翻譯獨家供應商。北京冬奧組委專職副主席、祕書長韓子榮，科大訊飛董事長劉慶峰，中國奧...

冬季奧林匹克運動會奧林匹克運動會科大訊飛技術語音合成機器學習劉慶峰語音識別技術國家電網中國石油化工集團自然語言處理體育喻紅招聘青島中國石油 2019-09-19

'30周Java學習計劃清單，分享神級教程帶你飛！確定不整一波？'

"我一直相信：一切不能實實在在幫助到大家的資料，都是耍流氓我的目標是：做一次又一次真正有價值、愉悅感十足的分享Java+大數據+互聯網架構，不斷深入前沿領域學習Java，首先要學JavaSE，這是毋庸置疑的。與此同時，和JavaSE的學習同步，建議大家研究一下數據結構與算...

Java 算法數據結構程序員 Eclipse 人生第一份工作設計編程語言技術設計模式 Apache 讀書大數據小遊戲集成開發環境 2019-09-18

'投資10億，機器人造機器人！全球最大機器人工廠落戶上海'

"近日，由上海建工五建集團承建的ABB機器人未來工廠項目舉行了開工奠基儀式。建成後，該項目為ABB公司在全球範圍內最大、最先進、最具柔性的機器人工廠。該工廠預計將於2021年投入運營，總投資額達1.5億美元（約10億人民幣）。ABB機器人未來工廠項目舉行開工奠基儀式該工程由...

機器人上海技術上海建工集團機器學習跳槽那些事兒投資 2019-09-18

'Python的概念化知識、優化技巧和常見算法性能優化（高級下篇）'

"6、字典實現原理CPython中使用偽隨機探測的散列表作為字典底層數據結構。只有可哈希對象才能作為字典的鍵。如果一個對象有一個在整個生命週期都不變的散列值，而且這個值可以與其他對象進行比較，那麼這個對象就是可哈希Python中所有不可變的內置類型都是可哈希的。可變（列表，...

Python 算法數據結構 XML 編譯器 2019-09-17

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'8個用於業餘項目的優秀Python庫'

"這些庫可以使你更容易構架個人項目。在Python/Django的世界裡有這樣一個諺語：為語言而來，為社區而留。對絕大多數人來說的確是這樣的，但是，還有一件事情使得我們一直停留在Python的世界裡，不願離開，那就是我們可以很容易地利用一頓午餐或晚上幾個小時的時間，把一個想...

Python Django 數據庫 HTML XML 腳本語言 Java 機器學習搜索引擎編程語言 2019-09-16

'《What the f*ck Python!》那難以理解和反人類直覺的例子及原理'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!前言最近，發現了一個在GitHub關於Python的一個非常有趣的項目。這個項目叫《What t...

Python Calvin Klein JavaScript Stack Overflow 機器學習腳本語言 2019-09-16

'阿里在職架構師推出了的一份Python學習清單，這一定是你最需要的'

"站在風口上，豬都能飛起來。人工智能風口，讓Pyhon這門膠水語言轉變成非常火的網紅語言。編程功力深厚的程序員花一兩個星期就能上手Python，而一些新手程序員花幾個月就可以上手。學編程，用Python確實是一個相當不錯的選擇。不過，面對Python網上有紛雜的資料，一些程...

Python MySQL 數據庫 Linux 程序員讀書 Django 面向對象程序編程 CSS HTML JavaScript MongoDB jQuery 人工智能編程語言算法硬件物聯網路由器操作系統 2019-09-16

'PyPy是Python解釋器的替代品，某些 Python 程序來說會快很多倍'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!前言Python因其強大、靈活且易於使用等特性，而贏得了聲譽。這些優點使其在各種各樣的應用程序、...

Python 技術彙編語言機器學習讀書 2019-09-16

'VBA 會被 Python 代替嗎？'

"VBA和Python都可以處理Excel，VBA和Python各有什麼優勢?有傳言說，微軟會使用Python來替代VBA處理Excel，真的會替代麼？在知乎上看到這篇文章，我覺得分析得挺對的，特轉載一下，內容有所刪減。來源：https://zhuanlan.zhihu.c...

Python Excel 電腦微軟 Word 跳槽那些事兒設計軟件技術 PowerShell 人生第一份工作歷史程序設計數據結構財會人工智能金融 2019-09-16

'分佈式機器學習之——Spark MLlib並行訓練原理'

"這裡是王喆的機器學習筆記的第二十五篇文章。接下來的幾篇文章希望與大家一同討論一下機器學習模型的分佈式訓練的問題。這個問題在推薦、廣告、搜索領域尤為突出，因為在互聯網場景下，動輒TB甚至PB級的數據量，幾乎不可能利用單點完成機器學習模型的訓練，分佈式機器學習訓練成為唯一...

Spark 機器學習分佈式計算並行計算大數據 GPU 算法 Docker 中央處理器工程師文章物理 2019-09-16

'機器學習和深度學習的區別是什麼'

"機器學習和深度學習是人工智能的兩個子集，在過去兩年中引起了很多關注。如果你在這裡想以最簡單的方式理解這兩個術語，那就沒有比這更好的地方了。人工智能這兩個領域，即機器學習和深度學習，提出了比整個領域組合更多的問題，主要是因為這兩個領域經常混淆並在提到數據統計建模時可以互換使...

機器學習深度學習人工智能算法技術軟件設計高德納集團人生第一份工作維基百科 2019-09-15

'為什麼有人說 Python 的多線程是雞肋？不是真正意義上的多線程？'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!問題：1、Python 多線程為什麼耗時更長？2、為什麼在 Python 裡面推薦使用多進程而不...

Python 機器學習中央處理器腳本語言網絡爬蟲 2019-09-15

'「NLP」如何系統性的學習NLP，有三AI-NLP知識星球等你來'

"文 | 小Dream哥編輯 | 言有三星球開設的必要性時間過的很快，轉眼在有三AI開設NLP專欄已經2個月了。是時候總結下了，我們的NLP專欄按計劃更新了NLP中用的常用的機器學習模型，深度學習特徵抽取器從RNN講到了Transformer，馬上就要更新BERT。基本上聊...

人工智能機器人技術電腦工程師機器學習讀書 2019-09-15

'3個維度幾張圖片幫你在1分鐘內看完2019蘋果秋季發佈會'

"一年一度的“果粉盛典”蘋果秋季發佈會於今日凌晨(北京時間)在喬布斯劇院成功舉辦，Tim Cook用了100分鐘的時間，發佈了iPhone 11系列手機，還更新了iPad平板和Apple Watch。但從這幾款產品我們不難看出，離開了Jobs的蘋果創新能力明顯下降。從幾款產...

iPhone 蘋果公司 iPad Apple Watch Apple Music 硬件軟件 Apple TV iOS 平板電腦 Surface 設計史蒂夫·喬布斯 Windows 蒂姆·庫克鼠標單鏡頭反光相機微軟輸入法 Netflix 技術諾基亞腕錶 CAPCOM GPS 機器學習 2019-09-15

'「知識」圖論與圖學習（二）：圖算法'

"圖（graph）近來正逐漸變成機器學習的一大核心領域，比如你可以通過預測潛在的連接來理解社交網絡的結構、檢測欺詐、理解汽車租賃服務的消費者行為或進行實時推薦。近日，數據科學家 Maël Fabien 在其博客上發佈了涉及圖論、圖算法和圖學習的系列文章《圖論與圖學習》。本文...

算法機器學習社交網絡 Python Neo4J 維基百科文章信息檢索 2019-09-14

'蘋果發佈iPhone11系列三款手機，AI技術後置3攝重塑拍攝王者'

"蘋果發佈了iPhone 11、11 Pro和11 Pro MAX特別活動在加州庫比蒂諾的未來主義校園舉行。新手機取代了iPhoneXR, iPhoneXS和iPhone XS MAX2018年年底發佈的設備系列。蘋果(Apple)首席執行官蒂姆·庫克(Tim Cook)在...

iPhone 智能手機技術蘋果公司照相機杜比實驗室人工智能設計機器學習蒂姆·庫克華為公司 2019-09-14

推薦中...