機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

機器學習 今日頭條 幻風的AI之路 2019-06-05

(此處已添加圈子卡片,請到今日頭條客戶端查看)

現在有一個csv文件,內部數據為:

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

使用pandas.read_cvs來讀取cvs文件數據,其中food_info為DataFrame類型,這個是pandas的核心結構,food_info.dtypes可以看出來從文件中讀取出來數據的類型,其中object為字符型

顯示讀取的數據,從頭開始顯示,和從尾開始顯示

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

head(3)為重頭開始顯示3行,如果不指定顯示幾行那麼默認顯示五行,tail為從尾部開始顯示,如果不指定則默認顯示5行

也可以通過函數loc來獲取指定行的數據

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

獲取第三行數據,當然取數據也可以通過切片的方式來獲取數據

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

通過切片獲取第3行到第7行的數據,也可以取指定的多行,通過列表的方式指定索引,指定所要取的第幾行

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

上面的讀取是從行的角度,還可以從列的角度來讀取一列數據,通過列名,DataFrame默認文件中最上面的一行為列名

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

可以看出通過列名NDB_No獲取到了該列的數據,如果指獲取一個列那麼就只需要一個列明,如果想要獲取多個列那麼就可以通過列表傳遞多個列名,獲取多個列的數據

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

獲取所有列中單位以mg為單位的列

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

程序思想是,獲取所有的列名,然後遍歷,看哪一個是以mg結尾的,哪個是

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

food_info.columns.tolist()為獲取所有的列名封裝成一個列表

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

獲取到列數據之後,除以一個數等於列中所有數據除以這個數,返回一個新的列

加減乘除一個數就是這個列的所有數據同時加減乘除這個數

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

兩個相同樣本維度的列相乘等於對應位置的相乘

兩個相同樣本維度的列的加減乘除等於對應位置的加減乘除

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

添加一個新的列,方法就是DataFrame[新列名]=列

上面可以看出我們添加了一個列名為37的列,其內容是Icon和Icon1這兩個列的乘積,可以看出新的列添加完成之後,該DataFrame的列為37比之前的36多了一列

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

可以通過max()和min()方法,求出當前列的最值


排序

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

使用sort_values進行指定列的從小到大的排序,其中第一個參數為所要排序的列。第二個參數為inplace=“true”這個意思是排序之後的結果是否保存到當前的DataFrame中,默認為false,如果設置為true那就是保存到當前的DataFrame中,所以我們可以直接輸出food_info看到排序之後的結果

默認是從小到大的排序,可以通過增加參數ascending=False來實現

機器學習必備數據分析庫pandas,如何使用pandas完成文件讀取?

ascending=False寫的時候寫成ascending=“False”沒有效果,所以這種真假以後就全用首字母大寫,且不加引號

相關推薦

推薦中...