'圖解Numpy精翻版,一文帶你入門Python數據處理'

Python 機器學習 算術 數據結構 廣播 AI新視野 2019-09-13
"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

預測和標籤向量都包含三個值,也就是說 n 的值為 3。減法後,得到的值如下:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

預測和標籤向量都包含三個值,也就是說 n 的值為 3。減法後,得到的值如下:

圖解Numpy精翻版,一文帶你入門Python數據處理

然後將向量平方得到:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

預測和標籤向量都包含三個值,也就是說 n 的值為 3。減法後,得到的值如下:

圖解Numpy精翻版,一文帶你入門Python數據處理

然後將向量平方得到:

圖解Numpy精翻版,一文帶你入門Python數據處理

對這些值求和:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

預測和標籤向量都包含三個值,也就是說 n 的值為 3。減法後,得到的值如下:

圖解Numpy精翻版,一文帶你入門Python數據處理

然後將向量平方得到:

圖解Numpy精翻版,一文帶你入門Python數據處理

對這些值求和:

圖解Numpy精翻版,一文帶你入門Python數據處理

得到的結果即為該預測的誤差值和模型質量評分。

數據表達

電子表格、圖像、音頻等需要處理和構建模型所需的數據類型,其中很多都適合在 n 維數組中表示:

表格

電子表格就是二維矩陣。電子表格中的每個工作表都可以是它自己的變量。python 中最流行的表格抽象是 pandas 數據幀,其在 NumPy 之上構建。

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

預測和標籤向量都包含三個值,也就是說 n 的值為 3。減法後,得到的值如下:

圖解Numpy精翻版,一文帶你入門Python數據處理

然後將向量平方得到:

圖解Numpy精翻版,一文帶你入門Python數據處理

對這些值求和:

圖解Numpy精翻版,一文帶你入門Python數據處理

得到的結果即為該預測的誤差值和模型質量評分。

數據表達

電子表格、圖像、音頻等需要處理和構建模型所需的數據類型,其中很多都適合在 n 維數組中表示:

表格

電子表格就是二維矩陣。電子表格中的每個工作表都可以是它自己的變量。python 中最流行的表格抽象是 pandas 數據幀,其在 NumPy 之上構建。

圖解Numpy精翻版,一文帶你入門Python數據處理

音頻

音頻文件是樣本的一維數組。每個樣本都是一個數字,代表音頻信號的一小部分。CD 質量的音頻每秒包含 44,100 個樣本,每個樣本是-65535 到 65536 之間的整數。這意味著如果有一個 10 秒的 CD 質量 WAVE 文件,可以將它加載到長度為 10 * 44,100 = 441,000 的 NumPy 數組中。如果想要提取音頻的前一秒,只需將文件加載到 audio 的 NumPy 數組中,然後獲取 audio[:44100]。

下面是一段音頻文件:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

預測和標籤向量都包含三個值,也就是說 n 的值為 3。減法後,得到的值如下:

圖解Numpy精翻版,一文帶你入門Python數據處理

然後將向量平方得到:

圖解Numpy精翻版,一文帶你入門Python數據處理

對這些值求和:

圖解Numpy精翻版,一文帶你入門Python數據處理

得到的結果即為該預測的誤差值和模型質量評分。

數據表達

電子表格、圖像、音頻等需要處理和構建模型所需的數據類型,其中很多都適合在 n 維數組中表示:

表格

電子表格就是二維矩陣。電子表格中的每個工作表都可以是它自己的變量。python 中最流行的表格抽象是 pandas 數據幀,其在 NumPy 之上構建。

圖解Numpy精翻版,一文帶你入門Python數據處理

音頻

音頻文件是樣本的一維數組。每個樣本都是一個數字,代表音頻信號的一小部分。CD 質量的音頻每秒包含 44,100 個樣本,每個樣本是-65535 到 65536 之間的整數。這意味著如果有一個 10 秒的 CD 質量 WAVE 文件,可以將它加載到長度為 10 * 44,100 = 441,000 的 NumPy 數組中。如果想要提取音頻的前一秒,只需將文件加載到 audio 的 NumPy 數組中,然後獲取 audio[:44100]。

下面是一段音頻文件:

圖解Numpy精翻版,一文帶你入門Python數據處理

其他時間序列數據也可以同樣表示(如股票隨時間變化的價格)。

圖像

圖像是尺寸(高度 x 寬度)的像素矩陣。

如果圖像是黑白(即灰度)的,則每個像素都可以用單個數字表示(通常在 0(黑色)和 255(白色)之間)。

下圖是一個圖像文件的部分:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

預測和標籤向量都包含三個值,也就是說 n 的值為 3。減法後,得到的值如下:

圖解Numpy精翻版,一文帶你入門Python數據處理

然後將向量平方得到:

圖解Numpy精翻版,一文帶你入門Python數據處理

對這些值求和:

圖解Numpy精翻版,一文帶你入門Python數據處理

得到的結果即為該預測的誤差值和模型質量評分。

數據表達

電子表格、圖像、音頻等需要處理和構建模型所需的數據類型,其中很多都適合在 n 維數組中表示:

表格

電子表格就是二維矩陣。電子表格中的每個工作表都可以是它自己的變量。python 中最流行的表格抽象是 pandas 數據幀,其在 NumPy 之上構建。

圖解Numpy精翻版,一文帶你入門Python數據處理

音頻

音頻文件是樣本的一維數組。每個樣本都是一個數字,代表音頻信號的一小部分。CD 質量的音頻每秒包含 44,100 個樣本,每個樣本是-65535 到 65536 之間的整數。這意味著如果有一個 10 秒的 CD 質量 WAVE 文件,可以將它加載到長度為 10 * 44,100 = 441,000 的 NumPy 數組中。如果想要提取音頻的前一秒,只需將文件加載到 audio 的 NumPy 數組中,然後獲取 audio[:44100]。

下面是一段音頻文件:

圖解Numpy精翻版,一文帶你入門Python數據處理

其他時間序列數據也可以同樣表示(如股票隨時間變化的價格)。

圖像

圖像是尺寸(高度 x 寬度)的像素矩陣。

如果圖像是黑白(即灰度)的,則每個像素都可以用單個數字表示(通常在 0(黑色)和 255(白色)之間)。

下圖是一個圖像文件的部分:

圖解Numpy精翻版,一文帶你入門Python數據處理

如果圖像是彩色的,則每個像素由三個數字表示———紅、綠和藍。在這種情況下,需要一個三維數組(因為每個單元格只能包含一個數字)。因此彩色圖像由尺寸為(高 x 寬 x3)的 ndarray 表示:

"

本文精心翻譯自Jay Alammar的博客:https://jalammar.github.io/visual-numpy/,其用圖解的方式詳細介紹了 NumPy的功能和使用示例。

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是 Python 生態中數據分析、機器學習和科學計算的基礎。它極大地簡化了向量和矩陣的操作處理。Python 的一些主要軟件包(如 scikit-learn、SciPy、pandas 和 tensorflow)都以 NumPy 作為其架構的基礎部分。除了能對數值數據進行切片(slice)和切塊(dice)之外,使用 NumPy 還能為處理和調試上述庫中的高級實例帶來極大的便利。

本文將介紹 NumPy 的一些主要方法,以及在將數據送入機器學習模型之前,numpy是如何表示不同類型數據(表格、圖像、文本等)的。

import numpy as np

創建數組

通過傳遞一個 python 列表,並使用 np.array()來創建 NumPy 數組。python 創建的數組如下圖右所示:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 提供了一些初始化數組的方法,例如 ones()、zeros() 和 random.random() 等方法。只要傳遞希望 NumPy 生成的元素維數即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

一旦創建了數組,就可以隨意操作啦。

數組運算

下面創建兩個 NumPy 數組來展示數組運算功能。下圖兩個數組分別為 data 和 ones:

圖解Numpy精翻版,一文帶你入門Python數據處理

將它們按位置相加(即每行對應相加),直接輸入 data + ones 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了加,還可以進行如下操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

數組和單個數字之間也可以進行運算操作(即向量和標量之間的運算)。比如說,數組表示以英里為單位的距離,希望將其單位轉換為千米。只需輸入 data * 1.6 即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

NumPy 是通過廣播機制(broadcasting)來實現的,通過判斷維數,來推測要進行的運算。

索引

可以像對 python 列表進行切片一樣,對 NumPy 數組進行任意的索引和切片:

圖解Numpy精翻版,一文帶你入門Python數據處理

聚合

NumPy 還提供聚合功能:

圖解Numpy精翻版,一文帶你入門Python數據處理

除了 min、max 和 sum 之外,還可以使用 mean 得到平均值,使用 prod 得到所有元素的乘積,使用 std 得到標準差等等。

更多維度

上述的例子都是在一個維度上處理向量。NumPy 優雅的關鍵在於能夠將上述所有方法應用到任意數量的維度。

創建矩陣

可以傳遞下列形狀的 python 列表,使 NumPy 創建一個矩陣來表示它:

np.array([[1,2],[3,4]])

也可以使用上面提到的方法(ones()、zeros() 和 random.random()),只要傳入一個描述創建的矩陣維數的元組即可:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣運算

如果兩個矩陣大小相同,可以使用算術運算符(+-*/)對矩陣進行加和乘。NumPy 將其視為 position-wise 運算:

圖解Numpy精翻版,一文帶你入門Python數據處理

也可以對不同大小的兩個矩陣執行此類算術運算,但前提是某一個維度為 1(如矩陣只有一列或一行),在這種情況下,NumPy 使用廣播規則執行算術運算:

點乘

算術運算和矩陣運算的一個關鍵區別是矩陣乘法使用點乘。NumPy 為每個矩陣賦予 dot() 方法,可以用它與其他矩陣執行點乘操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

在上圖的右下角添加了矩陣維數,來強調這兩個矩陣的臨近邊必須有相同的維數。可以把上述運算視為:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣索引

當處理矩陣時,索引和切片操作將更加有用:

圖解Numpy精翻版,一文帶你入門Python數據處理

矩陣聚合

可以像聚合向量一樣聚合矩陣:

圖解Numpy精翻版,一文帶你入門Python數據處理

不僅可以聚合矩陣中的所有值,還可以使用 axis 參數執行跨行或跨列聚合:

圖解Numpy精翻版,一文帶你入門Python數據處理

轉置和維度重塑

處理矩陣時的一個常見需求是旋轉矩陣。當需要對兩個矩陣執行點乘運算並對齊它們共享的維度時,通常需要進行轉置。NumPy 數組有一個方便的方法 T 來求得矩陣轉置:

圖解Numpy精翻版,一文帶你入門Python數據處理

在某些應用中,需要對特定矩陣的變換維度。在機器學習應用中,經常會有當某個模型對輸入形狀的要求與的數據集不同。NumPy 中的 reshape() 方法就可以發揮作用。只需將矩陣所需的新維度賦值給它即可。可以為維度賦值-1,NumPy 可以根據的矩陣推斷出正確的維度:

圖解Numpy精翻版,一文帶你入門Python數據處理

更多維度

NumPy 可以在任意維度實現上述提到的所有內容。其中心數據結構被叫作 ndarray(N 維數組)。

圖解Numpy精翻版,一文帶你入門Python數據處理

在很多情況下,處理一個新的維度只需在 NumPy 函數的參數中添加一個逗號:

圖解Numpy精翻版,一文帶你入門Python數據處理

實際用法

以下是 NumPy 可實現的有用功能的實例演示。

公式

均方差公式,它是監督機器學習模型處理迴歸問題的核心:

圖解Numpy精翻版,一文帶你入門Python數據處理

在 NumPy 中實現該公式很容易:

圖解Numpy精翻版,一文帶你入門Python數據處理

這樣做的好處在於,NumPy 並不關心 predictions 和 labels 包含一個值還是一千個值(只要它們大小相同)。可以通過一個示例依次執行上面代碼行中的四個操作:

圖解Numpy精翻版,一文帶你入門Python數據處理

預測和標籤向量都包含三個值,也就是說 n 的值為 3。減法後,得到的值如下:

圖解Numpy精翻版,一文帶你入門Python數據處理

然後將向量平方得到:

圖解Numpy精翻版,一文帶你入門Python數據處理

對這些值求和:

圖解Numpy精翻版,一文帶你入門Python數據處理

得到的結果即為該預測的誤差值和模型質量評分。

數據表達

電子表格、圖像、音頻等需要處理和構建模型所需的數據類型,其中很多都適合在 n 維數組中表示:

表格

電子表格就是二維矩陣。電子表格中的每個工作表都可以是它自己的變量。python 中最流行的表格抽象是 pandas 數據幀,其在 NumPy 之上構建。

圖解Numpy精翻版,一文帶你入門Python數據處理

音頻

音頻文件是樣本的一維數組。每個樣本都是一個數字,代表音頻信號的一小部分。CD 質量的音頻每秒包含 44,100 個樣本,每個樣本是-65535 到 65536 之間的整數。這意味著如果有一個 10 秒的 CD 質量 WAVE 文件,可以將它加載到長度為 10 * 44,100 = 441,000 的 NumPy 數組中。如果想要提取音頻的前一秒,只需將文件加載到 audio 的 NumPy 數組中,然後獲取 audio[:44100]。

下面是一段音頻文件:

圖解Numpy精翻版,一文帶你入門Python數據處理

其他時間序列數據也可以同樣表示(如股票隨時間變化的價格)。

圖像

圖像是尺寸(高度 x 寬度)的像素矩陣。

如果圖像是黑白(即灰度)的,則每個像素都可以用單個數字表示(通常在 0(黑色)和 255(白色)之間)。

下圖是一個圖像文件的部分:

圖解Numpy精翻版,一文帶你入門Python數據處理

如果圖像是彩色的,則每個像素由三個數字表示———紅、綠和藍。在這種情況下,需要一個三維數組(因為每個單元格只能包含一個數字)。因此彩色圖像由尺寸為(高 x 寬 x3)的 ndarray 表示:

圖解Numpy精翻版,一文帶你入門Python數據處理


歡迎關注全平臺AI自媒體 “AI新視野”,

第一時間獲取人工智能學術、產業前沿!

"

相關推薦

推薦中...