NumPy
包中有几个例程用于处理ndarray
对象中的元素。 它们可以分为以下类型:
修改形状
形状 | 描述 |
---|---|
reshape |
不改变数据的条件下修改形状 |
flat |
数组上的一维迭代器 |
flatten |
返回折叠为一维的数组副本 |
ravel |
返回连续的展开数组 |
reshape
这个函数在不改变数据的条件下修改形状,它接受如下参数:
ndarray.reshape(arr, newshape, order')
其中:
arr
:要修改形状的数组newshape
:整数或者整数数组,新的形状应当兼容原有形状order
:'C'
为 C 风格顺序,'F'
为 F 风格顺序,'A'
为保留原顺序。
例子
>>> a = np.arange(8)
>>> a.reshape(4, 2)
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
>>> a.reshape(2, 4)
array([[0, 1, 2, 3],
[4, 5, 6, 7]])
flat
该函数返回数组上的一维迭代器,行为类似 Python 内建的迭代器。
例子
>>> b = a.reshape(4, -1)
>>> b
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
>>> b.flat
<numpy.flatiter object at 0x7fa39d1f4800>
>>>
>>> b.flat[5]
5
flatten
该函数返回折叠为一维的数组副本,函数接受下列参数:
ndarray.flatten(order)
其中:
order
:
C
— 按行,F
— 按列,A
— 原顺序,k
— 元素在内存中的出现顺序。
例子
>>> b
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
>>> b.flatten(order='C')
array([0, 1, 2, 3, 4, 5, 6, 7])
>>> b.flatten(order='F')
array([0, 2, 4, 6, 1, 3, 5, 7])
ravel
这个函数返回展开的一维数组,并且按需生成副本。返回的数组和输入数组拥有相同数据类型。这个函数接受两个参数。
ndarray.ravel(a, order)
构造器接受下列参数:
order
:
C
— 按行,F
— 按列,A
— 原顺序,k
— 元素在内存中的出现顺序。
例子
>>> b
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
>>> b.ravel(order='C')
array([0, 1, 2, 3, 4, 5, 6, 7])
>>> b.ravel(order='F')
array([0, 2, 4, 6, 1, 3, 5, 7])
翻转操作
操作 | 描述 |
---|---|
transpose |
翻转数组的维度 |
ndarray.T |
和self.transpose() 相同 |
rollaxis |
向后滚动指定的轴 |
swapaxes |
互换数组的两个轴 |
transpose
这个函数翻转给定数组的维度。如果可能的话它会返回一个视图。函数接受下列参数:
transpose(arr, axes)
其中:
arr
:要转置的数组axes
:整数的列表,对应维度,通常所有维度都会翻转。
例子
>>> np.transpose(np.arange(12).reshape(3, 4))
array([[ 0, 4, 8],
[ 1, 5, 9],
[ 2, 6, 10],
[ 3, 7, 11]])
>>> np.transpose(np.arange(12).reshape(4, 3))
array([[ 0, 3, 6, 9],
[ 1, 4, 7, 10],
[ 2, 5, 8, 11]])
T
该函数属于ndarray
类,行为类似于transpose
。
例子
>>> np.arange(12).T
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
>>> np.arange(12)
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
>>> np.arange(12).reshape(3, 4).T
array([[ 0, 4, 8],
[ 1, 5, 9],
[ 2, 6, 10],
[ 3, 7, 11]])
>>> np.arange(12).reshape(4, 3).T
array([[ 0, 3, 6, 9],
[ 1, 4, 7, 10],
[ 2, 5, 8, 11]])
rollaxis
该函数向后滚动特定的轴,直到一个特定位置。这个函数接受三个参数:
rollaxis(arr, axis, start)
其中:
arr
:输入数组axis
:要向后滚动的轴,其它轴的相对位置不会改变start
:默认为零,表示完整的滚动。会滚动到特定位置。
例子
>>> a = np.arange(8).reshape(4, 2)
>>> a
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
>>> a = np.rollaxis(a, 1)
>>> a
array([[0, 2, 4, 6],
[1, 3, 5, 7]])
>>> a = np.rollaxis(a, 1)
>>> a
array([[0, 1],
[2, 3],
[4, 5],
[6, 7]])
swapaxes
该函数交换数组的两个轴。
swapaxes(arr, axis1, axis2)
arr
:要交换其轴的输入数组axis1
:对应第一个轴的整数axis2
:对应第二个轴的整数
>>> a = np.arange(8).reshape(2,2,2)
>>> a
array([[[0, 1],
[2, 3]],
[[4, 5],
[6, 7]]])
>>> np.swapaxes(a, 2, 0)
array([[[0, 4],
[2, 6]],
[[1, 5],
[3, 7]]])
修改维度
函数 | 维度和描述 |
---|---|
broadcast |
产生模仿广播的对象 |
broadcast_to |
将数组广播到新形状 |
expand_dims |
扩展数组的形状 |
squeeze |
从数组的形状中删除单维条目 |
broadcast
如前所述,NumPy
已经内置了对广播的支持。 此功能模仿广播机制。 它返回一个对象,该对象封装了将一个数组广播
到另一个数组的结果。
该函数使用两个数组作为输入参数。 下面的例子说明了它的用法。
>>> x = np.array([[1], [2], [3]])
>>> y = np.array([4, 5, 6])
>>> b = np.broadcast(x, y)
>>> # 对y广播x
>>> r, c = b.iters
>>> for i in r:
... print(i)
...
...
1
1
1
2
2
2
3
3
3
>>> for j in c:
... print(j)
...
...
4
5
6
4
5
6
4
5
6
>>> # 广播对象的形状
>>> b.shape
(3, 3)
>>> b = np.broadcast(x, y)
>>> c = np.empty(b.shape)
>>> c.shape
(3, 3)
>>> c.flat = [u + v for (u, v) in b]
>>> c
array([[5., 6., 7.],
[6., 7., 8.],
[7., 8., 9.]])
>>> x + y
array([[5, 6, 7],
[6, 7, 8],
[7, 8, 9]])
broadcast_to
此函数将数组广播
到新形状。 它在原始数组上返回只读视图。 它通常不连续。 如果新形状不符合 NumPy
的广播规则,该函数可能会抛出ValueError
。
注意 - 此功能可用于 1.10.0 及以后的版本。
该函数接受以下参数。
broadcast_to(array, shape, subok)
例子
>>> a = np.arange(4).reshape(1,4)
>>> a
array([[0, 1, 2, 3]])
>>> np.broadcast_to(a, (4, 4))
array([[0, 1, 2, 3],
[0, 1, 2, 3],
[0, 1, 2, 3],
[0, 1, 2, 3]])
expand_dims
函数通过在指定位置插入新的轴来扩展数组形状。该函数需要两个参数:
expand_dims(arr, axis)
其中:
arr
:输入数组axis
:新轴插入的位置
例子
>>> x = np.array(([1,2],[3,4]))
>>> x
array([[1, 2],
[3, 4]])
>>> y = np.expand_dims(x, axis=0)
>>> y
array([[[1, 2],
[3, 4]]])
>>> x.shape, y.shape
((2, 2), (1, 2, 2))
>>> y = np.expand_dims(x, axis=1)
>>> x.shape, y.shape
((2, 2), (2, 1, 2))
>>> y
array([[[1, 2]],
[[3, 4]]])
>>> x.ndim, y.ndim
(2, 3)
squeeze
函数从给定数组的形状中删除一维条目。 此函数需要两个参数。
squeeze(arr, axis)
其中:
arr
:输入数组axis
:整数或整数元组,用于选择形状中单一维度条目
的子集
例子
>>> x = np.arange(9).reshape(1,3,3)
>>> x
array([[[0, 1, 2],
[3, 4, 5],
[6, 7, 8]]])
>>> y = np.squeeze(x)
>>> y
array([[0, 1, 2],
[3, 4, 5],
[6, 7, 8]])
>>> x.shape, y.shape
((1, 3, 3), (3, 3))
数组的连接
序号 | 数组及描述 |
---|---|
1. | concatenate 沿着现存的轴连接数据序列 |
2. | stack 沿着新轴连接数组序列 |
3. | hstack 水平堆叠序列中的数组(列方向) |
4. | vstack 竖直堆叠序列中的数组(行方向) |
concatenate
数组的连接是指连接。 此函数用于沿指定轴连接相同形状的两个或多个数组。 该函数接受以下参数。
concatenate((a1, a2, ...), axis)
其中:
a1, a2, ...
:相同类型的数组序列axis
:沿着它连接数组的轴,默认为 0
例子
>>> a = np.array([[1,2],[3,4]])
>>> a
array([[1, 2],
[3, 4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.concatenate((a,b))
array([[1, 2],
[3, 4],
[5, 6],
[7, 8]])
>>> np.concatenate((a,b), axis=1)
array([[1, 2, 5, 6],
[3, 4, 7, 8]])
stack
此函数沿新轴连接数组序列。 此功能添加自 NumPy 版本 1.10.0。 需要提供以下参数。
stack(arrays, axis)
其中:
arrays
:相同形状的数组序列axis
:返回数组中的轴,输入数组沿着它来堆叠
>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> a, b
(array([[1, 2],
[3, 4]]),
array([[5, 6],
[7, 8]]))
>>> np.stack((a, b), 0)
array([[[1, 2],
[3, 4]],
[[5, 6],
[7, 8]]])
>>> np.stack((a, b), 1)
array([[[1, 2],
[5, 6]],
[[3, 4],
[7, 8]]])
hstack
stack
函数的变体,通过堆叠来生成水平的单个数组。
例子
>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.hstack((a, b))
array([[1, 2, 5, 6],
[3, 4, 7, 8]])
vstack
stack
函数的变体,通过堆叠来生成竖直的单个数组。
>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.vstack((a, b))
array([[1, 2],
[3, 4],
[5, 6],
[7, 8]])
数组分割
函数 | 数组及操作 |
---|---|
split |
将一个数组分割为多个子数组 |
hsplit |
将一个数组水平分割为多个子数组(按列) |
vsplit |
将一个数组竖直分割为多个子数组(按行) |
split
该函数沿特定的轴将数组分割为子数组。函数接受三个参数:
split(ary, indices_or_sections, axis)
其中:
ary
:被分割的输入数组indices_or_sections
:
- 可以是整数,表明要从输入数组创建的,等大小的子数组的数量。
- 如果此参数是
一维数组
,则其元素表明要创建新子数组的点。axis
:默认为 0
例子
>>> a = np.arange(9)
>>> np.split(a, 3)
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]
>>> np.split(a, [4, 7])
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8])]
hsplit
hsplit
是split()
函数的特例,其中轴为 1 表示水平分割,无论输入数组的维度是什么。
>>> a = np.arange(16).reshape(4,4)
>>> a
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15]])
>>> np.hsplit(a, 1)
[array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15]])]
>>> np.hsplit(a, 2)
[array([[ 0, 1],
[ 4, 5],
[ 8, 9],
[12, 13]]), array([[ 2, 3],
[ 6, 7],
[10, 11],
[14, 15]])]
>>> np.hsplit(a, 2)
[array([[ 0, 1],
[ 4, 5],
[ 8, 9],
[12, 13]]), array([[ 2, 3],
[ 6, 7],
[10, 11],
[14, 15]])]
vsplit
vsplit
是split()
函数的特例,其中轴为 0 表示竖直分割,无论输入数组的维度是什么。下面的例子使之更清楚。
>>> a = np.arange(16).reshape(4,4)
>>> a
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15]])
>>> np.vsplit(a, 2)
[array([[0, 1, 2, 3],
[4, 5, 6, 7]]),
array([[ 8, 9, 10, 11],
[12, 13, 14, 15]])]
添加/删除元素
序号 | 元素及描述 |
---|---|
1. | resize 返回指定形状的新数组 |
2. | append 将值添加到数组末尾 |
3. | insert 沿指定轴将值插入到指定下标之前 |
4. | delete 返回删掉某个轴的子数组的新数组 |
5. | unique 寻找数组内的唯一元素 |
resize
此函数返回指定大小的新数组。 如果新大小大于原始大小,则包含原始数组中的元素的重复副本。 该函数接受以下参数。
resize(arr, shape)
其中:
arr
:要修改大小的输入数组shape
:返回数组的新形状
例子
>>> a = np.array([[1,2,3],[4,5,6]])
>>> a
array([[1, 2, 3],
[4, 5, 6]])
>>> a.shape
(2, 3)
>>> b = np.resize(a, (3, 2))
>>> b
array([[1, 2],
[3, 4],
[5, 6]])
>>> b.shape
(3, 2)
>>> b = np.resize(a, (3, 3))
>>> b
array([[1, 2, 3],
[4, 5, 6],
[1, 2, 3]])
>>> b.shape
(3, 3)
append
此函数在输入数组的末尾添加值。 附加操作不是原地的,而是分配新的数组。 此外,输入数组的维度必须匹配否则将生成ValueError
。
函数接受下列函数:
append(arr, values, axis)
其中:
arr
:输入数组values
:要向arr
添加的值,比如和arr
形状相同(除了要添加的轴)axis
:沿着它完成操作的轴。如果没有提供,两个参数都会被展开。
例子
>>> a = np.array([[1,2,3],[4,5,6]])
>>> np.append(a, [[10,11,12]], axis=0)
array([[ 1, 2, 3],
[ 4, 5, 6],
[10, 11, 12]])
>>> np.append(a, [[8], [9]], axis=1)
array([[1, 2, 3, 8],
[4, 5, 6, 9]])
>>> np.append(a, [7,8,9])
array([1, 2, 3, 4, 5, 6, 7, 8, 9])
insert
此函数在给定索引之前,沿给定轴在输入数组中插入值。 如果值的类型转换为要插入,则它与输入数组不同。 插入没有原地的,函数会返回一个新数组。 此外,如果未提供轴,则输入数组会被展开。
insert()
函数接受以下参数:
insert(arr, obj, values, axis)
其中:
arr
:输入数组obj
:在其之前插入值的索引values
:要插入的值axis
:沿着它插入的轴,如果未提供,则输入数组会被展开
例子
>>> a = np.array([[1,2],[3,4],[5,6]])
>>> a
array([[1, 2],
[3, 4],
[5, 6]])
>>> np.insert(a, 3, [11, 12])
array([ 1, 2, 3, 11, 12, 4, 5, 6])
>>> np.insert(a, 1, [[11, 12]], axis=0)
array([[ 1, 2],
[11, 12],
[ 3, 4],
[ 5, 6]])
>>> np.insert(a, 1, [[11], [12]], axis=1)
array([[ 1, 11, 12, 2],
[ 3, 11, 12, 4],
[ 5, 11, 12, 6]])
delete
此函数返回从输入数组中删除指定子数组的新数组。 与insert()
函数的情况一样,如果未提供轴参数,则输入数组将展开。 该函数接受以下参数:
delete(arr, obj, axis)
其中:
arr
:输入数组obj
:可以被切片,整数或者整数数组,表明要从输入数组删除的子数组axis
:沿着它删除给定子数组的轴,如果未提供,则输入数组会被展开
例子
>>> a = np.arange(12).reshape(3,4)
>>> a
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
>>> np.delete(a, 5)
array([ 0, 1, 2, 3, 4, 6, 7, 8, 9, 10, 11])
>>> np.delete(a, 1, axis=0)
array([[ 0, 1, 2, 3],
[ 8, 9, 10, 11]])
>>> a = np.array([1,2,3,4,5,6,7,8,9,10])
>>> np.delete(a, np.s_[::2])
array([ 2, 4, 6, 8, 10])
unique
此函数返回输入数组中的去重元素数组。 该函数能够返回一个元组,包含去重数组和相关索引的数组。 索引的性质取决于函数调用中返回参数的类型。
unique(arr, return_index, return_inverse, return_counts)
其中:
arr
:输入数组,如果不是一维数组则会展开return_index
:如果为true
,返回输入数组中的元素下标return_inverse
:如果为true
,返回去重数组的下标,它可以用于重构输入数组return_counts
:如果为true
,返回去重数组中的元素在原数组中的出现次数
例子
>>> a = np.array([5,2,6,2,7,5,6,8,2,9])
>>> np.unique(a)
array([2, 5, 6, 7, 8, 9])
>>> u, indices = np.unique(a, return_index=True)
>>> u
array([2, 5, 6, 7, 8, 9])
>>> indices
array([1, 0, 2, 4, 7, 9])
>>> u, indices = np.unique(a, return_inverse=True)
>>> u
array([2, 5, 6, 7, 8, 9])
>>> indices
array([1, 0, 2, 0, 3, 1, 2, 4, 0, 5])
>>> u, counts = np.unique(a, return_inverse=True)
>>> u
array([2, 5, 6, 7, 8, 9])
>>> counts
array([1, 0, 2, 0, 3, 1, 2, 4, 0, 5])