09.Numpy数组重组

NumPy包中有几个例程用于处理ndarray对象中的元素。它们可以分为以下类型：

修改形状

形状	描述
`reshape`	不改变数据的条件下修改形状
`flat`	数组上的一维迭代器
`flatten`	返回折叠为一维的数组副本
`ravel`	返回连续的展开数组

reshape

这个函数在不改变数据的条件下修改形状，它接受如下参数：

ndarray.reshape(arr, newshape, order')

其中：

arr：要修改形状的数组

newshape：整数或者整数数组，新的形状应当兼容原有形状

order：'C'为 C 风格顺序，'F'为 F 风格顺序，'A'为保留原顺序。

例子

>>> a = np.arange(8)
>>> a.reshape(4, 2)
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])
>>> a.reshape(2, 4)
array([[0, 1, 2, 3],
       [4, 5, 6, 7]])

flat

该函数返回数组上的一维迭代器，行为类似 Python 内建的迭代器。

例子

>>> b = a.reshape(4, -1)
>>> b
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])
>>> b.flat
<numpy.flatiter object at 0x7fa39d1f4800>
>>>
>>> b.flat[5]
5

flatten

该函数返回折叠为一维的数组副本，函数接受下列参数：

ndarray.flatten(order)

其中：

order：

C — 按行，

F — 按列，

A — 原顺序，

k — 元素在内存中的出现顺序。

例子

>>> b
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])
>>> b.flatten(order='C')
array([0, 1, 2, 3, 4, 5, 6, 7])
>>> b.flatten(order='F')
array([0, 2, 4, 6, 1, 3, 5, 7])

ravel

这个函数返回展开的一维数组，并且按需生成副本。返回的数组和输入数组拥有相同数据类型。这个函数接受两个参数。

ndarray.ravel(a, order)

构造器接受下列参数：

order：

C — 按行，

F — 按列，

A — 原顺序，

k — 元素在内存中的出现顺序。

例子

>>> b
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])
>>> b.ravel(order='C')
array([0, 1, 2, 3, 4, 5, 6, 7])
>>> b.ravel(order='F')
array([0, 2, 4, 6, 1, 3, 5, 7])

翻转操作

操作	描述
`transpose`	翻转数组的维度
`ndarray.T`	和`self.transpose()`相同
`rollaxis`	向后滚动指定的轴
`swapaxes`	互换数组的两个轴

transpose

这个函数翻转给定数组的维度。如果可能的话它会返回一个视图。函数接受下列参数：

transpose(arr, axes)

其中：

arr：要转置的数组

axes：整数的列表，对应维度，通常所有维度都会翻转。

例子

>>> np.transpose(np.arange(12).reshape(3, 4))
array([[ 0,  4,  8],
       [ 1,  5,  9],
       [ 2,  6, 10],
       [ 3,  7, 11]])
>>> np.transpose(np.arange(12).reshape(4, 3))
array([[ 0,  3,  6,  9],
       [ 1,  4,  7, 10],
       [ 2,  5,  8, 11]])

T

该函数属于ndarray类，行为类似于transpose。

例子

>>> np.arange(12).T
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
>>> np.arange(12)
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
>>> np.arange(12).reshape(3, 4).T
array([[ 0,  4,  8],
       [ 1,  5,  9],
       [ 2,  6, 10],
       [ 3,  7, 11]])
>>> np.arange(12).reshape(4, 3).T
array([[ 0,  3,  6,  9],
       [ 1,  4,  7, 10],
       [ 2,  5,  8, 11]])

rollaxis

该函数向后滚动特定的轴，直到一个特定位置。这个函数接受三个参数：

rollaxis(arr, axis, start)

其中：

arr：输入数组

axis：要向后滚动的轴，其它轴的相对位置不会改变

start：默认为零，表示完整的滚动。会滚动到特定位置。

例子

>>> a = np.arange(8).reshape(4, 2)
>>> a
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])
>>> a = np.rollaxis(a, 1)
>>> a
array([[0, 2, 4, 6],
       [1, 3, 5, 7]])
>>> a = np.rollaxis(a, 1)
>>> a
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])

swapaxes

该函数交换数组的两个轴。

swapaxes(arr, axis1, axis2)

arr：要交换其轴的输入数组

axis1：对应第一个轴的整数

axis2：对应第二个轴的整数

>>> a = np.arange(8).reshape(2,2,2)
>>> a
array([[[0, 1],
        [2, 3]],

       [[4, 5],
        [6, 7]]])
>>> np.swapaxes(a, 2, 0)
array([[[0, 4],
        [2, 6]],

       [[1, 5],
        [3, 7]]])

修改维度

函数	维度和描述
`broadcast`	产生模仿广播的对象
`broadcast_to`	将数组广播到新形状
`expand_dims`	扩展数组的形状
`squeeze`	从数组的形状中删除单维条目

broadcast

如前所述，NumPy 已经内置了对广播的支持。此功能模仿广播机制。它返回一个对象，该对象封装了将一个数组广播到另一个数组的结果。

该函数使用两个数组作为输入参数。下面的例子说明了它的用法。

>>> x = np.array([[1], [2], [3]])
>>> y = np.array([4, 5, 6])
>>> b = np.broadcast(x, y)
>>> # 对y广播x
>>> r, c = b.iters
>>> for i in r:
...     print(i)
...
...
1
1
1
2
2
2
3
3
3
>>> for j in c:
...     print(j)
...
...
4
5
6
4
5
6
4
5
6
>>> # 广播对象的形状
>>> b.shape
(3, 3)
>>> b = np.broadcast(x, y)
>>> c = np.empty(b.shape)
>>> c.shape
(3, 3)
>>> c.flat = [u + v for (u, v) in b]
>>> c
array([[5., 6., 7.],
       [6., 7., 8.],
       [7., 8., 9.]])
>>> x + y
array([[5, 6, 7],
       [6, 7, 8],
       [7, 8, 9]])

broadcast_to

此函数将数组广播到新形状。它在原始数组上返回只读视图。它通常不连续。如果新形状不符合 NumPy的广播规则，该函数可能会抛出ValueError。

注意 - 此功能可用于 1.10.0 及以后的版本。

该函数接受以下参数。

broadcast_to(array, shape, subok)

例子

>>> a = np.arange(4).reshape(1,4)
>>> a
array([[0, 1, 2, 3]])
>>> np.broadcast_to(a, (4, 4))
array([[0, 1, 2, 3],
       [0, 1, 2, 3],
       [0, 1, 2, 3],
       [0, 1, 2, 3]])

expand_dims

函数通过在指定位置插入新的轴来扩展数组形状。该函数需要两个参数：

expand_dims(arr, axis)

其中：

arr：输入数组

axis：新轴插入的位置

例子

>>> x = np.array(([1,2],[3,4]))
>>> x
array([[1, 2],
       [3, 4]])
>>> y = np.expand_dims(x, axis=0)
>>> y
array([[[1, 2],
        [3, 4]]])
>>> x.shape, y.shape
((2, 2), (1, 2, 2))
>>> y = np.expand_dims(x, axis=1)
>>> x.shape, y.shape
((2, 2), (2, 1, 2))
>>> y
array([[[1, 2]],

       [[3, 4]]])
>>> x.ndim, y.ndim
(2, 3)

squeeze

函数从给定数组的形状中删除一维条目。此函数需要两个参数。

squeeze(arr, axis)

其中：

arr：输入数组

axis：整数或整数元组，用于选择形状中单一维度条目的子集

例子

>>> x = np.arange(9).reshape(1,3,3)
>>> x
array([[[0, 1, 2],
        [3, 4, 5],
        [6, 7, 8]]])
>>> y = np.squeeze(x)
>>> y
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
>>> x.shape, y.shape
((1, 3, 3), (3, 3))

数组的连接

序号	数组及描述
1.	`concatenate` 沿着现存的轴连接数据序列
2.	`stack` 沿着新轴连接数组序列
3.	`hstack` 水平堆叠序列中的数组(列方向)
4.	`vstack` 竖直堆叠序列中的数组(行方向)

concatenate

数组的连接是指连接。此函数用于沿指定轴连接相同形状的两个或多个数组。该函数接受以下参数。

concatenate((a1, a2, ...), axis)

其中：

a1, a2, ...：相同类型的数组序列

axis：沿着它连接数组的轴，默认为 0

例子

>>> a = np.array([[1,2],[3,4]])
>>> a
array([[1, 2],
       [3, 4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.concatenate((a,b))
array([[1, 2],
       [3, 4],
       [5, 6],
       [7, 8]])
>>> np.concatenate((a,b), axis=1)
array([[1, 2, 5, 6],
       [3, 4, 7, 8]])

stack

此函数沿新轴连接数组序列。此功能添加自 NumPy 版本 1.10.0。需要提供以下参数。

stack(arrays, axis)

其中：

arrays：相同形状的数组序列

axis：返回数组中的轴，输入数组沿着它来堆叠

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> a, b
(array([[1, 2],
       [3, 4]]), 
 array([[5, 6],
       [7, 8]]))
>>> np.stack((a, b), 0)
array([[[1, 2],
        [3, 4]],

       [[5, 6],
        [7, 8]]])
>>> np.stack((a, b), 1)
array([[[1, 2],
        [5, 6]],

       [[3, 4],
        [7, 8]]])

hstack

stack函数的变体，通过堆叠来生成水平的单个数组。

例子

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.hstack((a, b))
array([[1, 2, 5, 6],
       [3, 4, 7, 8]])

vstack

stack函数的变体，通过堆叠来生成竖直的单个数组。

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> np.vstack((a, b))
array([[1, 2],
       [3, 4],
       [5, 6],
       [7, 8]])

数组分割

函数	数组及操作
`split`	将一个数组分割为多个子数组
`hsplit`	将一个数组水平分割为多个子数组(按列)
`vsplit`	将一个数组竖直分割为多个子数组(按行)

split

该函数沿特定的轴将数组分割为子数组。函数接受三个参数：

split(ary, indices_or_sections, axis)

其中：

ary：被分割的输入数组

indices_or_sections：

可以是整数，表明要从输入数组创建的，等大小的子数组的数量。

如果此参数是一维数组，则其元素表明要创建新子数组的点。

axis：默认为 0

例子

>>> a = np.arange(9)
>>> np.split(a, 3)
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]
>>> np.split(a, [4, 7])
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8])]

hsplit

hsplit是split()函数的特例，其中轴为 1 表示水平分割，无论输入数组的维度是什么。

>>> a = np.arange(16).reshape(4,4)
>>> a
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])
>>> np.hsplit(a, 1)
[array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])]
>>> np.hsplit(a, 2)
[array([[ 0,  1],
       [ 4,  5],
       [ 8,  9],
       [12, 13]]), array([[ 2,  3],
       [ 6,  7],
       [10, 11],
       [14, 15]])]
>>> np.hsplit(a, 2)
[array([[ 0,  1],
       [ 4,  5],
       [ 8,  9],
       [12, 13]]), array([[ 2,  3],
       [ 6,  7],
       [10, 11],
       [14, 15]])]

vsplit

vsplit是split()函数的特例，其中轴为 0 表示竖直分割，无论输入数组的维度是什么。下面的例子使之更清楚。

>>> a = np.arange(16).reshape(4,4)
>>> a
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15]])
>>> np.vsplit(a, 2)
[array([[0, 1, 2, 3],
       [4, 5, 6, 7]]), 
 array([[ 8,  9, 10, 11],
       [12, 13, 14, 15]])]

添加/删除元素

序号	元素及描述
1.	`resize` 返回指定形状的新数组
2.	`append` 将值添加到数组末尾
3.	`insert` 沿指定轴将值插入到指定下标之前
4.	`delete` 返回删掉某个轴的子数组的新数组
5.	`unique` 寻找数组内的唯一元素

resize

此函数返回指定大小的新数组。如果新大小大于原始大小，则包含原始数组中的元素的重复副本。该函数接受以下参数。

resize(arr, shape)

其中：

arr：要修改大小的输入数组

shape：返回数组的新形状

例子

>>> a = np.array([[1,2,3],[4,5,6]])
>>> a
array([[1, 2, 3],
       [4, 5, 6]])
>>> a.shape
(2, 3)
>>> b = np.resize(a, (3, 2))
>>> b
array([[1, 2],
       [3, 4],
       [5, 6]])
>>> b.shape
(3, 2)
>>> b = np.resize(a, (3, 3))
>>> b
array([[1, 2, 3],
       [4, 5, 6],
       [1, 2, 3]])
>>> b.shape
(3, 3)

append

此函数在输入数组的末尾添加值。附加操作不是原地的，而是分配新的数组。此外，输入数组的维度必须匹配否则将生成ValueError。

函数接受下列函数：

append(arr, values, axis)

其中：

arr：输入数组

values：要向arr添加的值，比如和arr形状相同(除了要添加的轴)

axis：沿着它完成操作的轴。如果没有提供，两个参数都会被展开。

例子

>>> a = np.array([[1,2,3],[4,5,6]])
>>> np.append(a, [[10,11,12]], axis=0)
array([[ 1,  2,  3],
       [ 4,  5,  6],
       [10, 11, 12]])
>>> np.append(a, [[8], [9]], axis=1)
array([[1, 2, 3, 8],
       [4, 5, 6, 9]])
>>> np.append(a, [7,8,9])
array([1, 2, 3, 4, 5, 6, 7, 8, 9])

insert

此函数在给定索引之前，沿给定轴在输入数组中插入值。如果值的类型转换为要插入，则它与输入数组不同。插入没有原地的，函数会返回一个新数组。此外，如果未提供轴，则输入数组会被展开。

insert()函数接受以下参数：

insert(arr, obj, values, axis)

其中：

arr：输入数组

obj：在其之前插入值的索引

values：要插入的值

axis：沿着它插入的轴，如果未提供，则输入数组会被展开

例子

>>> a = np.array([[1,2],[3,4],[5,6]])
>>> a
array([[1, 2],
       [3, 4],
       [5, 6]])
>>> np.insert(a, 3, [11, 12])
array([ 1,  2,  3, 11, 12,  4,  5,  6])
>>> np.insert(a, 1, [[11, 12]], axis=0)
array([[ 1,  2],
       [11, 12],
       [ 3,  4],
       [ 5,  6]])
>>> np.insert(a, 1, [[11], [12]], axis=1)
array([[ 1, 11, 12,  2],
       [ 3, 11, 12,  4],
       [ 5, 11, 12,  6]])

delete

此函数返回从输入数组中删除指定子数组的新数组。与insert()函数的情况一样，如果未提供轴参数，则输入数组将展开。该函数接受以下参数：

delete(arr, obj, axis)

其中：

arr：输入数组

obj：可以被切片，整数或者整数数组，表明要从输入数组删除的子数组

axis：沿着它删除给定子数组的轴，如果未提供，则输入数组会被展开

例子

>>> a = np.arange(12).reshape(3,4)
>>> a
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
>>> np.delete(a, 5)
array([ 0,  1,  2,  3,  4,  6,  7,  8,  9, 10, 11])
>>> np.delete(a, 1, axis=0)
array([[ 0,  1,  2,  3],
       [ 8,  9, 10, 11]])
>>> a = np.array([1,2,3,4,5,6,7,8,9,10])
>>> np.delete(a, np.s_[::2])
array([ 2,  4,  6,  8, 10])

unique

此函数返回输入数组中的去重元素数组。该函数能够返回一个元组，包含去重数组和相关索引的数组。索引的性质取决于函数调用中返回参数的类型。

unique(arr, return_index, return_inverse, return_counts)

其中：

arr：输入数组，如果不是一维数组则会展开

return_index：如果为true，返回输入数组中的元素下标

return_inverse：如果为true，返回去重数组的下标，它可以用于重构输入数组

return_counts：如果为true，返回去重数组中的元素在原数组中的出现次数

例子

>>> a = np.array([5,2,6,2,7,5,6,8,2,9])
>>> np.unique(a)
array([2, 5, 6, 7, 8, 9])
>>> u, indices = np.unique(a, return_index=True)
>>> u
array([2, 5, 6, 7, 8, 9])
>>> indices
array([1, 0, 2, 4, 7, 9])
>>> u, indices = np.unique(a, return_inverse=True)
>>> u
array([2, 5, 6, 7, 8, 9])
>>> indices
array([1, 0, 2, 0, 3, 1, 2, 4, 0, 5])
>>> u, counts = np.unique(a, return_inverse=True)
>>> u
array([2, 5, 6, 7, 8, 9])
>>> counts
array([1, 0, 2, 0, 3, 1, 2, 4, 0, 5])