Python库一Numpy库学习总结

N维数组ndarray
Numpy数据存储
随机函数、统计函数、梯度函数

N维数组对象ndarray

基本构成

ndarray是一个多维数组对象，由两部分构成：

实际的数据；
描述这些数据的元数据（数据维度、数据类型等)；

ndarray数组一般要求所有元素类型相同（同质），数组下标从0开始。

注意:

在NumPy中维度(dimensions)叫做轴(axes)，轴的个数叫做秩(rank)；
ndarray中的每个元素在内存中使用相同大小的块。 ndarray中的每个元素是数据类型对象的对象（称为 dtype）；
从ndarray对象提取的任何元素（通过切片）由一个数组标量类型的 Python 对象表示；
ndarray大部分创建的数组默认都是浮点数(出了arange等函数)，为什么？因为大部分科学计算都是浮点数，很少只有整数的数据；

下图显示了ndarray，数据类型对象（dtype）和数组标量类型之间的关系。
在这里插入图片描述

ndarray对象的属性

在这里插入图片描述
代码演示:

import numpy as np

a = np.array([[0, 1, 2, 3, 4],
              [9, 8, 7, 6, 5]])

print(a.ndim)
print(a.shape)
print(a.size)
print(a.dtype)  # int64 这个不是python3中的类型 而是numpy自定义的数据类型
print(a.itemsize)  # 每个元素的大小(字节为单位)

输出：

2
(2, 5)
10
int64
8

ndarray的元素类型

bool、
intc、intp、int8、int16、int32、int64、
uint8、uint16、uint32、uint64、
float16、float32、float64
complex64、complex128

数据类型	描述
bool	存储为一个字节的布尔值（真或假）
int	默认整数，相当于 C 的long，通常为int32或int64
intc	相当于 C 的int，通常为int32或int64
intp	用于索引的整数，与C语言中size_t一致，int32或int64
int8	字节长度的整数，取值：[‐128, 127]
int16	16位长度的整数，取值：[‐32768, 32767]
int32	32位长度的整数，取值：[‐2³¹, 2³¹‐1]
int64	64位长度的整数，取值：[‐2⁶³, 2⁶³‐1]
uint8	8位无符号整数，取值：[0, 255]
uint16	16位无符号整数，取值：[0, 65535]
uint32	32位无符号整数，取值：[0, 2³²‐1]
uint64	64位无符号整数，取值：[0, 2⁶⁴‐1]
float16	16位半精度浮点数：1位符号位，5位指数，10位尾数
float32	32位半精度浮点数：1位符号位，8位指数，23位尾数
float64	64位半精度浮点数：1位符号位，11位指数，52位尾数
complex64	复数类型，实部和虚部都是32位浮点数
complex	复数类型，实部和虚部都是64位浮点数

ndarray也可以有非同质的对象

import numpy as np

# 非同质的 ndarray对象，无法有效发挥NumPy优势，尽量避免使用
a = np.array([[0, 1, 2, 3, 4],
              [9, 8, 7, 6]])  # 不是一个矩阵

print(a.ndim)
print(a.shape)
print(a.size)  # 2
print(a.dtype)  # object 非同质ndarray元素为对象类型
print(a.itemsize)  # 每个元素的大小(字节为单位)

输出:

1
(2,)
2
object
8

创建ndarray数组

创建的方式：

从Python中的列表、元组等类型创建ndarray数组；
使用NumPy中函数创建ndarray数组，如：arange, ones, zeros等；
从字节流（raw bytes）中创建ndarray数组；
从文件中读取特定格式，创建ndarray数组；

下面看前两种常见的创建方式：

① 从Python中的列表、元组等类型创建ndarray数组:

基本格式如下:

x = np.array(list/tuple)
x = np.array(list/tuple, dtype=np.float32)

注意: 当np.array()不指定dtype时，NumPy将根据数据情况关联一个dtype类型；

import numpy as np

# 使用列表创建ndarray对象
x = np.array([0, 1, 2, 3])
print(x)

# 使用元组创建ndarray对象
x = np.array((3, 2, 1, 0))
print(x)

# 使用列表和元组混合创建ndarray对象  --> 包含的个数相同即可
x = np.array([[1, 2], [3, 4], (0.1, 0.2)])  # 二维的
print(x)

输出:

[0 1 2 3]
[3 2 1 0]
[[1.  2. ]
 [3.  4. ]
 [0.1 0.2]]

np.array函数的完整参数如下:

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

参数	描述
object	任何暴露数组接口方法的对象都会返回一个数组或任何（嵌套）序列(元组、列表等)
dtype	数组的所需数据类型，可选。
copy	可选，默认为true，对象是否被复制。
order	C（按行）、F（按列）或A（任意，默认）。
subok	默认情况下，返回的数组被强制为基类数组。如果为true，则返回子类。
ndmin	指定返回数组的最小维数。

② 使用NumPy中函数创建ndarray数组，如：arange, ones, zeros等
在这里插入图片描述
测试：

import numpy as np

# 使用arange来创建(类似python3中的range)
x = np.arange(10)
print(x)
print("*" * 20)

# 使用ones来创建
x = np.ones((3, 4))
print(x)
print("*" * 20)

# 三维的 -- ones的高级用法
x = np.ones((2, 3, 4))
print(x)
print("*" * 20)

# 根据zeros来创建
x = np.zeros((2, 3), dtype=np.int32)
print(x)
print("*" * 20)

# 根据full来创建
x = np.full((2, 3), 6)
print(x)
print("*" * 20)

# 根据eye来创建  创建一个正方形 对角线为1 其余为0
x = np.eye(3)
print(x)
print("*" * 20)

输出:

[0 1 2 3 4 5 6 7 8 9]
********************
[[1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]]
********************
[[[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]

 [[1. 1. 1. 1.]
  [1. 1. 1. 1.]
  [1. 1. 1. 1.]]]
********************
[[0 0 0]
 [0 0 0]]
********************
[[6 6 6]
 [6 6 6]]
********************
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]
********************

其他函数：　
在这里插入图片描述

测试:

import numpy as np

a = np.linspace(1, 10, 4)  # 在[1,10]中等间距的选4个数
print(a)

b = np.linspace(1, 10, 4, endpoint=False)  # [1,10)之间
print(b)

c = np.concatenate((a, b))  # 将a,b合并
print(c)

输出:

[ 1.  4.  7. 10.]
[1.   3.25 5.5  7.75]
[ 1.    4.    7.   10.    1.    3.25  5.5   7.75]

ndarray数组的变化

两种变化:

维度变化；
元素类型变化 : astype函数；

①维度变化: reshape和resize以及flatten的使用:

import numpy as np

a = np.ones((2, 3, 4), dtype=np.int32)
print(a)

print("-------使用reshape生成b------")
# reshape   不改变原来的数组 创建一个新的ndarray
b = a.reshape((2, 12))  # 将[2,3,4] 变成[2,12] 注意都是24个元素
print(b)

print("--------原来的a没有变化------")
# 输出原来的
print(a)

print("--------使用resize改变a-------")
# resize改变原来的　ndarray
a.resize((2, 12))
print(a)

print("--------使用flatten对a降维生成一维c数组------")
c = a.flatten()
print(c)

输出:

[[[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]

 [[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]]
-------使用reshape生成b------
[[1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1]]
--------原来的a没有变化------
[[[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]

 [[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]]
--------使用resize改变a-------
[[1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1]]
--------使用flatten对a降维生成一维c数组------
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]

②元素类型变化: astype函数，以及ndarray转换成列表的tolist()方法:

import numpy as np

a = np.ones((2, 3), dtype=np.int)
print(a)

print("*" * 20)
# 注意astype生成的是一个拷贝的类型 没有修改原来的数组,即使新的类型和原来的类型一致
b = a.astype(np.float)
print(b)

print("-------使用tolist()方法从ndarray中生成列表list-------")
print(b.tolist())  # 注意生成的列表也是二维的

输出：

[[1 1 1]
 [1 1 1]]
********************
[[1. 1. 1.]
 [1. 1. 1.]]
-------使用tolist()方法从ndarray中生成列表list-------
[[1.0, 1.0, 1.0], [1.0, 1.0, 1.0]]

ndarray数组的运算

注意: 数组与标量之间的运算作用于数组的每一个元素。

常用的一元函数：
在这里插入图片描述

常用的二元函数：　
在这里插入图片描述

例子:

import numpy as np

a = np.arange(12).reshape((2, 6))
print(a)
print("*" * 20)

b = np.square(a)  # 平方
print(b)
print("*" * 20)

c = np.sqrt(a)  # 平方根
print(c)
print("*" * 20)

print(np.maximum(a, b))  # 元素级的最大值 输出a,b中较大的
print("*" * 20)

print(b > a)  # 各个位置的比较

输出:

[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]
********************
[[  0   1   4   9  16  25]
 [ 36  49  64  81 100 121]]
********************
[[0.         1.         1.41421356 1.73205081 2.         2.23606798]
 [2.44948974 2.64575131 2.82842712 3.         3.16227766 3.31662479]]
********************
[[  0   1   4   9  16  25]
 [ 36  49  64  81 100 121]]
********************
[[False False  True  True  True  True]
 [ True  True  True  True  True  True]]

Numpy数据存储

一维或二维数据存储

存储到csv文件：

np.savetxt(fname, array, fmt='%.18e', delimiter=None)

多维数据的存储

分为两种：

通过tofile()和fromfile()来存储和读取任意文件。(该方法需要读取时知道存入文件时数组的维度和元素类型)。可以通过元数据文件来存储额外信息。
通过压缩名为.npz的Numpy便捷文件读取；

第一种: tofile()和fromfile()

tofile()方法：

a.tofile(fname, sep='', format='%s')

fname : 文件、字符串；
sep : 数据分割字符串，如果是空串，写入文件为二进制；
format : 写入数据的格式

例子:

import numpy as np

a = np.arange(30).reshape((2, 3, 5))
print(a)

a.tofile("a.dat", sep=",", format='%d')  # 写入

a.tofile("b.dat", format="%d")  # 如果只指定这两个参数，就会生成二进制文件

fromfile()方法:

np.fromfile(fname, dtype=float, count=‐1, sep='')

fname : 文件、字符串；
dtype : 读取的数据类型；
count : 读入元素个数，‐1表示读入整个文件；
sep : 数据分割字符串，如果是空串，写入文件为二进制；

例子:

import numpy as np

a = np.fromfile("a.dat", dtype=np.int, sep=",").reshape((2, 3, 5))
print(a)

b = np.fromfile("b.dat", dtype=np.int).reshape((2, 3, 5))
print(b)

第二种:便捷文件

save()和load()方法:

np.save(fname, array) 或 np.savez(fname, array)

fname : 文件名，以.npy为扩展名，压缩扩展名为.npz；
array : 数组变量；

np.load(fname)

fname : 文件名，以.npy为扩展名，压缩扩展名为.npz；

简单使用的例子:

import numpy as np

a = np.arange(30).reshape((2, 3, 5))
print(a)

np.save("a.npy", a)

print("*" * 20)
b = np.load("a.npy")
print(b)

随机函数、统计函数、梯度函数

随机函数:

在这里插入图片描述

统计函数

在这里插入图片描述
简单的几个演练:

import numpy as np

a = np.arange(15).reshape(3, 5)
print(a)
print("*" * 20)

# 整个数组的和
print(np.sum(a))

# 每一排的和: 第二维度上 (注意第一维度是最外层的维度)
print(np.sum(a, axis=1))

# 加权平均值
print(np.average(a, axis=0, weights=[10, 5, 1]))

输出:
在这里插入图片描述

梯度函数的使用

在这里插入图片描述

简单测试:

import numpy as np

# 一维梯度
a = np.random.randint(0, 20, (5,))
print(a)

print(np.gradient(a))

# 多维梯度
b = np.random.randint(0, 50, (3, 5))
print(np.gradient(b))

输出：

[ 4 12  1  2 12]
[ 8.  -1.5 -5.   5.5 10. ]
[array([[ 13. ,   4. ,   1. ,  26. ,   5. ],
       [ -1.5,  15.5,  16. ,   5.5,   1. ],
       [-16. ,  27. ,  31. , -15. ,  -3. ]]), array([[-16. ,  -6. ,   5. ,  -4.5, -15. ],
       [-25. , -12. ,  16. ,  -2.5, -36. ],
       [ 18. ,  11.5,  -5. , -19.5, -24. ]])]

关于Numpy更多总结可以看这篇博客，我也会持续更新相关知识