Python 数据分析与展示笔记1 -- Numpy 基础

版权声明: https://blog.csdn.net/Wang_Jiankun/article/details/83958397

Python 数据分析与展示笔记1 – NumPy 基础


Python 数据分析与展示系列笔记是笔者学习、实践Python 数据分析与展示的相关笔记

课程链接: Python 数据分析与展示

参考文档:
NumPy 官方文档(英文)
NumPy 官方文档(中文)
PIL 官方文档


一、NumPy 简介


1、安装与导入

# 安装
pip install numpy

# 导入
import numpy as np

2、ndarray 数组

ndarray 数组:

  • ndarray 可以表示 N 维数组
  • ndarray 数组对象的运算是经过优化的,可以去掉元素间运算所需的循环,提升运算速度
  • 数组中的数据类型最好一样,才能发挥优化的性能

ndarray 对象的属性:

属性 说明
.ndim 秩,即轴的数量或维度的数量
.shape ndarray 对象的尺度,对于矩阵,n行m列
.size ndarray 对象元素的个数,相当于 .shape 中 n*m 的值
.dtype ndarray对象的元素类型
.itemsize ndarray对象中每个元素的大小,以字节为单位

ndarray 的元素类型:

数据类型 说明
bool 布尔类型,True或False
intc 与C语言中的int类型一致,一般是int32或int64
intp 用于索引的整数,与C语言中ssize_t一致,int32或int64
int8 字节长度的整数,取值:[‐128, 127]
int16 16位长度的整数,取值:[‐32768, 32767]
int32 32位长度的整数,取值:[‐231, 231‐1]
int64 64位长度的整数,取值:[‐263, 263‐1]
uint8 8位无符号整数,取值:[0, 255]
uint16 16位无符号整数,取值:[0, 65535]
uint32 32位无符号整数,取值:[0, 232‐1]
uint64 32位无符号整数,取值:[0, 264‐1]
float16 16位半精度浮点数:1位符号位,5位指数,10位尾数
float32 32位半精度浮点数:1位符号位,8位指数,23位尾数
float64 64位半精度浮点数:1位符号位,11位指数,52位尾数
complex64 复数类型,实部和虚部都是32位浮点数
complex128 复数类型,实部和虚部都是64位浮点数

二、ndarray 数组的操作


1、创建 ndarray 数组

方法 说明
np.array(list/tuple, dtype) 从列表、元组等中创建
np.arange(n, dtype) 类似range()函数,返回ndarray类型,元素从0到n‐1
np.ones(shape, dtype) 根据shape生成一个全1数组,shape是元组类型
np.zeros(shape, dtype) 根据shape生成一个全0数组,shape是元组类型
np.full(shape,val, dtype) 根据shape生成一个数组,每个元素值都是val
np.eye(n, dtype) 创建n*n单位矩阵,即对角线为1,其余为0
np.ones_like(a, dtype) 根据数组a的形状生成一个全1数组
np.zeros_like(a, dtype) 根据数组a的形状生成一个全0数组
np.full_like(a,val, dtype) 根据数组a的形状生成一个数组,每个元素值都是val
np.linspace(start,end,num) 从start到end等间距地填充num各数据,形成数组
np.concatenate((a,b)) 将两个或多个数组合并成一个新的数组

2、ndarray 数组的变换

方法 说明
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()功能一致,但修改原数组
.swapaxes(ax1,ax2) 将数组n个维度中两个维度进行调换
.flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变
.astype(new_type) 不改变数组元素,改变元素的数据类型
.tolist() 转化为列表 list 类型

3、ndarray 数组的索引和切片

方法 说明
.[index] 索引,index从0开始,-1表示倒数第一个
.[start, end, dist] 切片,从 star t到 end,间距为 dist

4、Numpy 一元函数

函数 说明
np.abs(x)、np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x)、np.log10(x)、np.log2(x) 计算数组各元素的自然对数、10底对数和2底对数
np.ceil(x) np.floor(x) 计算数组各元素的ceiling值或floor值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x)、np.cosh(x)
np.sin(x)、np.sinh(x)
np.tan(x)、np.tanh(x) 计算数组各元素的普通型和双曲型三角函数
np.exp(x) 计算数组各元素的指数值
np.sign(x) 计算数组各元素的符号值,1(+), 0, ‐1(‐)

5、Numpy 二元函数

函数 说明
+ ‐ * / ** 两个数组各元素进行对应运算
np.maximum(x,y) np.fmax()
np.minimum(x,y) np.fmin() 元素级的最大值/最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应元素
> < >= <= == != 两个数组各元素进行算术比较,产生布尔型数组

6、NumPy 统计函数

函数 说明
sum(a, axis=None) 根据给定轴axis计算数组a相关元素之和,axis整数或元组
mean(a, axis=None) 根据给定轴axis计算数组a相关元素的期望,axis整数或元组
average(a,axis=None,weights=None) 根据给定轴axis计算数组a相关元素的加权平均值
std(a, axis=None) 根据给定轴axis计算数组a相关元素的标准差
var(a, axis=None) 根据给定轴axis计算数组a相关元素的方差
min(a)、max(a) 计算数组a中元素的最小值、最大值
argmin(a)、argmax(a) 计算数组a中元素最小值、最大值的降一维后下标
unravel_index(index, shape) 根据shape将一维下标index转换成多维下标
ptp(a) 计算数组a中元素最大值与最小值的差
median(a) 计算数组a中元素的中位数(中值)

7、NumPy 随机函数

函数 说明
np.random.rand(d0,d1,…,dn) 根据d0‐dn创建随机数数组,浮点数,[0,1),均匀分布
np.random.randn(d0,d1,…,dn) 根据d0‐dn创建随机数数组,标准正态分布
np.random.randint(low[,high,shape]) 根据shape创建随机整数或整数数组,范围是[low, high)
np.random.seed(s) 随机数种子,s是给定的种子值
np.random.shuffle(a) 根据数组a的第1轴进行随排列,改变数组x
np.random.permutation(a) 根据数组a的第1轴产生一个新的乱序数组,不改变数组x
np.random.choice(a[,size,replace,p]) 从一维数组a中以概率p抽取元素,形成size形状新数组,

replace表示是否可以重用元素,默认为False

np.random.uniform(low,high,size) 产生具有均匀分布的数组,low起始值,high结束值,size形状
np.random.normal(loc,scale,size) 产生具有正态分布的数组,loc均值,scale标准差,size形状
np.random.poisson(lam,size) 产生具有泊松分布的数组,lam随机事件发生率,size形状

8、NumPy 梯度函数

函数 说明
np.gradient(f) 计算数组f中元素的梯度,当f为多维时,返回每个维度梯度,

中间元素的梯度=(后-前)/2,最左/上边元素=(后-自己),最右/下边元素=(自己-前),


三、NumPy 数据存取


1、一维/二维数组(通常为csv格式)

函数原型:

# 保存
np.savetxt(frame, array, fmt='%.18e', delimiter=None)

# 读取
np.loadtxt(frame, dtype=np.float, delimiter=None, unpack=False)

参数:

  • frame:保存的文件名,可以是.gz或.bz2的压缩文件格式
  • array:存入文件的数组
  • fmt:写入文件的格式,例如:%d %.2f %.18e
  • delimiter:分割字符串,默认是任何空格,csv文件为逗号
  • dtype : 数据类型,可选
  • unpack : 如果True,读入属性将分别写入不同变量

2、任意维度(通常为文本格式)

  • 被拉平为一维数组存入
  • 读取时需要知道数组原本的维度,才能正确还原

函数原型:

# 保存
ndarray.tofile(frame, sep='', format='%s')

# 读取
np.fromfile(frame, dtype=float, count=‐1, sep='')

参数:

  • frame:保存的文件名,文件、字符串类型
  • dtype:数据类型,可选
  • sep:数据分割字符串,如果是空串,写入文件为二进制
  • format:写入数据的格式
  • count:读入元素个数,‐1表示读入整个文件

3、NumPy 自己的类型

  • 可以保存任意维度的数组,直接读取就能正确还原

函数原型:

# 保存
np.save(fname, array) 	# npy格式
np.savez(fname, array) 	# npz格式,为npy的压缩形式

# 读取
np.load(fname)

参数:

  • frame:文件名,.npy / .npz 格式
  • array:存入文件的数组

GOOD LUCK!


猜你喜欢

转载自blog.csdn.net/Wang_Jiankun/article/details/83958397