基于nmpy,pandas数据分析

nmpy:
numpy库的使用是sklearn库和opencv库的基础,主要用于矩阵的计算。
Numpy 的主要用途是以数组的形式进行数据操作。机器学习中大多数操作都是数学操作,而 Numpy 使这些操作变得简单

创建全0的数组 np.zeros(([2,2]))
创建全1的数组 np.ones(([2,2]))
生成对角矩阵 np.eye(N, M=None, k=0, dtype=float, order=‘C’):生成一个对角矩阵,N为行数;M为列数,默认和N一样;k为对角线的索引,0代表主对角线。在这里插入图片描述
生成一个未初始化的数组 # numpy.empty(shape, dtype=float, order=‘C’):生成一个未初始化的数组。print(np.empty([3,3])) # 生成一个未初始化的3*3数组
生成一个填充值的数组 np.full([3,3],6)
生成等间隔的数组 np.linspace(0,100,10) 0----起始值 100----终止值 10—数量
生成一个数组 numpy.array(object, dtype=None, copy=True, order=‘K’, subok=False, ndmin=0):生成一个数组。数组内的数据可以是不同的数据类型
生成等间隔数组 np.arange(10) 在这里插入图片描述np.arange(0,10,2)在这里插入图片描述
reshape()改变数组形状 在这里插入图片描述
平均值 arr3.mean() arr3为提前创建的数组
求和 arr3.sum()
每列的和 arr3.sum(0)
数组转置 numpy.random.normal(loc = 0.0,scale = 1.0,size = None ):从正态分布中抽取随机样本生成一个数组。loc为分布的平均值,scale为标注差,size为数组形状。samples = np.random.normal(size=(2,2)) # numpy.ndarray.T:数组转置

常用数据类型
np.int32:整数,-2 31 至 2 32 -1
np.int64:整数,-2 63 至 2 63 - 1
np.float32:单精度浮点数:32位,正负号1位,指数8位,精度23位
np.float64:双精度浮点数:64位,正负号1位,指数11位,精度52位
np.string_:字符串
np.object_:python对象

pandas:
import pandas as pd
创建series:
1.通过pandas.series()创建:
pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False):生成一个Series数据。data为数据可以是数组和字典等;index为索引值,要求与数据长度相同,dtype为数据类型。
s = pd.Series([1,3,5,np.nan,6,8])
2.通过ndarray创建:
data = np.array([‘a’,‘b’,‘c’,‘d’])
s = pd.Series(data)
3.通过字典创建:
data1 = {‘a’ : 0., ‘b’ : 1., ‘c’ : 2.}
s = pd.Series(data1)
创建dataframe:
1.通过pandas.dataframe创建:
df = pd.DataFrame(np.random.randn(7,4), index=dates, columns=list(‘ABCD’))
pandas.DataFrame(data=None, index=None, columns=None, dtype=None,copy=False):生成一个DataFraem数据。data是数据,index是索引,columns是列名。
2.使用字典形式创建:
df=pd.DataFrame({‘A’:1,‘B’:2,‘C’:3})
loc方法:
根据列名对相关索引进行切片:
print(df2.loc[‘a’:‘f’:2,‘A’])#获取A列,索引为a到f中的数据 步长为2
reset_index还原索引:
b.reset_index(inplace=True)
inplace为true时会修改原始数据,为false会产生新的数据

发布了20 篇原创文章 · 获赞 23 · 访问量 988

猜你喜欢

转载自blog.csdn.net/surijing/article/details/104616789