版权声明: https://blog.csdn.net/qq_40794602/article/details/84628450
Series的创建和基本使用:
import pandas as pd #第一种创建方法,index可以不指定,默认为递增的阿拉伯数字 t = pd.Series([2, 3, 4, 5, 6, 7, 2], index=list("abcdefg")) print(t) #第二种,通过字典来创建 t1 = pd.Series({'a': 2,'b': 3, 'c': 5 }) print(t1) print(t.index) #获取索引值 print(t.values) #获取值 #pands同样有clip,where,等等和Numpy类似 #pd.read_...这种方法可以读取很多文件和数据库
DataFrame的创建:
import pandas as pd #创建dataframe数组 import pandas as pd import numpy as np t1 = pd.DataFrame(np.arange(12).reshape(3,4)) print(t1) t2 = {'name':['小明','小红'],'age':[12,34],'tel':[1234,5678]} t2 = pd.DataFrame(t2) print(t2) t3 = [{'name':'luo','age':12,'tel':1234},{'age':34,'tel':2345},{'name':'jian','tel':976}] t3 = pd.DataFrame(t3) print(t3)
import pandas as pd import numpy as np t1 = pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'], columns=['x','y','z','z']) print(t1)
DataFrame常用方法:
方法 | 解释 |
df.shape | 行数,列数 |
df.dtype | 列数据类型 |
df.ndim | 数据维度 |
df.index | 行索引 |
df.columns | 列索引 |
df.values | 对象值,二维ndarray数组 |
df.head(3) | 显示头几行,默认5行 |
df.tail(3) | 显示末尾几行,默认5行 |
df.info() | 相关信息概览,行数,列数,列索引,列非空值个数,列类型,内存占用 |
df.describe() | 快速综合统计结果,计数,均值,标准差,最大值,四位数,最小值 |
常用方法补充:
- df.sort_values() 排序
- df.loc() 通过标签索引行数据
- df.iloc() 通过位置索引行数据
- DataFrame可以进行布尔索引