Pandas 01

版权声明: https://blog.csdn.net/qq_40794602/article/details/84628450

Series的创建和基本使用:

import pandas as pd
#第一种创建方法,index可以不指定,默认为递增的阿拉伯数字
t = pd.Series([2, 3, 4, 5, 6, 7, 2], index=list("abcdefg"))
print(t)
#第二种,通过字典来创建
t1 = pd.Series({'a': 2,'b': 3, 'c': 5 })
print(t1)

print(t.index)  #获取索引值
print(t.values) #获取值
#pands同样有clip,where,等等和Numpy类似

#pd.read_...这种方法可以读取很多文件和数据库

 DataFrame的创建:

import pandas as pd

#创建dataframe数组
import pandas as pd
import numpy as np

t1 = pd.DataFrame(np.arange(12).reshape(3,4))
print(t1)

t2 = {'name':['小明','小红'],'age':[12,34],'tel':[1234,5678]}
t2 = pd.DataFrame(t2)
print(t2)

t3 = [{'name':'luo','age':12,'tel':1234},{'age':34,'tel':2345},{'name':'jian','tel':976}]
t3 = pd.DataFrame(t3)
print(t3)
import pandas as pd
import numpy as np
t1 = pd.DataFrame(np.arange(12).reshape(3,4),index=['a','b','c'], columns=['x','y','z','z'])
print(t1)

 DataFrame常用方法:

方法 解释
df.shape 行数,列数
df.dtype 列数据类型
df.ndim 数据维度
df.index 行索引
df.columns 列索引
df.values 对象值,二维ndarray数组
df.head(3) 显示头几行,默认5行
df.tail(3) 显示末尾几行,默认5行
df.info() 相关信息概览,行数,列数,列索引,列非空值个数,列类型,内存占用
df.describe() 快速综合统计结果,计数,均值,标准差,最大值,四位数,最小值

常用方法补充:

  • df.sort_values()  排序
  • df.loc()  通过标签索引行数据
  • df.iloc()  通过位置索引行数据
  • DataFrame可以进行布尔索引

猜你喜欢

转载自blog.csdn.net/qq_40794602/article/details/84628450
今日推荐