python数据分析之pandas(4)函数和映射运算

函数映射、运算操作等是pandas中非常用且重要的操作

1. numpy通用函数pandas

pandas是以numpy为基础进行扩展的,所以numpy的很多函数可以直接使用

>>> frame = pd.DataFrame([1,2,3])
>>> np.square(frame)
   0
0  1
1  4
2  9

2. apply函数

可以自定义函数,按行或者列进行操作

>>> frame = pd.DataFrame(np.arange(6).reshape(3,2))
>>> frame
   0  1
0  0  1
1  2  3
2  4  5
>>>

注意:因为没有定义index和coulnns,所以默认为0,1,2数字下标

这里我们定义一个f(x) = x.max()的函数

>>> def f(x):
...   return x.max()
...
>>> frame.apply(f)
0    4
1    5
dtype: int64
>>>

如果想应用到行而不是列,需要将axis选项设置为1

>>> frame.apply(f, axis=1)
0    1
1    3
2    5
dtype: int64

3.统计函数

frame.sum() //按列求和

frame.mean() //均值

frame.describe() //多个统计量

4. 和series之间的运算

需要让series和DataFrame的列名保持一致

5. 算术运算

建议使用add() sub() div() mul()等方法

发布了127 篇原创文章 · 获赞 10 · 访问量 24万+

猜你喜欢

转载自blog.csdn.net/u012599545/article/details/104271760