Pandas是Python中最常用的第三方数据分析库,它主要提供了两种实用的数据类型与一些与之相关的数据分析函数。
Pandas中的Series类型
Series类型是一维带标签的数组
Series的创建
通过list创建Series
import pandas as pd
a=pd.Series([9, 8, 7, 6])
可以看到,Series类型的a实际是一个二维的ndarray(dtype=int64,是ndarray的数据类型)。之所以a是一个ndarray,是因为pandas底层由NumPy实现。
此外,也可以不使用自动索引
import pandas as pd
pd.Series([9, 8, 7, 6],index=['a',2,'c','d'])
从标量值创建Series
扫描二维码关注公众号,回复:
8857118 查看本文章
import pandas as pd
pd.Series(25,index=['a',2,'c','d'])
在这种情况下,数组的长度由index的长度确定
由字典类型创建Series
import pandas as pd
pd.Series({5:7,'b':8,'String':9})
下面这个例子由index实现了对Series形状的定义
由ndarray创建Series
import pandas as pd
import numpy as np
pd.Series(np.arange(5,1,-1))
Series的基本操作
分别获取Series的index与values
通过index获取values
a[0]的索引方式是自动索引
a['b']的索引方式是自定义索引
但如果创建Series时使用的自定义索引中含有int类型的数据,则不能使用自动索引
Series有许多与字典类型相似的特性
Series类型的相加
相同索引值的元素相加
Series的列名
Series中还有一种更常见的数据类型--DataFrame,参考如下文章
https://www.cnblogs.com/IvyWong/p/9203981.html
(其实是懒得写了)