Pandas库的简介与Series类型

Pandas是Python中最常用的第三方数据分析库,它主要提供了两种实用的数据类型与一些与之相关的数据分析函数


Pandas中的Series类型

Series类型是一维带标签的数组

 

Series的创建

通过list创建Series

import pandas as pd


a=pd.Series([9, 8, 7, 6])

可以看到,Series类型的a实际是一个二维的ndarray(dtype=int64,是ndarray的数据类型)。之所以a是一个ndarray,是因为pandas底层由NumPy实现。

此外,也可以不使用自动索引

import pandas as pd


pd.Series([9, 8, 7, 6],index=['a',2,'c','d'])

从标量值创建Series

扫描二维码关注公众号,回复: 8857118 查看本文章
import pandas as pd


pd.Series(25,index=['a',2,'c','d'])

 

在这种情况下,数组的长度由index的长度确定

由字典类型创建Series

import pandas as pd


pd.Series({5:7,'b':8,'String':9})

下面这个例子由index实现了对Series形状的定义

由ndarray创建Series

import pandas as pd
import numpy as np

pd.Series(np.arange(5,1,-1))

Series的基本操作

分别获取Series的index与values

 

通过index获取values 

 

a[0]的索引方式是自动索引

a['b']的索引方式是自定义索引

但如果创建Series时使用的自定义索引中含有int类型的数据,则不能使用自动索引

Series有许多与字典类型相似的特性

Series类型的相加

 相同索引值的元素相加

 

Series的列名 

Series中还有一种更常见的数据类型--DataFrame,参考如下文章

 https://www.cnblogs.com/IvyWong/p/9203981.html

(其实是懒得写了)

发布了28 篇原创文章 · 获赞 6 · 访问量 3805

猜你喜欢

转载自blog.csdn.net/qq_42138454/article/details/104083001
今日推荐