Pandas——数据可视化

1.前言

首先import我们需要用到的模块,除了 pandas,我们也需要使用 numpy 生成一些数据,这节里使用的 matplotlib 仅仅是用来 show 图片的, 即 plt.show()。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

2.Series可视化

这是一个线性的数据,我们随机生成1000个数据,Series 默认的 index 就是从0开始的整数,但是这里我显式赋值以便让大家看的更清楚

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = pd.Series(np.random.randn(100),index=np.arange(100))  # 随机生成1000个数据服从标准正太分布
data.cumsum()    # 为了方便观看效果, 我们累加这个数据
data.plot()    # pandas 数据可以直接观看其可视化形式
plt.show()

在这里插入图片描述
熟悉 matplotlib 的朋友知道如果需要plot一个数据,我们可以使用 plt.plot(x=, y=),把x,y的数据作为参数存进去,但是data本来就是一个数据,所以我们可以直接plot。

3.Dataframe 可视化

我们生成一个100*4 的DataFrame,并对他们累加

data = pd.DataFrame(np.random.randn(100,4),index=np.arange(100),columns=list("ABCD"))
data.cumsum()
print(data)
data.plot()
plt.show()

在这里插入图片描述
这个就是我们刚刚生成的4个column的数据,因为有4组数据,所以4组数据会分别plot出来。

4.画散点图

主要说一下 plot 和 scatter. 因为scatter只有x,y两个属性,我们我们就可以分别给x, y指定数据

ax = data.plot.scatter(x='A',y='B',color='DarkBlue',label='Class1')
# 将之下这个 data 画在上一个 ax 上面
data.plot.scatter(x='A',y='C',color='LightGreen',label='Class2',ax=ax)
plt.show()

在这里插入图片描述

发布了144 篇原创文章 · 获赞 388 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_37763870/article/details/104933227