数据分析学习线路图
1、matplotlib 折线图
matplotlib: 最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建。其优点在于:
- 能将数据进行可视化,更直观的呈现
- 使数据更加客观、更具说服力
1.1 一个例子
假设一天中每隔两个小时(range(2,26,2))的气温(℃)分别是[15,13,14.5,17,20,25,26,26,27,22,18,15]
结果输出:
但是目前存在以下几个问题:
- 设置图片大小(想要一个高清无码大图)
- 保存到本地
- 描述信息,比如x轴和y轴表示什么,这个图表示什么
- 调整x或者y的刻度的间距
- 线条的样式(比如颜色,透明度等)
- 标记出特殊的点(比如告诉别人最高点和最低点在哪里)
- 给图片添加一个水印(防伪,防止盗用)
问题一、问题二
from matplotlib import pyplot as plt
fig = plt.figure(figsize=(20, 8), dpi=80)
# figure 是指图形图标的意思,在这里指得就是我们的图
# 通过实例化一个figure并且传递参数,能够在后台自动使用figure实例
# 在图像模糊的时候,可以传入dpi值,使图像更加清晰
x = range(2, 26, 2)
y = [15, 13, 14, 5, 17, 20, 25, 26, 27, 22, 18, 15]
plt.plot(x, y)
plt.savefig("./sig_size.png") # 保存图片
plt.show()
输出:
问题四 设置X的刻度
from matplotlib import pyplot as plt
fig = plt.figure(figsize=(20, 8), dpi=80)
# figure 是指图形图标的意思,在这里指得就是我们的图
# 通过实例化一个figure并且传递参数,能够在后台自动使用figure实例
# 在图像模糊的时候,可以传入dpi值,使图像更加清晰
x = range(2, 26, 2)
y = [15, 13, 14, 5, 17, 20, 25, 26, 27, 22, 18, 15]
plt.plot(x, y)
# 设置X的刻度
# plt.xticks(x) # 步长2
# plt.xticks(range(2, 26)) # 步长1
# plt.xticks(range(2, 26, 0.5)) # 步长0.5
plt.xticks(x[::2]) # 当刻度太密集时,使用列表的步长来解决,matplotlib会自动帮我们对应
plt.savefig("./sig_size.png") # 保存图片
plt.show()
输出:
问题四
如果列表a表示10点到12点的每一分钟的气温,如何绘制折线图观察每分钟气温的变化情况? a= [random.randint(20,35) for i in range(120)] 那么问题来了:如何修改matplotlib的默认字体?
# coding=utf-8
from matplotlib import pyplot as plt
import random
import matplotlib
from matplotlib import font_manager
# windws和linux设置字体的放
font = {
'family': 'MicroSoft YaHei',
'weight': 'bold',
'size': 'larger'}
# matplotlib.rc("font", **font)
matplotlib.rc("font", family='MicroSoft YaHei', weight="bold")
# 另外一种设置字体的方式
# my_font = font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")
x = range(0, 120)
y = [random.randint(20, 35) for i in range(120)]
plt.figure(figsize=(20, 8), dpi=80)
plt.plot(x, y)
# 调整x轴的刻度
_xtick_labels = ["10点{}分".format(i) for i in range(60)]
_xtick_labels += ["11点{}分".format(i) for i in range(60)]
# 取步长,数字和字符串一一对应,数据的长度一样
plt.xticks(list(x)[::3], _xtick_labels[::3], rotation=45) # rotaion旋转的度数
# 添加描述信息
# plt.xlabel("时间", fontproperties=my_font)
# plt.ylabel("温度 单位(℃)", fontproperties=my_font)
# plt.title("10点到12点每分钟的气温变化情况", fontproperties=my_font)
plt.show()
输出:
问题三、添加描述信息
# coding=utf-8
from matplotlib import pyplot as plt
import random
import matplotlib
from matplotlib import font_manager
# windws和linux设置字体的放
font = {
'family': 'MicroSoft YaHei',
'weight': 'bold',
'size': 'larger'}
my_font = matplotlib.rc("font", family='MicroSoft YaHei', weight="bold")
# 另外一种设置字体的方式
# my_font = font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")
x = range(0, 120)
y = [random.randint(20, 35) for i in range(120)]
plt.figure(figsize=(20, 8), dpi=80)
plt.plot(x, y)
# 调整x轴的刻度
_xtick_labels = ["10点{}分".format(i) for i in range(60)]
_xtick_labels += ["11点{}分".format(i) for i in range(60)]
# 取步长,数字和字符串一一对应,数据的长度一样
plt.xticks(list(x)[::3], _xtick_labels[::3], rotation=45, fontproperties=my_font) # rotaion旋转的度数
# 添加描述信息
plt.xlabel("时间", fontproperties=my_font)
plt.ylabel("温度 单位(℃)", fontproperties=my_font)
plt.title("10点到12点每分钟的气温变化情况", fontproperties=my_font)
plt.show()
输出
2、绘制多次图形
假设大家在30岁的时候,根据自己的实际情况,统计出来了你和你同桌各自从11岁到30岁每年交的女(男)朋友的数量如列表a和b,请在一个图中绘制出该数据的折线图,以便比较自己和同桌20年间的差异,同时分析每年交女(男)朋友的数量走势
a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]
- y轴表示个数
- x轴表示岁数,比如11岁,12岁等
# coding=utf-8
from matplotlib import pyplot as plt
import matplotlib
from matplotlib import font_manager
font = {
'family': 'MicroSoft YaHei',
'weight': 'bold',
'size': 'larger'}
my_font = matplotlib.rc("font", family='MicroSoft YaHei', weight="bold")
# my_font = font_manager.FontProperties(fname="/System/Library/Fonts/PingFang.ttc")
y_1 = [1, 0, 1, 1, 2, 4, 3, 2, 3, 4, 4, 5, 6, 5, 4, 3, 3, 1, 1, 1]
y_2 = [1, 0, 3, 1, 2, 2, 3, 3, 2, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1]
x = range(11, 31)
# 设置图形大小
plt.figure(figsize=(20, 8), dpi=80)
plt.plot(x, y_1, label="自己", color="#F08080")
plt.plot(x, y_2, label="同桌", color="#DB7093", linestyle="--")
# 设置x轴刻度
_xtick_labels = ["{}岁".format(i) for i in x]
plt.xticks(x, _xtick_labels, fontproperties=my_font)
# plt.yticks(range(0,9))
# 绘制网格
# 绘制网格,alpha是网格透明度,网格的线的疏密程度是根据坐标轴来的
plt.grid(alpha=0.4, linestyle=':')
# 添加图例
plt.legend(prop=my_font, loc="upper left") # 设置图例左上角显示
# 展示
plt.show()
输出显示
3、折线图小结与不同图形差异的介绍
- 绘制了折线图(plt.plot)
- 设置了图片的大小和分辨率(plt.figure)
- 实现了图片的保存(plt.savefig)
- 设置了xy轴上的刻度和字符串(xticks)
- 解决了刻度稀疏和密集的问题(xticks)
- 设置了标题,xy轴的lable(title,xlable,ylable)
- 设置了字体(font_manager. fontProperties,matplotlib.rc)
- 在一个图上绘制多个图形(plt多次plot即可)
- 为不同的图形添加图例