不同的图形的应用场景
折线图
- 显示数据的变化,趋势
- 如,温度随时间的变化
plt.plot(a,b)
条形图(柱状图)
- 显示数据之间的大小比较
- 如,电影院每天排片的所有电影的票房比较
plt.bar(a,b)
直方图
- 反应数据在不同的范围内的分布
- 如,一个班级里的身高在(1.6-1.65;1.65-1.7;1.7-1.75;1.75-1.8)这几个范围内的分布
plt.hist(a,10)
散点图
- 表现数据的分布状态,可从状态中寻找分布模式
- 如,一个城市某两个月每天的气温数据,想要知道这两个月的气温与时间有什么关系
plt.sccatter(a,b)
饼状图
- 各个部分占整体的百分比
- 如,电影院当天电影票房中,每个电影贡献的百分比
plt.pie(data, labels)
matplotlib使用流程总结
- 明确问题
- 选择图形的呈现方式
- 准备
- 绘图和图形完善
matplotlib使用总结
- 应该选择哪种图形来呈现数据
- 折线图:plt.plot(x,y)
- 柱状图:plt.bar(x,y)
- 直方图:plt.hist(data, bins, normed)
- 饼状图:Plt.pie(x,labels, autopct, colors)
- 散点图:Plt.scatter(x,y)
- 数轴的设置:xticks,yticks
- 数据及表格的描述内容:xlabel,ylabel,title
- 设置图标大小,保存图片:figure,savefig
Numpy
- 什么是Numpy
- 为什么是Numpy
- Numpy的核心
- 基本操作
- 分析案例
什么是Numpy
- 是一种负责数据运算的基础库
- 是一种强大的N维数组对象
- 是众多机器学习框架的基础库
为什么选择Numpy
- 其实python也可以进行数值运算,为什么要用Numpy
- 因为快
- 1.python有GIL,Numpy是真正意义的多任务
- 2.python读写的数据是在持久化存储上的不连续数据,Numpy是在内存上的连续存储
Numpy的核心
- ndarray(N-dimensional array),N维数组
ndarray的核心是
- 数据类型,形状,轴(维数)
二维数组(矩阵)
三维数组
基本操作
创建
# 导入numpy模块 import numpy as np # 一维数组 a1 = np.array([1,2,3,4]) # 二维数组 a2 = np.array([[11,22],[33,44]]) # 三维数组 a3 = np.array([[[11,22],[33,44]],[[55,66],[77,88]]])
查看数组的形状和类型
- 查看形状:
a.shape
- 查看类型:
a.dtype
- 查看形状:
创建等差,等比数列
- 创建等差数列:
np.linespace(0,10,11)
- 创建等比数列:
np.logspace(0,2,2)
- 创建等差数列:
示例
- 生成500个股票两年的交易涨幅数据
stock = np.random.normal(0,1(500,252*2))