数据分析之Pandas（三）基本数据操作 - 代码天地

数据分析之Pandas（三）基本数据操作

其他 2019-03-20 19:26:34 阅读次数: 0

版权声明：版权声明：笔者博客文章主要用来作为学习笔记使用，内容大部分来自于自互联网，并加以归档整理或修改，以方便学习查询使用，只有少许原创，如有侵权，请联系博主删除！ https://blog.csdn.net/qq_42642945/article/details/88634599

本章内容

索引操作
赋值操作
排序

DataFrame
Series

数据准备

首先，为了更好的理解这些基本操作，我们将读取一个真实的股票数据。关于文件操作，后面在介绍，这里只先用一下API
stock_day.csv文件下载链接：
链接：https://pan.baidu.com/s/1P8dfFl5FF64yfm1i6GGTuw
提取码：wbcs
在这里插入图片描述

#导入pandas模块
import pandas as pd
#读取csv数据文件
data = pd.read_csv('./stock_day.csv')
data.head()

在这里插入图片描述

#删除一些列，使得数据简单些，再去做后面的操作
data = data.drop(['ma5','ma10','ma20','v_ma5','v_ma10','v_ma20'],axis = 1)
data.head()

在这里插入图片描述

第一节索引操作

Numpy当中我们已经讲过使用索引选取序列和切片选择，pandas也支持类似的操作，也可以直接使用列名、行名称，甚至组合使用。
直接使用行列索引(先列后行)
data[‘open’] <-- 通过key来索引一个列
data.open <-- 通过属性的形式索引一个列，当列的名称是一个Python关键字时，不能用这种方法
添加class列：
在这里插入图片描述

直接使用行列索引(先列后行)

获取’2018-02-27’这天的’close’的结果
在这里插入图片描述

结合loc或者iloc使用索引

api 简介
loc: label-based location，基于标签的索引

data.loc[‘2018-02-23’, ‘close’] <-- 基于标签索引

iloc: integer-based location，基于行列数的索引

data.iloc[1, 0] <-- 索引第1行第0列

使用ix组合索引
ix能混合使用整数和标签型索引，但是已经过期，不建议使用
推荐使用loc/iloc配合的方式：
data.loc[data.index[:4], [‘open’, ‘high’, ‘low’, ‘close’]]

loc：

只能通过标签名来取数据
不能通过索引（第0行，第1行等）来取数据
取列数据也一样，要通过标签名，不能直接取行数据

iloc:

只能通过索引（第0行，第1行等）来取数据
使用标签名则发生错误
取列数据

ix:（不建议使用）（过期）
在这里插入图片描述
获取从’2018-02-27’:‘2018-02-22’，'open’的结果

获取行第1天到第4天，[‘open’, ‘close’, ‘high’, ‘low’]这个四个指标的结果

第二节赋值操作

可以对一整列整体赋值，也可以对选定的某个/某些单元格赋值，data.iloc[1:4, 1:4] = 1000
在这里插入图片描述
对DataFrame当中的close列进行重新赋值为2，3

直接修改原来的值
在这里插入图片描述

第三节排序

排序有两种形式，一种对内容进行排序，一种对索引进行排序

data.sort_index(), 按照行索引的值来排序，默认是升序排列,通过参数ascending=False可以设置为降序排列

data.sort_values()，按照DataFrame的值来排序,可以按照某一列或者某几个列来排序

DataFrame排序

使用df.sort_values(key=, ascending=)对内容进行排序
- 单个键或者多个键进行排序,默认升序
- ascending=False:降序
- ascending=True:升序

在这里插入图片描述

按照涨跌幅大小进行排序 , 使用ascending指定按照大小排序

按照多个键进行排序

使用df.sort_index对索引进行排序

这个股票的日期索引原来是从大到小，现在重新排序，从小到大
在这里插入图片描述
Series排序

使用series.sort_values(ascending=True)对内容进行排序
series排序时，只有一列，不需要参数
使用series.sort_index()对索引进行排序
与df一致,对索引进行排序

版权声明：
笔者博客文章主要用来作为学习笔记使用，内容大部分整理自互联网，如有侵权，请联系博主删除！

猜你喜欢

转载自blog.csdn.net/qq_42642945/article/details/88634599

数据分析之Pandas（三）基本数据操作

Python数据分析之pandas基本数据结构：Series、DataFrame

【python数据分析】pandas基本操作

pandas基本数据操作

数据分析之 pandas的拼接操作

使用pandas进行数据分析-pandas库介绍之DataFrame基本操作

Pandas文本数据分析

数据分析之NumPy（三）基本操作

Pandas数据分析：处理文本数据(str/object)各类操作+代码一文详解(三)

Pandas数据分析 (三)

pandas数据分析（三）

【数据分析】pandas (三)

Python数据分析库pandas基本操作

数据分析之DataFrame基本操作

数据分析之matplotlib基本操作

数据分析之Series基本操作

数据分析之numpy基本操作

数据分析之pandas

用python做数据分析pandas库介绍之DataFrame基本操作

python做数据分析pandas库介绍之DataFrame基本操作

用python做数据分析4|pandas库介绍之DataFrame基本操作

python-pandas基本数据操作

pandas基本数据对象及操作

数据分析之pandas基本使用(DataFrame系列)

Python数据分析之Pandas库的基本使用

数据分析之Pandas合并操作总结

Python数据分析之 Pandas Dataframe分组与聚合操作

数据分析三剑客之pandas

python数据分析之pandas（三）Index

数据分析--pandas的基本使用

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)