Python 适用于数据处理与分析的显著特点,是其具有大量的标准模块、附加模块以及函数,可以非常方便地完成一般的数据处理与分析操作。内建库和标准库中的模块和函数是Python 的标准配置,所以只要你下载并安装了Python,就可以立即使用这些内建的模块和函数。
一、《Python数据处理》
这本资料采用基于项目的方法,介绍用Python 完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括:Python 基础知识,如何从CSV、Excel、XML、JSON 和PDF 文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和API 中提取数据。
全书共计12个章节,403页内容。
第1章Python 简介
第2章Python 基础
第3章供机器读取的数据
第4章处理Excel 文件
第5章处理PDF 文件,以及用Python 解决问题
第6章数据获取与存储
第7章数据清洗:研究、匹配与格式化
第8章数据清洗:标准化和脚本化
第9章数据探索和分析
第10章展示数据
第11章网页抓取:获取并存储网络数据
第12章高级网页抓取:屏幕抓取器与爬虫
第13章应用编程接口
第14章自动化和规模化
第15章结论
领取方式见文末
二、《 Python数据分析基础 》
本书展示如何用Python 程序将不同格式的数据处理和分析任务规模化和自动化。主要内容包括:Python 基础知识介绍、CSV 文件和Excel 文件读写、数据库的操作、示例程序演示、图表的创建,等等。
本书要讨论和使用的附加模块如下所示。
• xlrd 和xlwt
功能:解析与读写Microsoft Excel 工作簿。
• mysqlclient/MySQL-python/MySQLdb
功能:连接MySQL 数据库,在数据库表上运行查询。
• pandas
功能:读取各种类型的文件;管理、筛选和转换数据;聚合数据并计算基本统计量;创建各种类型的统计图表。
• statsmodels
功能:估计各种统计模型,包括线性回归模型、广义线性模型和分类模型。
• scikit-learn
功能:估计机器学习统计模型,包括回归、分类和聚类,以及执行数据处理、维度归约和交叉验证。
全书共计9大章节,近300页内容
第一章:Python基础
第二章:CSV文件
第三章:Excel文件
第四章:数据库
第五章:应用程序
第六章:图与图表
第七章:描述性统计与建模
第八章:按计划自动运行脚本
第九章:从这里启航
内容较多,就不做一一展示了
资料都带索引,方便阅读,两本书有各有长处,相辅相成!