Python读取表格文件做一个可视化图表

目录

前言

一、读取文件步骤:

1.1 pandas库安装

      方法一:安装Anaconda软件

        方法二:通过pip命令安装

1.2 pandas库的使用介绍

二、绘制可视化图表

三、读取文件加绘制简单图表详细代码

学习内容:

总结:


前言

        小白在入门Pythonon后,已经知道了python的一些基本类型和语法,今天来详解一下Python如何读取文件和绘制可视化图表

一、读取文件步骤:

    在Python中读取文件有很多标准库或者第三方库可以实现,常用的有:pandasNumpylxmlxmlxlwtopenpyxlopen等。

    其中:open 内置函数,下载好python后可以直接在编译器调用此函数;xml 编译是Python的标准库,也就是随着pyhon安装的时候默认自带的库。pandasNumpylxmlxlwtopenpyxl 属于第三方库是下载后安装到python的安装目录下的,不同的第三方库安装及使用方法不同。今天分享的读取文件用的就是  pandas 库。

1.1 pandas库安装

      方法一:安装Anaconda软件

        最一劳永逸的方法不是直接安装Pandas,而是安装集成了python编程过程常用到的多种第三方库的软件:Anaconda,它是一个跨平台(Linux,Mac OS X,Windows)的Python发行版,用于数据分析和科学计算。在运行安装程序之后,用户将可以访问Pandas和SciPyopen in new window工具包的任何工具,而不需要安装任何其他东西,也不需要等待任何软件编译,非常的方便。

        方法二:通过pip命令安装

        在 cmd 窗口输入命令: pip linstall pandas  即可

1.2 pandas库的使用介绍

        下载好pandas库后,首先在代码文件头部将其导入:导包命令都是:【import 包名 as 简化名称】  如图:

        在 as 后面可以加别名,这样可以用别名来调用该库的所有功能。下面简单介绍要用到的功能

        1、导入CSV或者xlsx文件:

df = pd.read_csv(r'name.csv')
df = pd.read_excel(r'name.xlsx'))

        2、查看导入的表格文件信息

df.info()

        3、查看表格对象的空值

df.isnull()  #如果是空则为 ture ,非空为 false

df['列名'].isnull().sum()  #统计指定列的空值个数

        4、对表格数据进行清洗

#删除表中空值所在行,并覆盖原表
df = df.dropna()  

#删除表中重复值所在行,默认保留第一行,并覆盖原表 
df['列名'] = df['列名'].pd.drop_duplicates()    


#将指定数替换掉表中空值,并覆盖原表 
df = df['年龄'].fillna(df['年龄'].mean())

        5、对表格数据分组聚合

#将表中数据按城市分组,并且统计各个城市的数量
df_gop = df.groupby('城市').count()

#将表中数据按城市分组后再按性别,并且统计各个性别的数量
df_gop = df.groupby(['城市','姓别'])['姓别'].count()

        6、对表格数据进行排序   

#按照表中某列数据进行排序
df = df.sort_values(by=['订单量'])

#按照索引进行排序
df = df.sort_index()

        7、对表格进行重置索引

df = df.reset_index()

        8、查找表格中特定要求的数据

# loc 方法  查找df表格里面订单数大于等于3的数据
df1 = df.loc[df['订单数'] >= 3:]

# iloc 方法  查找df表格里面第4列到8列的数据
df2 = df.iloc[4:9]

# query 方法  查找df表格中地址为天津和南京的数据
df_inner.query('地址 == ["天津", "南京"]')

二、绘制可视化图表

        由于python是开源语言,所以各种第三方库非常多,常用的绘制图表库有:pyecharts库、query库、plotly库、matplotlib库等

        Echarts是一个由百度开源的数据可视化工具,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而python是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上了数据可视化时,pyecharts诞生了。

        pyecharts分为v0.5和v1两个大版本,v0.5和v1两个版本不兼容,v1是一个全新的版本,因此我们的学习尽量都是基于v1版本演示绘制图表过程。

        语法格式如图:

三、读取文件加绘制简单图表详细代码

        每次绘图,需求不一样,代码也会有所不同,本博客仅供参考。这里我拿一个绘制某猫双十二销量前十饼图举例:

        题目:统计双12当天销量前十名的商品品类,画 商品品类 销量占比的 圆环图

        数据字段含义和部分数据图示:

最后看一下成品:


总结:

        今天的分享就到这里了,内容不深,面向小白。如果本博客对你有帮助,欢迎赞赏留言转发,希望大家能在自己喜欢的路上越走越远!

猜你喜欢

转载自blog.csdn.net/qq_51294997/article/details/131109581