pandas 数据处理过程（入门）

其他 2020-04-04 19:26:03 阅读次数: 0

拉钩网数据分析（薪酬篇）：

import pymongo
import pandas as pd
import numpy as np

mongodb 连接或者读取csv格式文件

con = pymongo.MongoClient(‘localhost’)
db = con[‘数据库名’]
position = db[‘表名’]

df =pd.read_csv(‘路径’,encoding = ‘gbk’) 读取csv格式文件

转成DataFrame

data = pd.DataFrame(list(position.find()))

数据清洗函数：

import re
def salary_filer(i):
res =re.search(r’(\d+)[kK]-(\d+)[kK]’,i)
if res:
result = (int(res.group(1))+int(res.group(2)))/2
return result

用apply方法应用清洗函数到DataFrame：

salary =data[‘salary’]
salary =salary.apply(salary_filer)

检查清洗过的数据：

salary.isnull().sum() 是否有空值
salary.describe() 查看信息

分类：要从大到小分

def get_range(i):
if i>30:
return “30k以上”
。。。。。

同样是用apply把分类应用上：

salary = salary.apply(get_range)

用value_counts()方法统计数量

salary_pie =salary.value_counts()

调用百度pyecharts转成饼状图：

下面接口的代码，直接找到复制修改就可以

from pyecharts import Pie

attr = salary_pie.index
v1 =salary_pie.values
pie = Pie(“饼图示例”)
pie.add(“”, attr, v1, is_label_show=True)
pie.render()

醉梦者_一路行

发布了22 篇原创文章 · 获赞 5 · 访问量 4410

私信关注

猜你喜欢

转载自blog.csdn.net/HW0007/article/details/81460875

pandas 数据处理过程（入门）

pandas 数据处理

pandas数据处理

Pandas的数据处理

数据处理pandas

Pandas 数据处理入门

【Pandas】① Pandas 数据处理基础

数据处理库- pandas

【python】数据处理pandas

python数据处理pandas

Pandas缺失数据处理

pandas 的数据处理方法

pandas数据处理—1

pandas之数据处理

pandas 数据处理实例

Python———pandas数据处理

pandas 数据处理进阶

Pandas数据处理一

Pandas数据处理二

Pandas数据处理（一）

pandas 数据处理案例

Pandas——数据处理对象

Python——数据处理（pandas)

pandas数据处理--pivot

Pandas数据处理与分析

pandas数据处理进阶

Python数据处理库pandas入门教程

Python 数据处理库 pandas 入门教程

Python数据处理库pandas入门教程.

Pandas时序数据处理入门！

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)