【python】pandas按照某些行列的数据要求，在新的一列输出要求数据

其他 2020-01-26 12:21:34 阅读次数: 0

举例

在日常处理表格的时候，经常会遇到一些要求类似这样的：销售方面，按照A，B产品的销量额做标记；在考核方面，按照某些指标进行最后的评定等等

操作实例

这里就是以上面的表格数据为例，假设进行录取评定，要求选取语文分数大于80，数学和英语分数大于90分且专业课分数不低于120的人，操作过程代码和图形如下：

导入库和创建表格数据：

import pandas as pd

df = pd.DataFrame({
    '姓名':['张三','李四','王二','麻子'],
    '语文':[78,90,55,67],
    '数学':[86,95,45,78],
    '英语':[83,93,56,87],
    '专业课':[150,180,89,103]
})
df

创建“综合评定”数据列，并进行数据筛选：

df['综合评定'] = ''
df['综合评定'][(df['语文']>80) & (df['数学']>90) & (df['英语']>90) & (df['专业课']>120)] = '录取'
df

拓展延伸

运行代码过后可以发现，这种纯有逻辑符号连接的判断，虽然很容易理解，但是不具有泛化能力，且看上去很冗肿。为了方便代码的保存和调用，可以对代买进行优化并封装成函数，示例如下：

要求：选取2016年，北京和重庆的数据，并做标记，代码如下：

import numpy as np
import pandas as pd

data = {'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen', 'Hangzhou', 'Chongqing'],
'year': [2016,2016,2015,2017,2016, 2016],
'population': [2100, 2300, 1000, 700, 500, 500]}
frame = pd.DataFrame(data, columns = ['year', 'city', 'population'])

def function(a, b):
     if ('ing' in a) and (b == 2016):
        return 1
     else:
        return 0
print(frame, '\n')
frame['test'] = frame.apply(lambda x: function(x.city, x.year), axis = 1)
print(frame)

运行结果如下图：

发布了20 篇原创文章 · 获赞 4 · 访问量 1989

私信关注

猜你喜欢

转载自blog.csdn.net/lys_828/article/details/103715356

【python】pandas按照某些行列的数据要求，在新的一列输出要求数据

python将list中的数据输出在一列

pandas使用apply多列生成一列数据

python的pandas中如何在dataframe中插入一行或一列数据？

pandas对某一列数据进行处理

pandas对每一列数据进行标签编码

Python连接数据库，列表输出数据库中的某一列

python&pandas | 多进程处理dataframe通过某一列计算新列

python处理一个csv数据，根据其中一列数据来得到新一列写入同一个文件中

使用Python一分钟完成按照某一列将Excel数据由一个sheet拆分为多个sheet（使用pandas超简单）

pandas按照某一列的值排序按照多列的值排序

python按照某一列/指定列进行筛选

pandas 取出同时满足多个要求的数据（即按若干个列的组合条件筛选数据）

pandas 数据框将一列数据切割变为两列

pandas添加一行数据的方法&根据某一列的值修改某一列的值

使用Python中pandas按照某一列把一个Excel文件拆分为多个Excel文件

Python小点dian儿: Python-Pandas-DataFrame 如何把df变为以数据中的某一列为index

Pandas截取列部分字符，并据此修改另一列的数据

pandas 内置str函数，轻松拆分一列数据为多列

SQL按照某一列数据去重并显示整行信息

python pandas.read_csv()读取csv文件，第一列数据作为index(索引)的解决办法

Kettle 行列互换之——行转列（多列数据合并成一列变为多行） Kettle 系列随笔

python pandas将一列拆分为多列

excel大数据重采样批量操作（每两列中插入新一列，新一列为左右两列的平均值）

pandas 如何将一列列表数据展开成多行数据

python 取多维数据的某一列

Python操作Excel文件：插入一列数据

python读取excel/csv/的一列数据

在pandas中给dataframe添加一列或者一行数据

如何取pandas第一行，第一列的数据

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)