数据前处理---dplyr包 - 代码天地

数据前处理---dplyr包

其他 2018-11-05 22:46:49 阅读次数: 0

用dplyr 包处理数据时，要先将数据转化成tbl_df 的tibble类型的数据。
可以直接用dplyr自带的tbl_df函数 tbl_df(data)
select: 选择操作
select(data,a,b,c)
select(data,a:c)
select(data,-a,-c)
select(data,-(a:c))

filter:类似SQL的where语句条件选择操作
filter(data,a==1,b==2)
filter(data,a==1&b==2)
filter(data,a==1&(b==2|b==3))

arrange:函数按给定的列名排序，默认升序，也可以用desc()降序
arrange(data,a) 升序
arrange(data,desc(a)) 降序

mutate: 变量变换、重新构造
mutate(data,y = a-b,z = a*0.6)#在data数据后加上y,z 字段

summarize:数据汇总
summarize(data,avg_a = mean(a),sum_b = sum(b))

group_by : 数据进行分组# 结合summarize 可以对数据进行分组汇总统计
summarize(group_by(data,a),
m = mean(b),
sd = sd(c),
…)

dplyr包中引进了一种操作符 %>% 称为管道函数
使用时用数据集(data)作为开头，
data %>% select(a,b,c) %>% filter(a==1&b==1&(c==2|c==3)) %>% group_by(c) %>% summarize(m=mean(a),sd=sd(b)) %>% arrange(sd)

挑选随机样本
1： sample_n 随机挑出指定个数
sample_n(data,10)# 挑10个
2：sample_frac(data,0.1)# 随机挑选10% 的数据

猜你喜欢

转载自blog.csdn.net/cutwind/article/details/78186280

数据前处理---dplyr包

R语言dplyr包：高效数据处理函数（filter、group_by、mutate、summarise）

dplyr包之实用总结之列选择及处理技巧

R语言dplyr包实用数据处理arrange、sample_n、n_distinct、select、compute等

利用R语言的dplyr包进行数据转换

tidyverse —— dplyr包

基础004：R语言数据处理和变换——dplyr

dplyr包30个实例

R必学包之dplyr

R语言之 dplyr 包

R语言tidyr包数据变换函数（dplyr包最佳拍档）

【R语言】必学包之dplyr包

R语言|dplyr()函数（一） ———R语言数据处理系列(一)

dplyr包实用总结之mutate系列

R语言dplyr包实操

R----dplyr包介绍学习

数据包前送

[学习分享] R语言扩展包dplyr笔记（转载）

机器学习-Pandas 数据的前处理

C++前处理图片数据

dplyr-高效的数据变换与整理工具--转载

R语言dplyr-高效的数据变换与整理工具

使用dplyr进行数据操作（30个实例）

数据清洗整理基本操作（R：dplyr、tidyr、lubridate）

数据处理的R包

R语言dplyr处理dataframe：使用mutate函数生成新的列、recode函数进行数据编码、rename函数重命名字段、arrange排序数据列、select筛选数据、filter过滤数据

.点. dplyr

weka分类前数据格式如何处理

多项式拟合模型前对数据的预处理

Django搭建博客（四）：渲染前数据的处理

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)