【动手学深度学习】关于数据预处理——2.2.5练习 2023.7.12 - 代码天地

【动手学深度学习】关于数据预处理——2.2.5练习 2023.7.12

企业开发 2024-11-04 19:22:52 阅读次数: 0

创建包含更多行和列的原始数据集

import torch

import os

os.makedirs(os.path.join('..','data'),exist_ok=True)

data_file = os.path.join('..','data','nba_data.csv')

with open(data_file,'w') as f:
    f.write('Points,Rebound,Assist,Steal,Blocks,Turnovers\n')
    f.write('81,10,10,1,2,NA\n')
    f.write('NA,NA,12,3,NA,5\n')
    f.write('20,NA,NA,2,NA,2\n')
    f.write('100,NA,2,NA,2,NA\n')
    f.write('30,2,8,2,NA,5\n')

import pandas as pd

data = pd.read_csv(data_file)

1. 删除缺失值最多的列

法1：

data.isnull().sum()
#查询各个列的缺失值个数

data.isnull().sum().idxmax()
#idxmax()函数返回请求轴上第一次出现最大值的索引名

data.drop(data.isnull().sum().idxmax(),axis=1)
#drop()函数删除最大缺失值个数的列

法2：

#定义drop_col删除列函数
def drop_col(m):
    
    num = m.isna().sum()
    #获得缺失值统计信息
    
    num_dict = num.to_dict()
    #转为字典
    
    max_key = max(num_dict,key=num_dict.get)
    #取字典中最大值的键
    
    del m[max_key]
    #删除缺失值最多的列
    
return m

drop_col(data)
#调用drop_col函数删除缺失值最多的列

2. 将预处理的数据集转为张量格式

output = data.drop(data.isnull().sum().idxmax(),axis=1)
#定义output存储法1中删除缺失值最多的列后的数据集


x = torch.tensor(output.values)
#将数据集转换为张量格式

参考b站教程：《动手学深度学习 v2 - 从零开始介绍深度学习算法和代码实现》

课程主页：https://courses.d2l.ai/zh-v2/

教材：https://zh-v2.d2l.ai/

猜你喜欢

转载自blog.csdn.net/WS_Change/article/details/131679321

【动手学深度学习】关于数据预处理——2.2.5练习 2023.7.12

【ConfluxNews】2023.7.12 信息安全无小事

动手学深度学习——数据预处理

《动手学深度学习》系列笔记 —— 文本预处理

动手学深度学习——文本预处理

动手学深度学习8.2 简单的文本预处理

【动手学深度学习】文本预处理

04 数据操作 + 数据预处理【动手学深度学习v2】

动手学深度学习01（数据操作+数据预处理）

李沐动手学深度学习：04 数据操作+数据预处理

动手学深度学习v2—01数据操作+数据预处理

4. 【动手学深度学习v2】数据操作 + 数据预处理

【深入浅出学习笔记】李沐《动手学深度学习2.0》之数据预处理学习

【动手学深度学习v2】第二章预备知识-2.2 数据预处理

序列模型 sequence model 文本预处理动手学深度学习v2

动手学机器学习——数据预处理&线性代数

动手学深度学习-数据操作

ElitesAI·动手学深度学习PyTorch版学习笔记-文本预处理；语言模型；循环神经网络基础

《动手学深度学习》笔记 Task02：文本预处理；语言模型；循环神经网络基础

李沐动手学深度学习V2-NLP文本预处理和代码实现

【李沐-动手深度学习v2】笔记整理-04数据操作+数据预处理

MXnet动手学深度学习-数据操作

动手学深度学习之数据增强、模型微调

《动手学深度学习》 pytorch版-数据操作

动手学深度学习Pytorch——数据操作

动手学深度学习Task01-Task02:线性回归；Softmax与分类模型；多层感知机；文本预处理；语言模型；循环神经网络

动手深度学习 task2(文本预处理+语言模型+循环神经网络）

动手学pytorch-文本预处理

[深度学习] 数据预处理

[ 深度学习 ] —— 数据：预处理

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

集成学习——LightGBM原理理解

java复制pdf并且往pdf文件中添加内容

DRF的解析器和渲染器 DRF的解析器和渲染器

pytest以函数形式的测试用例

CSS3 边框

C语言编程经典案例，三种方法求水仙花数（附完整代码）

算法题（313）

css如何让背景透明，文字不透明

linux下网络程序遭遇SIGPIPE的解决（转）

用xposed Hook框架Hook 安卓apk的按钮Id

每日归档

更多

2025-04-13(999)

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)