处理数据极度不均衡的数据集

编程语言 2018-04-22 11:52:38 阅读次数: 3

num = 0
print("len(y_train_df):\n",len(y_train_df))
for i in range(len(y_train_df)):
    if y_train_df[i] == 1:
        num = num + 1

print("{}{}".format("y_train_df中0的个数是：",num))

显示的结果为：
len(y_train_df):
709903
y_train_df中0的个数是：3293

3293/709903 = 0.00464

平安极客挑战赛的训练集真的无解，看了一早上大概知道几个专业名词，SMOTE + KNN，欠采样，过采样。

在数据分类很不平衡的情况下，基本的精确率，均方差等都是有数据欺骗的。

要用召回率，F值来判定模型的可靠性。

然后发现了sklearn库可以pip安装额外的包 imbalance-learn，这个能解决问题，不需要深究的库函数

http://contrib.scikit-learn.org/imbalanced-learn/stable/over_sampling.html

按照教程极客成功安装，后续看我做的程度了。

希望召回率能不是0，加油！

猜你喜欢

转载自blog.csdn.net/Chasing_Shadows/article/details/80037551

处理数据极度不均衡的数据集

图像分割中的loss--处理数据极度不均衡的状况

数据集不均衡问题

分类中的训练数据集不均衡问题处理

在深度学习中处理不均衡数据集

处理不均衡的数据（imbalanced data）

不均衡数据处理方法

处理不均衡数据 (Imbalanced data)

如何处理不均衡数据

干货|如何处理不均衡数据？

kaggle实战：极度不均衡的信用卡数据分析

数据不均衡问题

如何处理分类中的训练数据集不均衡问题

你对抗机器学习数据集里的不均衡数据

【深度好文】Pytorch不均衡数据集采样器

Hdfs的数据磁盘大小不均衡如何处理

处理不均衡数据（Dealing with imbalanced data）简洁版

机器学习中对不均衡数据的处理方法

SMOTE过采样处理不均衡数据（imbalanced data）

过采样和欠采样（数据不均衡处理）

数据不均衡问题的解决

采样方法-数据不均衡

从loss处理图像分割中类别极度不均衡的状况---keras

机器学习数据不均衡问题（转载）

不均衡数据过采样实验对比

类间数据量不均衡

数据分布不均衡导致性能问题

在分类中如何处理训练集不均衡问题

[概念]医学图像分割中常用的Loss function(损失函数) + 从loss处理图像分割中类别极度不均衡

小白都理解的人工智能系列（14）——如何处理不均衡数据

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)