AI面试题④--什么是数据不平衡，如何解决 - 代码天地

AI面试题④--什么是数据不平衡，如何解决

其他 2021-03-03 09:29:33 阅读次数: 0

1. 什么是数据不平衡

数据不平衡主要指的是在有监督机器学习任务中，样本标签值的分布不均匀。这将使得模型更倾向于将结果预测为样本标签分布较多的值，从而使得少数样本的预测性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。

2. 解决方法

重新采样训练集
1）欠采样：通过减少丰富类的大小来平衡数据集。
2）过采样：增加稀有样本，通过使用重复，自举或合成少数类等方法。
设计使用不平衡数据集的模型
1）在代价函数中增大对稀有类别分类错误的惩罚权重（例如Focal Loss）。

猜你喜欢

转载自blog.csdn.net/Roaddd/article/details/113967057

AI面试题④--什么是数据不平衡，如何解决

[一起面试AI]NO.10 什么是数据不平衡问题，应该如何解决

如何解决数据不平衡问题

如何解决样本不平衡问题？

如何解决机器学习中的数据不平衡问题

如何解决机器学习中数据不平衡问题

机器学习中如何解决数据不平衡问题？

如何解决数据类别不平衡问题（Data with Imbalanced Class）

机器学习面试—数据不平衡

你如何看待不平衡数据

数据不平衡

工作太辛苦？收支不平衡？这些问题如何解决？我认为......

电网为什么会出现三相不平衡？会产生什么危害？如何解决？——安科瑞杨澜

BAT机器学习特征工程工作经验总结(一)如何解决数据不平衡问题（附python代码）

不平衡数据分类

处理数据不平衡

数据不平衡问题

机器学习中如何处理不平衡数据？

机器学习中如何处理不平衡数据

如何处理数据不平衡问题？

lightgbm和xgb如何处理不平衡数据的

推荐系统 --对数据不平衡的解决

【机器学习】解决数据不平衡问题

Spark ML LR 用 setWeightCol 解决数据不平衡

使用分类权重解决数据不平衡的问题

使用分类权重，轻松解决数据不平衡的问题

标签不平衡及解决方法

数据不平衡imblearn算法汇总

用R处理不平衡的数据

数据不平衡问题总结

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)