深度学习理论——P-R曲线&原始数据类别不平衡问题 - 代码天地

深度学习理论——P-R曲线&原始数据类别不平衡问题

编程语言 2018-07-04 19:30:59 阅读次数: 0

大家好，继续理论学习日记。本次简要介绍一些基本概念，不涉及公式推导。

1.P-R曲线

首先介绍四个概念

精度：分类正确的样本数/样本总数

错误率：分类错误的样本数/样本总数

查准率P：TP/(TP + FP) 判对的正例样本数/判为正例的总样本数

查全率R：TP/(TP + FN) 判对的正例样本数/真实为正例的总样本数

P-R曲线就是以查准率为纵轴，查全率为横轴得到的可以反映模型分类性能的曲线。我们可以粗略地认为曲线包裹的面积越大其预测性能越好。

2.原始数据类别不平衡问题

类别不平衡指的是原始数据中正例和反例的数量差距过大，一般有三个解决办法（假设正例少，反例多的情况下）。

(1)对正例进行过采样：注意不能简单地对样本进行重复采样，会造成过拟合，一般是对正例进行插值，旋转来产生额外的正例

(2)对反例进行欠采样：注意不能一味地随机丢弃反例，这样做可能会丢失一些重要信息，一般的做法是采用集成学习的思想，将反例划分为若干个集合供不同的学习器学习，这样针对每个学习器来说都对反例进行了欠采样但整体反例的信息并没有丢失。

(3)正例反例再缩放：假设分类时是正例的几率为y，是反例的几率为1 - y，数据中正例的数目为(m+)，反例的数目为(m-)，则在阈值为0.5的情况下，一般y/(1 - y)>1我们判断为正例，加上正例反例的比例再缩放后就变成(y*(m-))/((1 - y)*(m+))>1为正例。也可以将m+表示为正例误判为反例的代价，m-表示为反例误判为正例的代价，转化为代价敏感问题。

主要是平时大概了解的一些概念，现在清楚地总结一下，给自己mark，我们下期见！

猜你喜欢

转载自blog.csdn.net/Miss_yuki/article/details/80894372

深度学习理论——P-R曲线&原始数据类别不平衡问题

机器学习-类别不平衡问题

类别不平衡问题

机器学习之类别不平衡问题 —— ROC和PR曲线

机器学习之类别不平衡问题 (2) —— ROC和PR曲线

（深度学习）类别不平衡数据集中IOU和mIOU的选择

[DataAnalysis]机器学习算法——类别不平衡问题

机器学习中的类别不平衡问题

机器学习之类别不平衡问题 —— 采样方法

pytorch处理类别不平衡问题

分类中类别不平衡问题

分类类别不平衡问题

详解类别不平衡问题

数据不平衡问题

机器学习和深度学习中如何处理数据不平衡问题

用R处理不平衡的数据

Tensorflow2.x：类别不平衡数据的处理（bias偏置、类别加权、过采样、评价曲线）

深度学习中数据集分布不平衡问题的解决方法

[深度学习] 不平衡样本的处理

P-R曲线

机器学习中的训练数据不平衡问题

机器学习中数据不平衡问题

【机器学习】解决数据不平衡问题

长尾问题数据不平衡学习笔记

分类中解决类别不平衡问题

（转）如何处理类别不平衡的问题

类别不平衡问题和Softmax回归

Python imblearn 解决类别不平衡问题

类别样本不平衡问题

【目标检测——OHEM 解读】处理类别不平衡问题

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)