Dice Loss for Data-imbalanced NLP Tasks (Dice Loss，替代cross entropy(CE)处理数据不平衡问题) - 代码天地

Dice Loss for Data-imbalanced NLP Tasks (Dice Loss，替代cross entropy(CE)处理数据不平衡问题)

企业开发 2023-07-11 21:24:15 阅读次数: 0

https://github.com/ShannonAI/dice_loss_for_NLP

通过定义Dice Loss，替代cross entropy(CE)处理数据不平衡问题。

问题
在样本不平衡的情况中，主要有以下两种难以克服的难点
the training-test discrepancy: 如果不能很好的平衡样本标签，那么模型学习过程通常会朝着有更多标签的类别收敛。
the overwhelming effect of easy-negative examples: 如果容易判别的负样本太多，那么模型很难学习到真正区分正样本与负样本的边界，很难捕捉到特征。

方法

交叉熵

权重交叉熵

损失函数

实验

Part-of-Speech Tagging
Named Entity Recognition
Machine Reading Comprehension
Paraphrase Identification

不均衡数据集

实验结果

实验结果太多了，请大家参照原文吧

https://arxiv.org/abs/1911.02855

https://arxiv.org/pdf/1911.02855.pdf

Reference

https://zhuanlan.zhihu.com/p/106802620

猜你喜欢

转载自blog.csdn.net/weixin_48185819/article/details/124496109

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)