笔记:目标级情感分析任务数据集集合

最近需要一批目标级情感分析任务数据集 。做个笔记整合一下。
找到一部分数据,做个整合,希望能帮助到有需要的人。
感谢百度,google ,bing 等各大搜索链接的相关文章,文章太多,就不一一列举感谢了。

目标级情感分析是考虑了具体的目标,该目标可以是实体、某个实体的属性或实体加属性的组合。任务具体可分为三种:
Target-grounded aspect based sentiment analysis (TG-ABSA),
TG-ABSA 的分析对象是给定某一个实体的情况下该实体给定属性集合下的各个属性的情感分析
Target no aspect based sentiment analysis (TN-ABSA),
实体情感分析
Target aspect based sentiment analysis (T-ABSA).
实体的属性情感分析

1.SemEval-2014 Task

它包括餐馆和笔记本电脑两个数据集,
其中餐馆数据集包含上面的4个子任务的标注,而笔记本电脑的数据只有前两个任务的标注数据。
任务1:对句子中实体识别
任务2:对句子中实体判断情感倾向
任务3:对句子中实体类别进行识别
任务4:对句子中实体类别判断情感倾向
数据集下载.

2.SemEval-2015 Task

增加了实体与属性链接任务。并判断其情感倾向。
例如:
The fajitas were great to taste, but not to see”→ {FOOD#QUALITY, “fajitas”, positive}, {FOOD#STYLE_OPTIONS, “fajitas”, negative }
数据集下载.

3.AI_challenger 2018

数据集分为训练、验证、测试A与测试B四部分。数据集中的评价对象按照粒度不同划分为两个层次,层次一为粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素;层次二为细粒度的情感对象,例如“服务”属性中的“服务人员态度”、“排队等候时间”等细粒度要素。

数据介绍及下载
第一名实验方案

4.2019-CCF-BDCI-金融信息负面及主体判定

任务为实体的负面情感判定。判断文中出现的实体是否具有负面情感。

数据集介绍及下载

5.NLPCC-2012 中文微博情感分析评测

数据结构如下

<sentence id="1" opinionated="Y" polarity="NEG" target_word_1="90后暴打老人" target_begin_1="1" target_end_1="7" target_polarity_1="NEG">#90后暴打老人#我承认我也是90后;看到这个新闻;真的挺让我震惊的.先是杜甫被恶搞;接着再发生这样的事情;中国5000年的历史文化;到了我们这一代还能剩多少;是传统还是传承?</sentence>
weibo-id:微博 id
sentence-id:句子 id
target:情感对象
begin-offset: 情感对象在整条微博中的起始位置
end-offset:情感对象在整条微博中的终止位置
polarity:对情感对象的观点极性,POS 代表正面,NEG 代表负面, OTHER 代表
中性或者无法明确归为正面或者负面的其它情形。

数据下载

6.2019 搜狐校园算法大赛

任务:给定若干文章,目标是判断文章的核心实体以及对核心实体的情感态度。每篇文章识别最多三个核心实体,并分别判断文章对上述核心实体的情感倾向(积极、中立、消极三种)。
大赛主页
数据集下载:
data.zip 链接 密码: mpqd
coreEntityEmotion_test_stage2.zip 链接 密码: 7cws
sample_submission_stage2.txt 链接 密码: 251q

后续再针对实体(TN-ABSA)情感分析任务 做常用方法总结。

原创文章 6 获赞 10 访问量 371

猜你喜欢

转载自blog.csdn.net/qq_23126315/article/details/105688037