(30-8)基于NLP用户舆情的交易策略:结论

30.6  结论

在本项目中,我们进行了以下工作:

首先,在第一部分中,我们明确了研究问题,并指出新闻来源是股票价格预测的重要组成部分。接着,在第二部分中,我们加载了金融市场数据,解析了RSS新闻标题,并定义了事件回报。随后,在第三部分中,我们专注于为新闻标题数据(语料库)创建情感值,探索了三种不同的方法:

  1. Textblob:一个基于朴素贝叶斯的情感分析模型,预训练于电影评论数据。
  2. 机器学习方法:我们创建了标签,结合Textblob情感和手动标记(基于百分比和命中/未命中标记),以建立基线。同时,我们将这些结果与专家标记的类似新闻标题数据进行比较。
  3. 深度学习方法

总体而言,标记后的模型在较低的嵌入维度下表现更佳,更简单的线性模型通常优于树基模型。然而,随着嵌入维度的提高,自我标记的模型效果下降,而在专家标记的数据集上,结果却有所改善。我们进一步尝试了神经网络方法,发现其在训练、验证和测试数据集上几乎达到了完美的表现。这一结果强调了准确标记数据的重要性,尤其是由专家进行标记时效果最佳。最后,我们还探索了VADER方法,发现其与Textblob类似,预训练于非金融语料库,因此我们利用了专为金融相关情感评估定制的词典。

猜你喜欢

转载自blog.csdn.net/asd343442/article/details/143573871