(30-6)基于NLP用户舆情的交易策略:使用增加嵌入维度的深度学习模型

30.5.4  使用增加嵌入维度的深度学习模型

还有继续提升模型性能的空间,特别是因为我们拥有一个相对较大的数据集,并且数据是由专家进行标注的。嵌入层似乎是构建优秀模型的关键,因此我们将尝试一种使用嵌入层的深度学习方法。

我们的深度学习模型将使用20,000的词汇表,并将最大文档长度限制为50个单词以进行填充。我们将采用LSTM层和嵌入层,其中嵌入层将是一个可训练的100维嵌入层。对于二分类问题,我们将使用二元交叉熵损失函数和Adam优化器。深度学习模型将在训练集上进行训练,并在测试集(90/10)上进行评估。此外,训练数据将进一步分割为训练和验证子集(60/40)。

(1)下面代码定义了一个使用Keras构建的深度学习模型类nlp_evals_keras,用于对文本数据进行情感分析。该类通过将文本转换为数字表示并进行填充,

猜你喜欢

转载自blog.csdn.net/asd343442/article/details/143371304