(30-5)基于NLP用户舆情的交易策略:泛化的监督学习模型+ 增加嵌入维度的监督学习模型

30.5.1  泛化的监督学习模型

在实际应用中,利用正确标记的数据非常重要。接下来训练一个更为泛化的模型,该模型将在多个股票新闻标题上进行训练(超过12个)。我们将加载由专家标记的数据集,该数据集的规模较大(9470个条目)。

(1)下面代码的功能是读取包含标记数据的CSV文件,并将其加载到一个DataFrame中,以便后续分析和处理。

# 读取输入数据
labelled_data = pd.read_csv('input/news-trading/newsdata_labelled_v3.csv', encoding="ISO-8859-1")
# 显示读取的数据
labelled_data

执行后会输出:

<

猜你喜欢

转载自blog.csdn.net/asd343442/article/details/143335803