30.5.1 泛化的监督学习模型
在实际应用中,利用正确标记的数据非常重要。接下来训练一个更为泛化的模型,该模型将在多个股票新闻标题上进行训练(超过12个)。我们将加载由专家标记的数据集,该数据集的规模较大(9470个条目)。
(1)下面代码的功能是读取包含标记数据的CSV文件,并将其加载到一个DataFrame中,以便后续分析和处理。
# 读取输入数据
labelled_data = pd.read_csv('input/news-trading/newsdata_labelled_v3.csv', encoding="ISO-8859-1")
# 显示读取的数据
labelled_data
执行后会输出:
<