LDA 提取新闻中的主题 - 代码天地

LDA 提取新闻中的主题

其他 2019-03-04 14:12:04 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/sinat_22659021/article/details/78494681

先说一下遇到的几个问题：

1.读取.csv文件的时候，有时候会出现编码问题，我们可以用记事本将.csv文件另存为Utf-8编码的文件就行啦，然后直接用utf-8编码方式打开。

例如:

df = pd.read_csv(r"*.csv", encoding = 'utf-8')

2.用jieba分词读取新闻内容的时候有时候会出现' AttributeError: 'float' object has no attribute 'decode' '报错,这是因为jieba分词的输入必须是字符串，你用panda读取数据后的列是float型的(可能是float默认转换的，也有可能是其他原因，)这时候我们只需要在分词前将他们装换为字符串就行啦(用.astype(str))。
df["content"] = df["content"].astype(str)

猜你喜欢

转载自blog.csdn.net/sinat_22659021/article/details/78494681

LDA 提取新闻中的主题

LDA （LDA文档主题生成模型）

主题模型-LDA浅析

LDA主题模型

主题模型LDA

LDA主题聚类

Spark LDA 主题预测

Spark LDA 主题抽取

LDA主题模型笔记

LDA主题模型浅析

关于LDA主题模型

主题模型 LDA 入门

LDA 主题模型

LDA主题模型及案例

主题模型LDA简介

LDA主题模型算法

LDA——主题模型_note

主题模型LDA及在推荐系统中的应用

『LDA主题模型』用Python实现主题模型LDA

LDA主题模型简介(转载)

LDA处理文档主题分布

浅析LDA-主题模型

LDA主题模型浅析 -- 笔记

LDA主题模型原文解读

LDA主题模型及python实现

LDA主题模型（算法详解）

通俗理解LDA主题模型

【NLP】主题模型LDA与ABAE

LDA

Python之酒店评论主题提取LDA主题模型文本主题抽取：用gensim训练LDA模型

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)