Lucene.Net 使用于情绪分析 ( Opinion Mining ) - 代码天地

Lucene.Net 使用于情绪分析 ( Opinion Mining )

其他 2019-09-13 11:29:16 阅读次数: 0

摘要:Lucene.Net 使用于语义分析 ( Opinion Mining )

在这里我们假设要把线上的各种评论分成是正面或者是负面的言论分类 ,

最简单的方式是使用贝氏过滤法 , 其过程就类似分类垃圾邮件那样 ,

我们得训练两个词库 , 一个是负面词库 , 一个是正面词库 ,

再来训练词库 , 依此来判断是正面或负面意见 , 关于词库的建立

可参阅 O'Reilly 的 Bad Data 一书 , 其中提到可依照型态来区隔 ,

例如电影评论可能跟其他地方的评论是不同的

可参考先前发表的文章 :

Lucene.Net Spam Filter

建立词库 :

建立词库的语法可参阅 Lucene.Net 建立索引

足够的评论数量
分类的平衡 , 评论通常会呈现极端化 , 如5颗星的评论通常远多于一颗星的评价 , 因此必须限制 pos 评论的数量来平衡 pos 和 neg 分类

选择适当的分类算法 :

贝氏过滤
Maximum Entropy

在 Bad Data 技术手册中 , 作者认为 Maximum Entropy 处理得比贝氏过滤法好

训练分类器 :

可参阅 NLTK - trainer

各种提供自然语言分析的函数库例如 Python 的 NLTK , Net 平台的使用者也许

可以选择 SharpNLP 开始 , 其他还有 Stanford Parser

数据来源 :

利用文字探勘分析大众观感

Opinion Mining 解释

Bad Data 技术手册

最大熵学习法

原文:大专栏 Lucene.Net 使用于情绪分析 ( Opinion Mining )

猜你喜欢

转载自www.cnblogs.com/chinatrump/p/11516370.html

Lucene.Net 使用于情绪分析 ( Opinion Mining )

使用Lucene.Net实现全文检索

Lucene.net和盘古分词使用小结

Lucene.NET全文搜索详细使用与详解

Lucene.net(4.8.0) 学习问题记录六：Lucene 的索引系统和搜索过程分析

Net Core使用Lucene.Net和盘古分词器实现全文检索

Lucene.Net Lucene.Net

[实验] 使用 Lucene.net 开启 leading wildcard 搜寻 2w 笔姓名

使用Lucene.Net做一个简单的搜索引擎-全文索引

Lucene.NET

jieba.NET与Lucene.Net的集成

Lucene.Net 成为Apache的顶级项目

Lucene.net 全文检索文件

hard negative mining分析得最好的理解

Lucene.net 全文检索数据库

Lucene.net实现高性能读写

Lucene.Net 3.0.3如何从TokenStream中获取token对象

Code Index: 基于Lucene.Net的代码检索工具

mining calculate

Zcash mining

ZEN mining

etherum Mining

Data Mining

lucene.net 高级应用之排序、设置权重、优化、分布式搜索

Data Mining_聚类分析&分类器&关联规则&回归分析 (Python)

数据挖掘（Data Mining）| 数据分析建模理论基础

缺少TOKEN使用、消耗、锁仓场景？DREP MINING帮你游戏化实现！

[poj 2948]Martian Mining

What Is Text Mining?

Data Mining Algorithms

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)