一、认识NLP - 代码天地

一、认识NLP

其他 2020-03-25 21:42:46 阅读次数: 0

NLP定义：
(一词多义)
NLP的challenge(挑战)是：语言有多种意思
解决方法：看句子的context(上下文)

机器翻译系统：
传统方法：构建语料库，输入一句话，想看这句话的意思，一个单词一个单词从语料库找意思，用统计分析方法求概率

	传统方法的缺点：

可能出现语料库没有这个单词的情况(out of vocabulary)—(oov)
有一词多义的情况，不好区分意思
输出的语序不一定正确

解决方法：

Mixed Word/Character Model:
把所有的oov分词，拆成字符，比如比如 Jessica，变成J，e，s，s，i，c，a。其中是Begin，Middle，End的标记。这样处理的好处就是消灭了全部的OOV。坏处就是文本序列变得非常长，对于性能敏感的系统，这是难以接受的维度增长
UNK处理
在训练数据充足的情况下，RNN模型可以轻松支持30k-80k的词表。在大多数情况下，扩大词表都是首选的方案
通过上下文分析一词多义的情况
对于输出的语序不对的情况，可以用语言模型进行判定，给定一个句子，判定从语法来看，最正确的概率

统计型机器翻译系统的一般步骤

统计型机器翻译步骤

在这里插入图片描述

对于句法方面的经典论文推荐：

Question Answering in Context Coarse -to- Fine
Question Answering for long Documents QA Workshop
From Word Embedding To Document Distances（计算语义相似度）

归并排序算法——Merge sort
在这里插入图片描述

复杂度等级：
0(1)<0(logn)<0(n)<0(nlogn)<0(n^2)<0(nnlogn)<0(nn*n)<0(n!)

默默努力的人

发布了18 篇原创文章 · 获赞 0 · 访问量 149

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43979941/article/details/104858052

一、认识NLP

NLP（一）

NLP 笔记（一）：介绍 NLP

小白nlp入门基础（一）--nlp简介

NLP(一)：简介

NLP学习（一）

NLP基础（一）

NLP学习笔记（一）

NLP一些资源

NLP（一）：从规则到统计

NLP学习（一）—基础篇

一. CNLP-NLP-简介

NLP从入门到实战（一）

一些NLP术语

对于JDBC的认识（一）

认识PE格式一

（一）认识Git与GitHub

mockjs（一）——认识mockjs

树莓派的认识（一）

一.HTML语言的认识

认识Servlet（一）接口

原型的深度认识（一）

认识对象（一）

python的快速认识（一）

Git的认识一

认识与设计Serverless（一）

Linux初步认识(一)

指针初认识（一）

（一）认识React

类的认识（一）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)