NLP自然语言处理知识点索引

语言合成开源库

webrtc开源库 speex开源库 audacity开源库 音频算法开源库  
语言降噪 回音消除 VAD  AGC  音频均衡器/环绕音/低音增强音效算法  
         

NLP语言处理常用算法

HMM隐马尔可夫 维特比算法 jieba开源库(分词,词性标注,命名实体识别)

jieba开源库

https://github.com/fxsjy/jieba

Gensim开源库

https://github.com/RaRe-Technologies/gensim

CRF条件随机场 TextRank关键字提取 吉布斯采样 百度情感识别系统

https://github.com/baidu/Senta

百度FAQ自动问答系统

https://github.com/baidu/AnyQ

TF/IDF关键字提取 LSA/LAI/LDA关键字提取 PLSA算法 正向最大匹配原则/分词 逆向最大匹配原则/分词
SVM支持向量机       双向最大匹配原则/分词
PCFG句法分析(最流行)

PTB 宾州树库

句法分析

中文宾州树库CTB 清华树库TCT  主流句法分析评测PARSEVAL评测体系
  基于CRF句法分析 短语结构树为目标的句法分析器 基于最大间隔马尔可夫网络句法分析
    基于移进-归约的句法分析模型

Standford Parser开源句法分析器(java实现)

 
文本向量化(重点知识)  
word2vec词向量化 doc2vec文本向量化 词袋模型(Bag of word) 神经网络语言模型NNLM
C&W模型 CBOW模型 Skip-gram模型 doc2vecDM模型/DBOW模型
情感分析技术/词法分析 情感分析技术/基于机器学习分析 情感分析技术/混合分析 了解 PMC多项式朴素贝叶斯
分类模型SVM支持向量机 分类模型LR逻辑回归 情感分析CNN卷积神经网络 情感分析RNN循环神经网络
RNN变种 长短时记忆网络(Long Short Term Memory) LSTM      
机器学习算法
有监督学习 无监督学习 半监督学习 分类/聚类/回归/降维
分类算法 朴素贝叶斯 SVM支持向量机 LR逻辑回归
KNN k近邻居 决策树(Decision Tree)DT 神经网络(NN) 决策树升级版-随机森林
机器学习聚类算法/k-means算法      
最优化算法 梯度下降  随机梯度下降 批量梯度下降
丢弃法      
激活函数 Sigmoid(很少使用了) tanh ReLU
成功训练模型四个要素   数据/转换数据的模型/衡量数据好坏的损失函数/一个调整模型权重以便最小化损失函数的算法

Sep2Sep问答机器人

https://github.com/google/seq2seq

 
 
 
       

数学知识

           
           
           

Tensorflow相关知识点

           
           
           
           

语音识别关键字统计

webrtc开源库 speex开源库 audacity开源库 语言降噪 回音消除 VAD  AGC 
音频均衡器/环绕音/低音增强音效算法          
           
           

机器学习关键字统计

Pandas SARSA boosting      
Numpy SVM        
Q-learning LR        

算法工程师关键字统计

           
           
           

猜你喜欢

转载自blog.csdn.net/qq_29678299/article/details/88344178