NMT十篇必读论文(八)Statistical Phrase-Based Translation

清华大学NLP整理的神经机器翻译reading list中提到了十篇必读论文

https://github.com/THUNLP-MT/MT-Reading-List

这是统计机器翻译中一篇具有代表性的论文,在原来基于单词的翻译的基础上,增加了类似n-gram的机制(本文中取n=3,实验结果),将原句分割为若干个短语,对短语进行了翻译和重新排列。同时,构建模型时用到了多种不同方法以进行对比,包括使用已经进行过单词对齐的短语、进行语法分析、以及进行短语对齐,最后还提到了对不同单词赋予不同权重可以提升算法性能。

猜你喜欢

转载自blog.csdn.net/weixin_40240670/article/details/86075701
今日推荐