第一部分:机器翻译统计模型(IBM Model 1-5)面试题
一、基础概念与核心原理
-
什么是统计机器翻译(SMT)?其核心假设是什么?
答:统计机器翻译通过概率模型将源语言句子翻译为目标语言,核心假设是找到使条件概率 ( P(f|e) ) 最大的目标句子 ( f ),基于贝叶斯公式分解为 ( P(e|f)P(f) ),其中 ( P(e|f) ) 是翻译模型,( P(f) ) 是语言模型。 -
IBM Model 1-5的设计目标是什么?它们的核心区别是什么?
答:目标是逐步细化词对齐模型,引入更复杂的对齐假设。区别在于对齐概率的建模方式:- Model 1:词对齐独立于位置,仅考虑词对概率
- Model 2:引入位置偏移参数
- Model 3:引入ertilit