【2025算法面试通关】【五.自然语言处理-传统NLP】【36.大厂面试必问:机器翻译统计模型(IBM Model 1-5)与知识图谱构建推理核心试题解析 】

在这里插入图片描述

第一部分:机器翻译统计模型(IBM Model 1-5)面试题

一、基础概念与核心原理

  1. 什么是统计机器翻译(SMT)?其核心假设是什么?
    答:统计机器翻译通过概率模型将源语言句子翻译为目标语言,核心假设是找到使条件概率 ( P(f|e) ) 最大的目标句子 ( f ),基于贝叶斯公式分解为 ( P(e|f)P(f) ),其中 ( P(e|f) ) 是翻译模型,( P(f) ) 是语言模型。

  2. IBM Model 1-5的设计目标是什么?它们的核心区别是什么?
    答:目标是逐步细化词对齐模型,引入更复杂的对齐假设。区别在于对齐概率的建模方式:

    • Model 1:词对齐独立于位置,仅考虑词对概率
    • Model 2:引入位置偏移参数
    • Model 3:引入ertilit