依存分析:中文依存句法分析简介

一、句法分析

句法分析是自然语言处理中的关键技术之一,其基本任务是确定句子的句法结构或者句子中词汇之间的依存关系。
主要包括两方面的内容,一是确定语言的语法体系,即对语言中合法的句子的语法结构给与形式化的定义;另一方面是句法分析技术,即根据给定的语法体系,自动推导出句子的句法结构,分析句子所包含的句法单位和这些句法单位之间的关系。

二、语法体系

句法分析需要遵循某一语法体系,根据该体系的语法确定语法树的表示形式,如:

西门子将努力参与中国的三峡工程建设。

1、短语结构语法

这里写图片描述
短语结构树由终节点、非终结点以及短语标记三部分组成。分局语法规则,若干终结点构成一个短语,作为非终结点参与下一次规约,直至结束。

2、依存语法

这里写图片描述
依存语法的结构没有非终结点,词与词之间直接发生依存关系,构成一个依存对,其中一个是核心词,也叫支配词,另一个叫修饰词,也叫从属词。
依存关系用一个有向弧表示,叫做依存弧。依存弧的方向为由从属词指向支配词,当然反过来也是可以的,按个人习惯统一表示即可。

三、依存句法分析

1、概念

依存句法通过分析语言单位内成分之前的依存关系解释其句法结构,主张句子中核心动词是支配其他成分的中心成分。而它本身却不受其他任何成分的支配,所有受支配成分都以某种关系从属于支配者。

2、五个条件

(1)一个句子中只有一个成分是独立的
(2)句子的其他成分都从属于某一成分
(3)任何一个成分都不能依存于两个或两个以上的成分
(4)如果成分A直接从属成分B,而成分C在句子中位于A和B之间,那么,成分C或者从属于A,或者从属于B,或者从属于A和B之间的某一成分
(5)中心成分左右两边的其他成分相互不发生关系

3、标注关系

这里写图片描述

四、参考

《统计自然语言处理》  宗成庆
《基于统计方法的汉语依存句法分析研究》  马金山

猜你喜欢

转载自blog.csdn.net/sinat_33741547/article/details/79258045