自然语言处理综论-第9章小结-英语的上下文无关语法
本章通过上下文无关语法,介绍了句法的一些基本概念,具体内容如下:
在很多语言中,前后相续的单词的组合功能就像一个组或成分,我们可以用上下文无关语法(又称为短语结构语法)来为它们建立模型。一个上下文无关语法由一套规则或产生式组成,这些规则在非终极符号的集合和终极符号的集合上表示。从形式上讲,一个特定的上下文无关语言是从一个上下文无关语法推导出来的符号串的集合。生成语法是形式语言的语言学中的一个传统名称,用于给自然语言的语法建立模型。在英语中,句子一级有很多语法结构,其中陈述式结构、命令式结构、yes-no疑问式结构、wh疑问式结构是四种最常见的类型,它们可以用上下文无关规则来建模。在英语名词中,中心语名词前面的修饰成分有限定词、数词、数量修饰语和形容词短语,中心语名词后面可以跟随后修饰成分,经常出现的后修饰成分可能有:动名词VP、不定式VP和过去分词VP等。英语中的主语与主要动词在人称和数方面保持一致关系。动词可以根据它所期望的实=补语的类型来进行次范畴化。简单的次范畴是及物动词和不及物动词,大多数语法还包括除此之外的更多范畴。在口语中,句子的连接一般称为话段。话段可能是不流畅的,包括如uh和um这样的有声停顿、再开始、修正等。任何上下文无关语法都可以转变为Chomsky范式。在Chomsky范式中,每个规则的右手边或者是两个非终结符号,或者是一个终极符号。上下文无关语法比有限状态语法更强,但是有限状态语法可以使用FSA来近似地表示上下文无关语法。有一些证据表明,在人的语言处理中,组成性在起作用。