基于规则的汉语句法分析方法研究1.pdf

基于规则的汉语句法分析方法研究1.pdf

ID:52963511

大小:221.05 KB

页数:7页

时间:2020-04-04

基于规则的汉语句法分析方法研究1.pdf_第1页
基于规则的汉语句法分析方法研究1.pdf_第2页
基于规则的汉语句法分析方法研究1.pdf_第3页
基于规则的汉语句法分析方法研究1.pdf_第4页
基于规则的汉语句法分析方法研究1.pdf_第5页
资源描述:

《基于规则的汉语句法分析方法研究1.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、1基于规则的汉语句法分析方法研究王鹏,戴新宇,陈家骏,王启祥(南京大学计算机科学与技术系南京大学计算机软件新技术国家重点实验室南京210093)摘要:本文从汉语的句法结构特点出发对基于规则的汉语句法分析方法进行讨论,从中总结出这类方法的一般特征,提出实用化的基于规则的汉语句法分析器必须引入其它辅助分析手段才能提高性能和可靠性。关键词:句法分析,上下文无关文法,汉语,语料库,知识库中图分类号:TP391.2ResearchesonRule-basedChineseParsingTechniquesWANG

2、Peng,DAIXin-yu,CHENJia-jun,WANGQi-xiang(DepartmentofComputerScienceandTechnology,NanjingUniversity,StateKeyLaboratoryforNovelSoftwareTechnologyatNanjingUniversityNanjing210093)Abstract:Inthispaper,wediscusstheRule-basedChineseSyntacticParsingtechniquesba

3、sedonthecharacteristicsofChinesesentencestructure.Thecommonfeaturesofthesetechniquesaresummarized.Basedontheanalysisofthesetechniques,weputforwardtheviewpointthatinordertoimprovetheperformanceandreliabilityofthepracticalRule-basedChineseSyntacticanalyzer

4、,otherauxiliaryanalyticmeasuresmustbeintroduced.KeyWords:syntacticparsing,context-freegrammar,Chinese,corpus,knowledgebase一、引言句法分析在自然语言处理领域中具有十分重要的地位,同时它也是公认的一个研究难题。以传统的基于转换规则的机器翻译系统为例,前端的句法分析结果的好坏直接影响到后续处理的正确性。汉语作为自然语言的一种,具有自然语言所共有的最本质的东西,因此汉语句法分析有必要借鉴和

5、吸收成熟的语言学理论。同时,由于汉语的特殊性,决定了汉语句法分析不可能照搬现成的方法,必须从汉语自身特点出发,以先进的语言学理论为指导,研究和开发适合汉语的句法分析技术。目前国内很多有代表性的汉外机译系统的汉语句法分析模块都是通过改进已有的经典句法分析算法设计的,不少已在实践中取得了很好的效果。在这中间,传统的基于规则的方法又占了主导地位。这是因为基于规则的方法从汉语句子最本质的特征出发,例如构词法、词组构造法、造句法等,从宏观上总结出句法规则。无论汉语的句式结构多么自由,其中蕴涵的最基本的规则是相对稳

6、定的。规则易于表达汉语句子成分的构成规律。其次,经过长时间的发展和不断改进,这类方法已较为成熟,应用在一些实用化的系统中有较高的效率。进入20世纪90年代以来,基于语料库的统计方法获得了较快的发展,但是单独用它作为汉语句法分析的例子却不多见,统计方法不依赖汉语语言学理论,仅仅依靠从语料库中统计得到的数据进行分析,本质上是一种经验主义方法。统计方法在处理汉语词的切分歧义、兼类词消解、句法结构排歧等方面有较强的优势,可以为基于规则的句法分析过程提供有用的统计数据,从而提高系统的健壮性和适应性,两者有着融合的

7、趋势。本文首先阐述汉语句法结构的特点及其对句法分析造成的困难。接着,通过分析一些基1本课题得到国家863计划资助,项目编号为2001AA114102。于规则的汉语句法分析器的运行过程得出这类方法的一般特征,然后结合几个句法分析算法来逐个说明这些特征,最后对未来汉语句法分析器的发展趋势作出展望。二、汉语句法结构的特点与其它自然语言相比,汉语句法有以下两个主要特征:(一)同一词类可担任多种句法成分且无形态变化汉语既不同于以英语为代表的屈折语,也有别于以日语为代表的粘着语。无论是屈折语还是粘着语,词类与句法成

8、分之间有相对简单的对应关系,而“汉语的词类和句法成分之间[1]的关系是错综复杂的。”汉语的根本特点是同一词类可担任多种句法成分且无形态变化。在汉语中,名词除了主要担任主、宾语外,也可以直接担任定语,在一定的条件下还可担任谓语,例如“明天星期天”,“星期天”就作谓语;作定语虽然是形容词的主要功能,但形容词和名词的主要区别在于形容词经常用作谓语和补语,例如:“苹果熟了”,其中的“熟”就作谓语,“小偷跑得真快”,“真快”可作为补语。名词不能作补语

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。