基于词聚类的依存句法分析

基于词聚类的依存句法分析

ID:38244681

大小:1.00 MB

页数:5页

时间:2019-06-01

基于词聚类的依存句法分析_第1页
基于词聚类的依存句法分析_第2页
基于词聚类的依存句法分析_第3页
基于词聚类的依存句法分析_第4页
基于词聚类的依存句法分析_第5页
资源描述:

《基于词聚类的依存句法分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第42卷第7期中南大学学报(自然科学版)Vol.42No.72011年7月JournalofCentralSouthUniversity(ScienceandTechnology)July2011基于词聚类的依存句法分析1,2袁里驰(1.江西财经大学信息学院,江西南昌,330013;2.中南大学信息科学与工程学院,湖南长沙,410083)摘要:利用语义、语法等语言知识,对中心词驱动的句法分析模型规则进行分解和修改,结合分词、词性标注进行句法分析,提出一种可同时考虑多个语义依存关系的模型。利用互信息给出基

2、于邻接关系、语义依存关系的2种词相似度定义,提出一种自下而上的分层聚类算法,以解决中心词驱动模型数据稀疏问题,用改进的句法分析模型进行句法分析实验。研究结果表明:模型精确率和召回率分别为88.14%和86.93%,综合指标比Collins头驱动句法分析模型的综合指标提高6.09%。关键词:自然语言处理;词聚类;中心词驱动模型;句法分析统计模型中图分类号:TP391.1文献标志码:A文章编号:1672−7207(2011)07−2023−05DependencylanguageParsingmodelba

3、sedonwordclustering1,2YUANLi-chi(1.SchoolofInformationTechnology,JiangxiUniversityofFinance&Economics,Nanchang330013,China;2.SchoolofInformationScienceandEngineering,CentralSouthUniversity,Changsha410083,China)Abstract:Byincorporatinglinguisticfeaturessu

4、chassemanticdependencyandsyntacticrelations,anovelstatisticalParsingmodelwasproposed.Themodelwasconstructedoncluster,andtheproblemofdatasparsenesswasnotserious.Themodeltookadvantageofafewsemanticdependenciesatthesametime,anditwasaparserbasedonlexicalized

5、model.Experimentswereconductedfortherefinedstatisticalparser.Theresultsshowthatprecisionandrecallare88.14%and86.93%,respectively,andcomprehensivefactorisimprovedby6.09%comparedwiththatofthehead-drivenparsingmodel.Keywords:naturallanguageprocessing;wordcl

6、ustering;head-drivenparsingmodel;statisticalParsingmodel[1]句法分析是指根据给定的语法,自动地识别出规则的方法是以知识为主体的理性主义(Rationalism)句子所包含的句法单位和这些句法单位之间的关系。方法,以语言学理论为基础,强调语言学家对语言现句法分析是自然语言理解的一个关键组成部分,是对象的认识,采用非歧义的规则形式描述或解释歧义行自然语言语义进行进一步分析的基础。随着自然语言为或歧义特性;基于统计的句法分析必须以某种方式应用的日益广泛

7、,特别是对文本处理需求的进一步增对语言的形式和语法规则进行描述,而且这种描述必加,句法分析的作用愈加突出,它几乎成为大多数自须可以通过对已知句法分析结果的训练获得,这便是[4−10]然语言处理应用的关键因素,如机器翻译、信息抽取、句法分析模型。基于树库的统计句法分析是现代问答系统、检索系统等。句法分析的研究大体分为2句法分析的主流技术。构建统计句法分析模型的目的[2][3]种途径:基于规则的方法和基于统计的方法。基于是以概率的形式评价若干个可能的句法分析结果(通收稿日期:2010−07−11;修回日期:

8、2010−10−08基金项目:国家自然科学基金资助项目(60763001);江西省自然科学基金资助项目(2009GZS0027,2010GZS0072);全国教育科学“十一五”规划课题(ECA080292)通信作者:袁里驰(1973−),男,湖南邵阳人,博士后,副教授,从事语音识别与自然语言处理研究;电话:0791-3983891;E-mail:yuanlichi@sohu.com2024中南大学学报(自然科学版)第42卷常表示为语法树形式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。