硕士论文-中文人称代词指代消解系统的研究与实现

硕士论文-中文人称代词指代消解系统的研究与实现

ID:34518547

大小:1.48 MB

页数:52页

时间:2019-03-07

硕士论文-中文人称代词指代消解系统的研究与实现_第1页
硕士论文-中文人称代词指代消解系统的研究与实现_第2页
硕士论文-中文人称代词指代消解系统的研究与实现_第3页
硕士论文-中文人称代词指代消解系统的研究与实现_第4页
硕士论文-中文人称代词指代消解系统的研究与实现_第5页
资源描述:

《硕士论文-中文人称代词指代消解系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、山西大学硕士学位论文中文人称代词指代消解系统的研究与实现姓名:罗云飞申请学位级别:硕士专业:计算机应用技术指导教师:李国臣20050101摘要指代是自然语言中常见的语言现象,大量出现在篇章或对话中。指代词的使用可以使语篇的表述不显累赘,简明清晰。指代消解是文本信息处理中的一个重要任务。随着篇章处理相关应用日益广泛,指代消解也显示出前所未有的重要性,成为一个文本信息处理的研究热点。它在机器翻译、自动摘要、问答系统、信息抽取等许多自然语言处理技术应用领域中发挥着重要作用,并已经成为Muc和AcE中的重要评测任务。本文在深入分析突发事件语料中人称代词指代特点的基

2、础上,提出了一种基于语料库的,机器学习方法与优先选择策略相结合的指代消解模型。该模型充分考虑了与指代相关的若干属性,利用决策树算法构建过滤器,有效的降低了噪音,大量减少了进入优先选择策略待消解对的数量。而优先选择策略可以将通过滤器不能很好处理的指代现象利用统计学的方法消解出来。二者互相补充,相辅相成。该模型具有以下特点(1)机器自学习模型。该方法是从大规模语料库中自动训练出来的指代消解系统模型,很少需要人工干预,所有特征属性都可以直接从训练语料中获得。(2)减少了非先行语噪音的干扰。利用决策树算法构建的过滤器降低了候选互指对的噪音,剔除了许多非互指的待消解

3、对,提高了指代消解的效率和准确率。(3)统计与规则相结合的方法。充分利用优先选择策略对指代消解的特征属性综合考虑,使他们对消解效果的影响更加趋于合理,弥补了利用规则进行指代消解的不足。在该模型的基础上,本文详细描述了中文文本人称代词指代消解试验系统的设计与实现,并且对算法和各个特征属性进行了全面的测试评估。从该算法目前所取得的一些初步试验结果看来,这是行之有效的。在突发事件新闻文本中,对中文人称代词的消解特别是第三人称的消解获得了较好的效果。指代消解系统具有一定的先行语和特征属性的可扩展性,保证了系统拥有良好的健壮性,方便应用系统的移植。本文对人称代词的指

4、代消解进行了初步的研究,从中我们认识到了进一步的研究内容,为今后的研究奠定了基础。关键词:语料库;人称代词;指代消解;决策树:最优选择ABSTRACTAnaphoraisacor砌onphenomenonintheresearchonNLP(NammlLanguageProcessing),it印pearsalotinthediscoursesorthedialogues.Theuseofa11印horicwordsmakesdiscourselookSbriefA皿印homres01utionplaysanimportantroleinte斌inf0瑚a

5、bonprocessing.WimtheincreasingdeVelopmemofdealingwiththediscourses,a11印horaresolutionshowstheunprecedentedimportance,andbecomesahotreseaI℃honprocessingtheinfonnationofte赋.Itisve巧importantinMachinenanslating,AutomaticSummarization,QuestionAnswer,InformationExtractionandothernatural

6、languageprocessingarea,a11ditbecomesanimportamevaluatingtaskofMUCaIldACEInthispaper,basedonthein-depthaJlalySisofa11aph硎cfeatul℃sofpronounintheparoxysmalChinesetexts,wepresenta11印proachofaIl印horaresolution,whichisbaSedoncorpllSadoptingthestatisticalmachineleamingarithmeticandcombi

7、ningwiththepreferenceselectionsn.ategyThemethodtdkesimoaccountallkndsOfan印horicfjatllres,andusesthedecision仃eearithmetictoconstructthefiltefItisat00IreducingthenoiseofmesyStem,whichcandecreasethenumberofwaitingresolutionwords.Thepreferenceselectionstrategycanresolveotheran印horicph

8、enomena,whichcaIlllotberesolVedby

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。