基于词元语义特征的汉语框架排歧技术-研究

基于词元语义特征的汉语框架排歧技术-研究

ID:32565410

大小:2.12 MB

页数:47页

时间:2019-02-12

基于词元语义特征的汉语框架排歧技术-研究_第1页
基于词元语义特征的汉语框架排歧技术-研究_第2页
基于词元语义特征的汉语框架排歧技术-研究_第3页
基于词元语义特征的汉语框架排歧技术-研究_第4页
基于词元语义特征的汉语框架排歧技术-研究_第5页
资源描述:

《基于词元语义特征的汉语框架排歧技术-研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、4.3.2Theresultsofframedisambiguationbasedonmanualfeatureselection⋯274.3.3Contrastexperimentresultsandanalization⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..294.4Chapterconclusion⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..30Chapter5ConclusionsandProspects⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.315.1Con

2、clusions⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.315.2Prospects⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31References⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯33ResearchAchievement⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.37Acknowledgement⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3、⋯⋯⋯..39PersonalProfiles⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..41LettersofCommitment⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯43AuthorizationStatement⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.45中文摘要近年来,语义分析已经引起了自然语言处理领域越来越多的关注。随着SemEval2007任务Taskl9的提出,框架语义抽取任务受到了越来越多研究学者

4、的关注。框架排歧任务是框架语义结构抽取任务中的子任务,作为中间环节,占有基础又重要的地位。目前常用的框架排歧方法是人工设定模型和特征模板,研究表明这种方法不能充分利用目标词所激起的框架的语义特征,因而,本文研究了基于语义特征的汉语框架排歧。框架排歧最重要的两个步骤就是模型选择和特征选择。针对模型选择,本文将汉语框架排歧看作是一个单点分类问题,考察了SVM模型和最大熵模型对汉语框架排歧的影响。针对特征选择,目前常用的方法是人工特征选择方法,但是这种方法不能有效地利用每个目标词的语义特征,而且大量实验

5、表明,不同的目标词取得最好的结果时所用的特征模板是不同的。为此,本文提出了自动特征选择算法,即为每个目标词自动选择一个特征模板。本文的主要研究内容与贡献包括:(1)基于词元语义特征的汉语框架排歧模型。分别阐述了SVM模型和最大熵模型,研究了这两种模型在词法层面和句法层面对汉语框架排歧性能的影响。实验结果表明,最大熵模型更适合汉语框架排歧。(2)基于词元语义特征的汉语框架排歧特征选择。使用最大熵模型,采用传统的人工特征选择方法和本文提出的自动特征选择方法进行汉语框架排歧。实验结果显示,自动特征选择方

6、法在时间复杂度和空间度要明显优于人工特征选择方法,而且简化了特征模板。(3)使用most.frequentframe方法作为baseline实验,并与其他汉语框架排歧的文献结果进行对比分析。此外,从词法和句法层面验证了自动特征选择方法的有效性。本文在语料扩充的基础上,借助汉语框架网语义资源,利用词元的语义特征,为每个歧义目标词单独采用最大熵模型建模,并使用自动特征选择算法选出的特征模板,进行5-fold交叉验证,平均精确率可达到84.46%。关键词:汉语框架排歧;汉语框架网语义资源;自动特征选择;

7、词元语义特征IlABSTRACTInrecentyear,semanticanalysishasbeenpaidattentiontoinnaturallanguageprocessing.WithSemEval2007Taskl9proposed,moreandmoreresearchershavefocusedon.Framedisambiguationisasub—taskoftheFr眦eSemanticStructureExtraction.Asintermediatelinks,fra

8、medisambiguationoccupiesafundamentalandimportantposition.Themostcommonlyusedmethodistomanuallysetthemodelandfeaturetemplates,studiesshowthatthismethodcannotmakefulluseofthesemanticfeaturesoftheflameevokedbythetargetwords.Therefore,thispaperstu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。