浅论中文专利自动分类技术的研究

浅论中文专利自动分类技术的研究

ID:35187465

大小:2.40 MB

页数:64页

时间:2019-03-21

浅论中文专利自动分类技术的研究_第1页
浅论中文专利自动分类技术的研究_第2页
浅论中文专利自动分类技术的研究_第3页
浅论中文专利自动分类技术的研究_第4页
浅论中文专利自动分类技术的研究_第5页
资源描述:

《浅论中文专利自动分类技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、沈阳航空工业学院硕士学位论文中文专利自动分类技术的研究姓名:赵环宇申请学位级别:硕士专业:计算机应用技术指导教师:张桂平;蔡东风20090307沈阳航空工业学院硕士学位论文摘要专利分类可以加快对专利文献的检索速度,并方便对专利文献的管理,有着十分重要的作用。目前我国的专利申请数量逐年提高、增长迅速,传统的人工分类方法已经越来越难以进行,所以实现中文专利的自动分类有着重要的意义。本文详细介绍了专利分类的背景和研究现状,并给出了专利分类问题的定义。在详细分析各项分类技术的基础上,本文重点研究了专利分类中的特征选择、特征权重计算、分类方法等三个主要问题。

2、具体内容如下:1.提出了基于IPC领域知识的特征选择方法。该方法在特征选择中引入了IPC领域知识,为每个类别建立概念空间,并通过特征与概念空间的相关性来选择特征。2.提出了基于主题的特征权重计算方法。该方法将专利的标题作为主题,并通过考察特征与主题的相关性来确定特征的权重,使专利的文本表示更趋近于文章的主题。3.提出了一种多分类器融合方法。该方法通过考察各基本分类器的效果来确定权值,并根据权值对多分类器进行线性融合。本文在标准专利分类语料上,对上述方法进行了对比实验。实验结果表明,本文提出的特征选择方法能够提高分类的精度,但复杂度过高;本文提出的特

3、征权重计算方法优于传统的方法,能有效的改善分类效果;本文提出的分类器融合方法能够有效的提高分类精度。关键词:特征选择;特征权重计算;分类器融合;专利分类沈阳航空工业学院硕士学位论文AbstractPatentClassificationcanacceleratethespeedofretrievalofpatentdocumentsandfacilitatethemanagementofpatentliterature,whichplaysquiteanimportantrole.Atpresent,sincethequantityofChina’

4、Spatentapplicationsimprovesfasteachyear,andthemethodoftraditionalmanualclassificationhasbecomeincreasinglydifficulttocarryout,theachievementoftheChinesepatentautomaticclassificationhasgreatsignificance.Inthispaper,thebackgroundandresearchstatusofpatentclassificationareintroduc

5、edindetml,andtheproblemofpatentclassificationisdefined.Basedondetailedanalysisoftheclassificationtechniques,thisarticlefocusesonthreemainquestionsofpatentclassification,featureselection,featureevaluationalgorithmandclassificationmethod,andtheconcretecontentsareasfollows:First,

6、afeatureselectionmethodbasedonIPCdomainknowledgeisputforward,whichimportsIPCdomainknowledgeintofeatureselection,andsetupconceptspaceforeachclass,andmakesuseofrelativitybetweencharacterandconceptspacetoselectfeature.Second,afeatureevaluationalgorithmmethodbasedonthemeisputforwa

7、rd,whichconfirmsevaluationbytherelativitybetweencharacterandtheme,andmakesthetextrepresentationofpatentapproachthatofarticle’Stheme.Third,amultipleclassifierfusionmethodbasedonestimatedprioriprobabilityisputforward,whichensuresprobabilityweightsbyeffectofeachsingleclassifier,a

8、ndalinearfusionaccordingtoweightispresentedtomultipleclassifi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。