基于深度学习理论与方法的中文专利文本自动分类研究

基于深度学习理论与方法的中文专利文本自动分类研究

ID:35067315

大小:3.42 MB

页数:92页

时间:2019-03-17

基于深度学习理论与方法的中文专利文本自动分类研究_第1页
基于深度学习理论与方法的中文专利文本自动分类研究_第2页
基于深度学习理论与方法的中文专利文本自动分类研究_第3页
基于深度学习理论与方法的中文专利文本自动分类研究_第4页
基于深度学习理论与方法的中文专利文本自动分类研究_第5页
资源描述:

《基于深度学习理论与方法的中文专利文本自动分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号G350密级公开UDC02编号10299S1322005硕士学位论文基于深度学习理论与方法的中文专利文本自动分类研究TheStudyofAutomaticChinesePatentClassificationBasedonDeepLearningTheoryandMethod指导教师刘红光作者姓名马双刚申请学位级别硕士专业名称图书情报与档案管理论文提交日期2016年06月论文答辩日期2016年06月学位授予单位和日期江苏大学2016年06月答辩委员会主席袁润评阅人______________2016年

2、06月独创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已注明引用的内容以外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果,也不包含为获得江苏大学或其他教育机构的学位或证书而使用过的材料。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:年月日学位论文版权使用授权书江苏大学、中国科学技术信息研究所、国家图书馆、中国学术期刊(光盘版)电子杂志社有权保留本人所送交学位论文的复印

3、件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致,允许论文被查阅和借阅,同时授权中国科学技术信息研究所将本论文编入《中国学位论文全文数据库》并向社会提供查询,授权中国学术期刊(光盘版)电子杂志社将本论文编入《中国优秀博硕士学位论文全文数据库》并向社会提供查询。论文的公布(包括刊登)授权江苏大学研究生处办理。本学位论文属于不保密□。学位论文作者签名:指导教师签名:年月日年月日江苏大学硕士学位论文摘要在当前经济全球化的时代,科技成为第一生产力。国家和企业的进步,越

4、来越多地依赖于科技的创新。作为科技载体的专利的数量和质量已经成为衡量国家和企业创新能力的重要指标,因而专利申请的数量大大增加。世界知识产权组织的统计结果表明,专利文本中蕴含了全世界90%-95%的发明创造,表征着世界科技的发展水平。如何从这些专利文本中获取和利用科技信息,为国家和企业的发展提供战略支持,是国内外相关学者和专家研究的重点。而专利文本的分类作为最基础的步骤,制约着专利文本信息的获取和利用。目前,专利文本的分类主要以人工方式为主,自动分类方式已经开始作为辅助手段,但大规模的专利文本自动分类尚未实现

5、,因此研究专利文本的自动分类具有重要的现实意义。基于专利文本的语义特征,借助自动分类技术,专利工作人员能够对大量的专利文本进行自动且高效地分类,提高工作效率的同时,能够更好地对专利文本中蕴含的丰富的科技信息进行分析和利用。因此,本文在对专利文本自动分类的基本框架和基本原理进行系统梳理的基础上,设计了一个基于深度学习理论的中文专利自动文本分类方法,方法的主要内容如下:首先对专利文本进行预处理和特征选择,得到专利文本的形式化表示;然后基于深度学习理论,用降噪自动编码器构建深度学习网络,自动学习得到专利文本的低维

6、特征编码,并在网络的最顶层采用支持向量机算法对其进行分类,根据分类的结果不断调整网络中的各层参数得到分类器;最后采用已知类别的专利文本测试集对分类器进行分类测试,得到测试分类的准确率、召回率和F值以验证本文设计的方法的可行性。另外,为了验证本论文设计方法的有效性和优越性,本文借鉴其他学者的方法,将得到的分类测试结果分别与K近邻算法、支持向量机算法和反向传播神经网络算法等经典算法得到的分类测试结果进行比较。本文设计的专利文本自动分类方法在测试集上平均得到了95%以上的分类准确率和94%以上的分类召回率,优于经

7、典算法,表明本文设计的方法是有效而且优越的。关键词:专利文本分类;深度学习理论;支持向量机;降噪自动编码器I江苏大学硕士学位论文AbstractInthecurrenteraofeconomicglobalization,scienceandtechnologyhasbecomethefirstproductiveforce.Theprogressofcountriesandenterprisesaredependingincreasinglyoninnovationandtechnology.Asacar

8、rieroftechnology,thequantityandqualityofthepatentshasbecomeanimportantindicatorofnationalinnovationcapacity,asaresult,thenumberofpatentapplicationsweregreatlyincreased.WIPOstatisticsshowthatthepatenttextscont

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。