基于深度学习的文本分类研究

基于深度学习的文本分类研究

ID:46583651

大小:5.13 MB

页数:43页

时间:2019-11-25

基于深度学习的文本分类研究_第1页
基于深度学习的文本分类研究_第2页
基于深度学习的文本分类研究_第3页
基于深度学习的文本分类研究_第4页
基于深度学习的文本分类研究_第5页
资源描述:

《基于深度学习的文本分类研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、委:£~茎一墨蕾内蒙名民撤大学硕士学位论文基于深度学习的文本分类研究TextClassificationBasedonDeepLearning申请人:学科专业:研究方向:学位类别:指导教师:苏峰应用数学最优化理论、方法及应用学术学位裴志利教授论文提交日期:二。一四年三月^^J一^L_nJ-I一.皋J1七.码号校学学二口丐.,烬吣鳓摘要21世纪是信息时代,随着计算机技术、数据存贮技术日新月异的发展,应用领域也得到了快速扩展,文本数据资源正以指数级的速度增长着.对于用户来说面对如此海量的文本信息,但知识却相对贫乏的现象,

2、人们从海量的信息中获取有意义的、相关性强的知识变得困难,因此将文本信息按照某些主题分类是一个迫切需要解决的问题,也是文本数据存储发展的必由之路.从文本分类由美国学者H.P.Luhn教授在1957年第一次被提出来,现今文本分类已经成为数据挖掘领域非常重要的~个分支,它已经在搜索引擎等领域有较好的应用.文本分类中特征选择是降低特征空间维数提高分类算法精度的重要过程.所以寻找优秀的特征选择方法对特征空间进行降维,当前己是一个非常有实际价值的研究课题。下面是本文所做的主要工作:首先,对文本分类的相关技术:文本表示、分词处理、

3、去停用词、特征选择、特征抽取等算法进行了介绍分析,也介绍了分类结果的评判标准和常用的语料数据集,在后续试验中应用这些技术将文本数据转换成计算机可处理的数据结果.并且介绍了深度学习的产生发展经历及其在文本挖掘中的应用其次,本文主要研究了利用自动编码器(Autoencoder)训练之后进行特征提取的相关工作,通过与其他特征提取的分类结果进行比较提出了基于AE的特征提取分类算法.并在数据及上进行了验证.最后提出了中基于多个自动编码器(Autoencoder)的文本分类方案,并与单个AE进行分类的方案进行了理论分析与想,进行

4、了相应范围内的实验,给出了对比分析.关键词:文本分类;深度学习;文本特征;特征提取;自编码器网络TextClassificationBasedonDeepLearningAbstractThetwenty-firstCenturyistheageofdigitalinformation.Withtherapiddevelopmentofcomputertechnologyanddatastoragetechnology,applicationshavebeenrapidlygaining,textdataresour

5、cesisgrowingatanexponentialpace.Foruser,facingsuchmassivetextmessageswithpoorknowledge,itisdifficulttoobtainfullmeaningandhighrelevantinformation.TextclassificationaccordancewiththecontentsorthemeisanurgentproblemtObesolved,butalsotheonlywayforthedevelopmentoft

6、extdatastored.FromthetextclassificationhasbeenproposedbyAmericanscholarProfessorH.P.Luhnin1957forthefirsttime,thetextcategorizationhasbecomeaveryimportantbranchofdatamining.Ithasbeenwellappliedinthesearchenginefield.Intextclassification,featureselectionisaveryi

7、mportantprocesstoreducethedimensionofthefeaturespaceandimprovetheclassificationaccuracy.Sofindingagoodfeatureselectionmethodtoreducethedimensionalit37ofthefeaturespaceisaveryvaluableresearchtopic.Thefollowingisthemainworkofthispaper:InthispapeLfirstlyweintroduc

8、eandanalysistherealisticsignificanceoftextclassification:textexpressed,wordsegmentation,movestopword,featureselection,featureextractionalgorithmsalsopresentedtheresultsofthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。