基于深度学习的分类算法研究及应用

基于深度学习的分类算法研究及应用

ID:35067175

大小:3.19 MB

页数:52页

时间:2019-03-17

基于深度学习的分类算法研究及应用_第1页
基于深度学习的分类算法研究及应用_第2页
基于深度学习的分类算法研究及应用_第3页
基于深度学习的分类算法研究及应用_第4页
基于深度学习的分类算法研究及应用_第5页
资源描述:

《基于深度学习的分类算法研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP39单位代码:10183研究生学号:2013532127密级:公开吉林大学硕士学位论文(学术学位)基于深度学习的分类算法研究及应用StudyandItsApplicationonClassificationAlgorithmBasedonDeepLearning作者姓名:吴同专业:计算机应用技术研究方向:机器学习指导教师:梁艳春教授培养单位:计算机科学与技术学院2016年5月基于深度学习的分类算法研究及应用studyandItsApplicationonClassificationAlgori

2、thmBasedonDeepLearning作者姓名;吴同专业名称:计算机应用技术指导教师;梁艳春教授学位类别:工学硕±答辩日期;2016年5月)牛日未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论女的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者。否则著作权的商业性使用(但纯学术性使用不在此限),应承担侵权的法律责任。吉林大学硕:t学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教

3、师的指导下,独立进行研巧工作所取得的成果。除文中己经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研。究做出重要贡献的个人和集体,均已在文中W明确方式标明本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:曰期;>0/^年r月)^曰摘要摘要基于深度学习的分类算法研究及应用随着信息技术的飞速发展,我们生活的时代充满了大量的数据,这其中包含着丰富的、有意义的信息等待挖掘。分类器是数据分析最常见的一类算法模型,首先通过对已知类别样本学习来建立分类器模型

4、,然后利用该模型预测未知类别样本的标签。例如可以根据大量正常电子邮件的特征检测出垃圾邮件,通过网络流量的正常数据监测网络攻击行为等等。但是像垃圾邮件和网络攻击行为在生活中都是偶然发生的事件,这些数据难以收集。因此,我们仅能对易于收集的一类数据进行学习和特征描述,为其建立模型来区分它们和偶然事件,以达到预测数据类别的目的,我们将这类问题称为数据分布不均的单分类问题。支持向量数据描述(SVDD)方法适合用来解决高维、样本数据有限的单分类问题,并已取得了很好的效果,但是当目标数据分布不均、各处数据的密度相差较大时,SVDD的

5、分类性能会受到影响。本文引入并行的思想对SVDD算法进行改进,提出一种SVDD与AP聚类算法相结合的SA_SVDD算法。算法首先对数据集进行聚类处理,使得到的每一个子类中的数据分布都较为紧凑,然后对每个子类分别进行边界描述(即SVDD分类算法),最后以所有子类的边界面作为最终的判别标准。SA_SVDD的参数可通过粒子群算法自适应优化,因此该算法只需提供数据集,中间过程的参数全部根据具体的样本自适应产生。通过对一些标准数据集验证的结果表明,SA_SVDD算法的分类性能相比于经典单分类算法有明显的提高。为了降低算法的计算量

6、、提高准确率,本文引入深度学习中稀疏自动编码器(SAE)来对数据进行降维,提出一种深度学习与SA_SVDD算法融合的SAE_SVDD算法。其主要流程是首先利用SAE对数据进行特征压缩达到降维的目的,降低数据集的稀疏性,使数据集中各个数据点相对密集;然后使用SA_SVDD算法对降维后的数据进行学习。本文的应用背景建立在孕妇产前抑郁症调查的基础上,数据通过调查表的形式获得,并配以医生的专业诊断,将其分为患有抑郁症的孕妇和健康的孕妇。其数据特点是患病的孕妇数量较少,健康的孕妇数量较大,而描述孕妇每个数据的特征量较多,使用SA

7、_SVDD算法对其分类运行时间过长,分类效果不佳,使用SAE_SVDD算法能有效解决上述问题。同时在UCI数据集上的实验结果表明,相对于经典单分类算法,SAE_SVDD在分类性能和计算时间上都有明显的提高。关键字:深度学习,支持向量数据描述,参数优化,自适应IAbstractABSTRACTStudyandItsApplicationonClassificationAlgorithmBasedonDeepLearningWithrapiddevelopmentoftheinformationtechnology,our

8、liveisfullofkindsofdata,whichcontainabundantandmeaningfulinformationformining.Theclassifierisoneofthemostpopularmethodsfordataanalysis,whichbuildsclassifiermodelbytra

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。