复杂数据分类方法及其应用研究

复杂数据分类方法及其应用研究

ID:32968703

大小:800.83 KB

页数:53页

时间:2019-02-18

复杂数据分类方法及其应用研究_第1页
复杂数据分类方法及其应用研究_第2页
复杂数据分类方法及其应用研究_第3页
复杂数据分类方法及其应用研究_第4页
复杂数据分类方法及其应用研究_第5页
资源描述:

《复杂数据分类方法及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、复杂数据分类方法及其应用研究Researchandapplicationofcomplexdataclassificationalgorithm专业:信息管理与信息系统作者姓名:陈东方指导教师:陈富赞副教授天津大学管理与经济学部二零一四年十一月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中

2、作了明确的说明并表示了谢意。学位论文作者签名:签字日期:年月日学位论文版权使用授权书本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日摘要现代电子商务的迅速发展和知识管理技术的进步使得现在的数据收集变得更加容易和迅速。如何从海量数据中挖

3、掘出有效的信息成为众多领域重点关注的研究问题。近来,复杂高维数据存在的“维灾难”问题成为数据挖掘领域的研究热点。分类是有效分析数据的一种方法,然而随着数据集呈现出越来越高的维度,其中一些不相关或冗余特征大大增加了分类处理的难度。本文以对各类别样本发现具有显著鉴别能力的类特征子空间、从而提高分类准确率为研究目标,利用Filter模型的高效率及Wrapper模型的高性能,结合“最大相关-最小冗余(mRMR)”方法和改进后的遗传算法设计了一种有效的基于类的两阶段特征子空间选择分类方法。首先,在Filter阶段使用mRMR标准

4、预选一定数量的特征作为候选特征子集;然后,在Wrapper阶段设计特征子空间优化的GA-SVM算法。GA-SVM将SVM分类器训练与类特征子空间优化同时进行。在UCI数据集上的仿真实验结果也表明该分类方法相比于其他已有特征选择分类算法具有较好的分类性能。最后,本文构建了将基于类的特征子空间选择分类算法应用于推荐营销系统中的基本框架。在运营商的推荐营销系统中,从客户的产品或业务记录中学习分类子空间模型,构建消费特征子空间,并将生成的分类器和类特征组合用于对新客户的判断分类和新/老客户的推荐营销中。该框架可以依据客户的分类

5、向客户以文本或其他方式推荐与该类型客户消费偏好相匹配的产品或业务组合。关键词:分类,特征选择,最大相关-最小冗余,支持向量机,遗传算法ABSTRACTNow,therapiddevelopmentofmoderne-commerceandtheadvancementofknowledgemanagementtechnologymakedatacollectionbecomeeasierandfaster.Howtominetheusefulinformationfromamassofdatahasbecomeanimp

6、ortantprobleminmanyresearchfields.Recently,the“dimensiondisaster”problemexistinginthecomplexhigh-dimensionaldatahasbecomeafocusinthefieldofdatamining.Classificationisaneffectivemethodfordataanalysis,butwiththedatasets’dimensionsbecomingmoreandmorehigher,someirre

7、levantorredundantfeaturesgreatlyincreasethedifficultyofclassificationprocessing.Aimingtogetthedistinguishingfeaturesubspaceforeachclass,andthenimprovetheclassificationaccuracy,anoveltwo-stageclass-dependentfeatureselectionmethodisproposed.ThepresentedmethodisaFi

8、lter-Wrapperhybridapproachbasedonminimal-redundancy–maximal-relevancy(mRMR)andgeneticalgorithm,wherethespeedandperformanceareimprovedwiththehighefficiencyofFilterandt

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。