数据自动分类问题的研究

数据自动分类问题的研究

ID:36443540

大小:4.98 MB

页数:157页

时间:2019-05-10

数据自动分类问题的研究_第1页
数据自动分类问题的研究_第2页
数据自动分类问题的研究_第3页
数据自动分类问题的研究_第4页
数据自动分类问题的研究_第5页
资源描述:

《数据自动分类问题的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学博士学位论文数据自动分类问题的研究姓名:张巍申请学位级别:博士专业:计算机应用指导教师:蔡庆生20040401中国科学技术大学博士学位论文数据自动分类问题的研究保持。然后根据这个模型要求重构分类器的特点,给出一种递阶的RBF神经网络算法,将这种算法与粒度变换模型结合,构建出基于粒度变换的RBF神经网络分类器构造算法。本文在14个数据集上对这个算法进行了全面实验,并和目前国际上的其它算法进行了比较分析。目前企事业单位的数据都处于分布式业务环境中。在这种条件下,如何以比较小的代价,实现分析流程自动化的数据自动分类系统显得至关重要。

2、本文首先基于数据仓库的思想,提出了数据模式和分析模式二元组的概念,把分类分析的流程管理,纳入到了关系数据库自动化管理的范畴。接着分别在C/S和B/S方式下,给出了分布式数据自动分类系统的原型。结合国际上多分类器融合的研究成果,给出了P2P方式下的分布式数据自动分类系统的原型。并在安徽省农经信息管理与决策系统的应用软件中,实现了这些原型。本文的刨新点主要表现在以下三方面:一、从特征的评估测度入手,推导出两种描述特征(或特征子集)和类别相关度的测度SCDcv和SCDEn,并给出了相关的理论依据和严格证明,同时利用这两个测度,构造出真正的可伸缩特征

3、选择算法StaFSOS和EnFSOS。二、根据商空间理论,结合本文在特征选择和RBF神经网络的研究结果,给出了基于粒度变换的分类器构造模型GTM—CORBUNfa。并证明了其对应粒度变换的完备半序格、格树搜索和分类判别函数的性质保持性定理。三、借鉴数据仓库的思想,给出了数据模式和分析模式二元组的概念,把分类分析的流程管理,纳入到了关系数据库自动化管理的范畴。利用这个二元组的概念,分别在C/S、B/S和P2P方式下,给出了数据自动分类系统的原型,并加以实现。本文使用14个经典的分类标准数据集和一个真实数据集,对上述研究结果进行了实验,并和目前国

4、际上的相关算法进行了比较分析。同时我们开发了安徽省农经信息管理与决策系统,在分布式业务环境下实现了数据自动分类系统,并使用这个系统给出了农民负担评估模型。关键词:分类,特征选择,粒度计算、RBF神经网络-2-主里型兰垫查查兰堕圭堂垡鲨苎墼塑!垫坌耋塑垦盟塑窒AbstractDataMiningisaprocessofdiscoveringinterestingknowledgefromlargeamountsofdatastoredindatabases,datawarehouses,andotherinformationrepositori

5、es.ItiSafar-reachingresearchtopicincommunitiesofInducedDatabaseSystem,MachineLearning,StatisticAnalysis&LearningaswelIasInteractInformationGathering.Generallyspeaking,inlargedataset,therearevariousclassificationrules,andwiththeaimoffindingoutthoserules,AutomaticClassificati

6、oniSknowntobeofavitalresearchissue.Broadapplicationsofclassificationcanbefoundinfollowingfields:TextCategorization,Bioinformatics,CustomerRelationManagement,creditapproval、targetmarketing,store20cation.treatmenteffectivenessandmedicaldiagnosisetc,Inthisthesis,theauthorcarri

7、esoutadeepandcomprehensiveanalysistowardsautomaticclassificationproblem:discussingitSintension(ClassifierConstruction).extension(FeatureSelection。RuleExtraction)andmathematicalfoundation;summarizingthecurrentresearchsituation,relativeW0rk,someup—to—datetechnologiesanddevelo

8、pments.Andthethesisalsoconcentratesonpresenthotresearchissuesofclassificationinclu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。