欢迎来到天天文库
浏览记录
ID:36443540
大小:4.98 MB
页数:157页
时间:2019-05-10
《数据自动分类问题的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中国科学技术大学博士学位论文数据自动分类问题的研究姓名:张巍申请学位级别:博士专业:计算机应用指导教师:蔡庆生20040401中国科学技术大学博士学位论文数据自动分类问题的研究保持。然后根据这个模型要求重构分类器的特点,给出一种递阶的RBF神经网络算法,将这种算法与粒度变换模型结合,构建出基于粒度变换的RBF神经网络分类器构造算法。本文在14个数据集上对这个算法进行了全面实验,并和目前国际上的其它算法进行了比较分析。目前企事业单位的数据都处于分布式业务环境中。在这种条件下,如何以比较小的代价,实现分析流程自动化的数据自动分类系统显得至关重要。
2、本文首先基于数据仓库的思想,提出了数据模式和分析模式二元组的概念,把分类分析的流程管理,纳入到了关系数据库自动化管理的范畴。接着分别在C/S和B/S方式下,给出了分布式数据自动分类系统的原型。结合国际上多分类器融合的研究成果,给出了P2P方式下的分布式数据自动分类系统的原型。并在安徽省农经信息管理与决策系统的应用软件中,实现了这些原型。本文的刨新点主要表现在以下三方面:一、从特征的评估测度入手,推导出两种描述特征(或特征子集)和类别相关度的测度SCDcv和SCDEn,并给出了相关的理论依据和严格证明,同时利用这两个测度,构造出真正的可伸缩特征
3、选择算法StaFSOS和EnFSOS。二、根据商空间理论,结合本文在特征选择和RBF神经网络的研究结果,给出了基于粒度变换的分类器构造模型GTM—CORBUNfa。并证明了其对应粒度变换的完备半序格、格树搜索和分类判别函数的性质保持性定理。三、借鉴数据仓库的思想,给出了数据模式和分析模式二元组的概念,把分类分析的流程管理,纳入到了关系数据库自动化管理的范畴。利用这个二元组的概念,分别在C/S、B/S和P2P方式下,给出了数据自动分类系统的原型,并加以实现。本文使用14个经典的分类标准数据集和一个真实数据集,对上述研究结果进行了实验,并和目前国
4、际上的相关算法进行了比较分析。同时我们开发了安徽省农经信息管理与决策系统,在分布式业务环境下实现了数据自动分类系统,并使用这个系统给出了农民负担评估模型。关键词:分类,特征选择,粒度计算、RBF神经网络-2-主里型兰垫查查兰堕圭堂垡鲨苎墼塑!垫坌耋塑垦盟塑窒AbstractDataMiningisaprocessofdiscoveringinterestingknowledgefromlargeamountsofdatastoredindatabases,datawarehouses,andotherinformationrepositori
5、es.ItiSafar-reachingresearchtopicincommunitiesofInducedDatabaseSystem,MachineLearning,StatisticAnalysis&LearningaswelIasInteractInformationGathering.Generallyspeaking,inlargedataset,therearevariousclassificationrules,andwiththeaimoffindingoutthoserules,AutomaticClassificati
6、oniSknowntobeofavitalresearchissue.Broadapplicationsofclassificationcanbefoundinfollowingfields:TextCategorization,Bioinformatics,CustomerRelationManagement,creditapproval、targetmarketing,store20cation.treatmenteffectivenessandmedicaldiagnosisetc,Inthisthesis,theauthorcarri
7、esoutadeepandcomprehensiveanalysistowardsautomaticclassificationproblem:discussingitSintension(ClassifierConstruction).extension(FeatureSelection。RuleExtraction)andmathematicalfoundation;summarizingthecurrentresearchsituation,relativeW0rk,someup—to—datetechnologiesanddevelo
8、pments.Andthethesisalsoconcentratesonpresenthotresearchissuesofclassificationinclu
此文档下载收益归作者所有