基于语义的决策树挖掘算法研究

基于语义的决策树挖掘算法研究

ID:34142798

大小:2.12 MB

页数:55页

时间:2019-03-03

基于语义的决策树挖掘算法研究_第1页
基于语义的决策树挖掘算法研究_第2页
基于语义的决策树挖掘算法研究_第3页
基于语义的决策树挖掘算法研究_第4页
基于语义的决策树挖掘算法研究_第5页
资源描述:

《基于语义的决策树挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、中国石油大学(华东)硕士学位论文基于语义的决策树挖掘算法研究姓名:褚希申请学位级别:硕士专业:计算机应用技术指导教师:时念云20080501摘要传统决策树算法通过计算属性的信息熵来选择属性,信息熵大的属性被优先选取构造决策树。在计算信息熵时,它仅考虑语法层面上字、词的简单匹配,没有考虑数据的语义信息,缺乏对其所包含语义信息的理解,这就导致算法缺乏一定的智能性,致使计算工作量大、复杂性强,而且分类质量不高。特别是在大数据库的应用上,传统的决策树算法更加面临大数据量计算的挑战。本文在分析研究决策树挖掘算法及知网、概念树、语义相似度等相关知识的基础上,针对传统决策树挖掘算法的

2、不足,提出了基于语义的决策树挖掘思想,实现了连续属性语义化和名词型属性语义化的方法,建立了基于语义的决策树挖掘模型。基于语义的决策树挖掘模型较好的利用YN练数据中属性的语义信息,满足用户基于语义的决策树挖掘的需求,实现了一定程度的智能挖掘。实验表明基于语义的决策树挖掘模型能够解决传统决策树挖掘缺乏语义信息的问题、提高数据挖掘系统的知识表示能力,较之传统的决策树挖掘具有更高的效率和预测准确率。关键词:数据挖掘,决策树,概念树,语义,智能ResearchoftheDecisionTreeinDataMiningBasedonSemantemeChuXi(ComputerAp

3、plicationTechnology)DirectedbyAssociateProf.ShiNianyunAbstract硼btraditionaldecisiontreealgorithmtakesinformationgainastheruletochoosetheattributeforclassification.,111eattributethathasthebiggestvalueofinformationgaincallbeselectedfirstlytobuildthedecisiontree.Whilecalculatingthevalueofin

4、formationgai玛thetraditionaldecisiontreealgorithmdoesnotincludesemanticinformation,itonlysimplyconsidersthewords’andcharacters’matchingingrammar,italsolacksoftheunderstandingofthosesernantemeinformationcontainedint11edata.Alloftheaboveresultinlackofintelligenceandleadtoheavycalculation,th

5、ecomplexityandthelow-qualityofclassificationandSOon.Furthermore,thetraditionaldecisiontreealgorithmwillfaceamorebigchallengeforthelargedatabase.Based011theanalysisofthedecisiontreealgorithmandthecorrespondingconceptsuchasHowNet,hierarchytree,sernantemesimilarityandSOon,thispaperproposesa

6、newdecisiontreealgorithmbasedonsernanteme.Thenewalgorithmpresentsthemethodofseparationofcontinuous—attributesandsemantizationofsubstantival-attributes,andbuildsupthesemanteme—baseddecisiontreemodelfordatamining.Thesemanteme-baseddecisiontreemodelCanbetterusethesemantemeinformationaboutth

7、eattributesindatasets;itcallalsomeettheusels’needofdataminingbasedonthesemanteme.Toacertainextent,thesemanteme-baseddecisiontreemodelCanachieveintelligentdatamining.硼1eresultsoftheexperimentsshowthatthesemanteme.baseddecisiontreemodelCannotonlysolvetheproblemoflackingofth

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。