基于信息增益的决策树算法在桥隧群应急决策系统中的应用研究

基于信息增益的决策树算法在桥隧群应急决策系统中的应用研究

ID:36619573

大小:255.35 KB

页数:3页

时间:2019-05-13

基于信息增益的决策树算法在桥隧群应急决策系统中的应用研究_第1页
基于信息增益的决策树算法在桥隧群应急决策系统中的应用研究_第2页
基于信息增益的决策树算法在桥隧群应急决策系统中的应用研究_第3页
资源描述:

《基于信息增益的决策树算法在桥隧群应急决策系统中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、公路交通技术2014年12月第6期TechnologyofHighwayandTransportDec.2014No.6基于信息增益的决策树算法在桥隧群应急决策系统中的应用研究杨少晨,谢耀华(招商局重庆交通科研设计院有限公司,重庆400067)摘要:根据实际需要,研究了一种基于信息增益的决策树构造算法,并将其应用到桥隧群应急决策系统中。数据测试表明,该算法具有较好的准确性。关键词:数据挖掘;决策树;信息增益;应急决策文章编号:1009—6477(2014)06—0088—03中图分类号:U491文献标识码:AResearchonA

2、pplicationofDecisionTreeAlgorithmBasedonInformationGaininEmergencyDecisionSystemofBridge——tunnelGroupsYANGShaochen,XIEYaohuaAbstract:Inaccordancewiththeactualneeds,thispaperstudiesadecisiontreeconstructionalgorithmbasedoninformationgainandappliesitinemergencydecisions

3、ystemofbridge-tunnelgroups.Testofdatashowsthatthealgorithmhasbetteraccuracy.Keywords:datamining;decisiontree;informationgain;emergencydecision基于决策树的分类算法在数据挖掘中的应用非常广泛。决策树具有计算量相对较小、易于提取显1基于信息增益的决策树算法式规则、可以显示重要的决策属性和分类准确率较1.1决策树构造高等优点J。对于决策树的研究目前已经有了很好在信息论中,熵被用来衡量一个随机变量出

4、现的基础,其中较为经典的ID3、C4.5、C5.0等算法均的期望值。变量的不确定性越大,熵也就越大,而要是基于信息增益理论的分类算法,这些算法具有理将其弄清楚所需要的信息量也就越大,故熵是整个论清晰、方法简单且分类速度较快的特点J。在系统的平均消息量。在信息增益中,衡量标准是看此基础上SLIQ算法还实现了对数量庞大的数据进特征能够为分类系统带来多少信息,带来的信息越行分类。在之后提出的SPRINT算法中,更是解决多,该特征就越重要。对一个特征而言,系统有它和了超大规模训练样本集,并引入了并行计算方式来没它时信息量会发生变化,而前后

5、信息量的差值就处理数据。是这个特征给系统带来的信息量,这个信息量就是本文根据重庆两江大桥运营管理系统实际需熵。根据信息论理论,期望信息越小,信息增益就越要,运用决策树算法从原有潜在的、未被有效利用的大,从而有序信息的纯度就越高。因此,为使信息在信息中进行数据挖掘,据此构造出决策树并将其应分裂后获得最大的信息量,使用信息增益度量属性,用于桥隧应急决策系统中。本文将对基于信息增益针对增益最大的属性进行分裂。在重庆两江大桥桥的决策树算法在桥隧群应急决策中的应用进行研隧群应急决策系统构建决策树时,使用ID3算法计究,以有效构造决策树并进行

6、决策支持。算信息增益。基金项目:重庆市应用开发(重大)项目(cstc2013yykfC30001)收稿日期:2014—09—21作者简介:杨少晨(1988一),男,河北省宣化市人,硕士,助工.2014年第6期杨少晨,等:基于信息增益的决策树算法在桥隧群应急决策系统中的应用研究89设E为对数据的类别划分,则E的熵为:info(E)=一∑Alogz(A)(1)式中:A是第i个类别在数据中出现的概率,因信息论中出现概率为人的信息所携带的信息量为-log(A),所以第i个类别所携带的信息量为一A1og:(A);对所有类别进行求和,一∑Ai

7、log(A)为总信息量的估计值。中元组的类标号所需要的平均信息量就是熵。把E按属性划分,期望信息对E的划分为:1Finfo(E)=∑llinfo(Ej)(2)⋯J1图1决策树构造流程将式(1)中E的熵info(E)与式(2)中按对E进行划分后的熵info(E)做差运算,可以得到信息增益:gain(A)=info(E)一in(E)(3)在桥隧群应急决策系统的决策树构建中,需进行多次分裂,因此需计算属性的增益率。信息根据其具有的某个属性分裂时,选择最大增益率属性分裂,得到桥隧群应急决策的决策树。构造决策树时的流程如图1所示J。根据分裂

8、属性即可构造出决策树。基于桥隧群的应急决策树构造考虑以下3种情况。图2重庆两江大桥桥隧群应急决策树1)待分裂属性选择的度量算法为自顶向下递归分治法,并采用不回溯的贪心策略。5)按照上一步确定的分裂属性的所有取值划2)待分裂属性是连续的,故确定一个分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。