多维关联规则挖掘在径流长期预报中应用

多维关联规则挖掘在径流长期预报中应用

ID:38286427

大小:735.95 KB

页数:3页

时间:2019-06-01

多维关联规则挖掘在径流长期预报中应用_第1页
多维关联规则挖掘在径流长期预报中应用_第2页
多维关联规则挖掘在径流长期预报中应用_第3页
资源描述:

《多维关联规则挖掘在径流长期预报中应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第40卷第19期人民长江Vol.40,No.192009年10月YangtzeRiverOct.,2009文章编号:1001-4179(2009)19-0065-03多维关联规则挖掘在径流长期预报中的应用12王富强许士国(1.华北水利水电学院水利学院,河南郑州450011;2.大连理工大学土木水利学院,辽宁大连116024)摘要:关联规则是一种重要的数据挖掘技术。结合水文长期预报的特殊性,将多维关联规则挖掘方法应用于径流长期预报中。首先根据预报目标初选预报因子,构成长期预报事务数据集。然后对连续属性值进行属性分割,对处

2、理后的数据集进行多维关联规则分析,挖掘出满足最小支持度和最小置信度的强关联规则,解释规则并建立模型。以嫩江江桥站汛期径流量长期预报为例,挖掘出满足要求的强关联规则,这些规则中蕴含着太阳黑子活动、北太平洋海温以及副高强度变化与江桥汛期径流量的关系,说明了多维关联规则挖掘方法应用于径流长期预报研究的可行性。关键词:物理因子;多维关联规则;数据挖掘;长期预报中图分类号:P338文献标识码:A现今,随着水文中长期预报研究的逐步深入和数据库技术的关联规则问题。关联规则是发现交易数据库中不同商品的迅速发展,人们积累的数据资料的数量

3、和种类也迅速增长,信(项)之间的关系,由这些规则找出顾客购买行为模式,如购买息量不断增大,数据间关系日益复杂,数据信息大量存储在关系某一商品对购买其它商品的影响。发现这样的规则可以应用于数据库或数据仓库中。如何存储、管理和检索利用信息就成为商品货架的设计、货存安排以及根据购买模式对用户进行分类。[2,5]水文中长期预报研究中面临的一个问题。如何从众多的信息中关联规则的基本模型描述如下:将有用的部分提取出来,并按照长期预报的要求进行组织是需设有事务数据库D={T1,T2,…,Tn},Tj(j=1,2,…,n)称[1]要解

4、决的又一个问题。传统的水文中长期预报模式已经不为事务T;构成T的元素ik(k=1,2,…,p)被称为项;设D中所能适应海量数据的需要,同时从信息处理角度,人们更希望计算有项的集合为I={i1,i2,…,im},显然TI。机能帮助分析数据、理解数据,帮助我们基于丰富的数据做出决(1)概念1。项集与频繁项集。设A={i1,i2,…,it}(1≤t≤策,做人力所不能及的事情。数据挖掘就是一种从大量、有噪声m),则A称为D中的一个项集,且为t项集。项集A的支持度就是的数据中提取隐含在其中、事先未知,但又是潜在有用的信息和D中

5、包含A的事务在D的所有事务中所占的百分比,即:[2]知识的有效分析技术。|{T:AT,T∈D}|Support(A)==P(A)(1)先前对水文数据单维频繁项集关联规则的挖掘已不能满足|D|人们的要求,人们越来越迫切地希望能从多维频繁项集中挖掘如果A的支持度满足最小支持度阈值min_Support,即出多维关联规则,来帮助人们进行各种决策[3]。以径流长期预Support(A)≥min_Support,则A称为D中的频繁项集。报为例,径流的前期影响因子涉及天文、海温以及环流等多个属(2)概念2。关联规则。关联规则是形

6、如AB的蕴含式,其性维,不可能只从一种影响因子中提取预报所需的全部信息,这中A和B都是D的项集,且A∩B=Φ。A称为关联规则的条件,就需要从存储径流影响因子的数据库中挖掘出有用的、满足预B称为关联规则的结论。报要求的多维关联规则,以便做出更有效的预测。基于此,结合(3)概念3。支持度与可信度。关联规则AB的支持度就是径流长期预报的特点,将多维关联规则挖掘技术应用到径流长同时包含项集A和项集B的事务在D的所有事务中所占的百分期预报工作中,以江桥汛期径流长期预报为例进行分析,建立了比,也就是项集A∪B的支持度。基于多维

7、关联规则的径流长期预报概念模型,结果说明了多维Support(AB)=|{T:A∪BT,T∈D}||D|关联规则挖掘方法应用于径流长期预报的可行性。=Support(A∪B)=P(A∪B)(2)1关联规则的基本概念关联规则AB的可信度就是同时包含项集A和项集B的事务在所有包含项集A的事务中所占的百分比。1.1模型描述|{T:A∪BT,T∈D}|[4]Confidence(AB)=Agrawal在1993年提出了挖掘顾客交易数据库中项集间|{T:AT,T∈D}|收稿日期:2009-07-26基金项目:“十一五

8、”国家科技支撑计划项目(2006BAD20B06);水利部公益性行业科研专项(200801015)和“华北水利水电学院高层次人才项目”(003014)联合资助作者简介:王富强,男,华北水利水电学院水利学院,讲师,博士。66人民长江2009年2Support(AB)勒呼里山,河长1370km,流域面积29.7万km。嫩江流域的==

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。