基于xml的web数据挖掘技术系统框架的设计81469

基于xml的web数据挖掘技术系统框架的设计81469

ID:34097553

大小:167.16 KB

页数:3页

时间:2019-03-03

基于xml的web数据挖掘技术系统框架的设计81469_第1页
基于xml的web数据挖掘技术系统框架的设计81469_第2页
基于xml的web数据挖掘技术系统框架的设计81469_第3页
资源描述:

《基于xml的web数据挖掘技术系统框架的设计81469》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、!"#"$!%&’$()研究与开发)"*"+,-."(/01.$2+3%4/5%%%%6("/6%(基于&’(的%78数据挖掘技术系统框架的设计关冰核工业培训中心计算机系!北京!"""#$摘要!互联网的广泛应用使%&’数据挖掘成为当前数据挖掘技术研究的热点"但由于%&’数据存在方式的特殊性使%&’数据控制变得十分复杂!而()*的出现为%&’数据挖掘技术带来了巨大的发展契机"()*正逐渐成为新一代互联网数据组织和交换的事实标准!两者的结合$#$基于()*的%&’数据挖掘技术成为%&’数据挖掘中一个重要的研究课题%文

2、章分析了%&’数据挖掘技术的难点!提出了一个基于()*的%&’内容数据挖掘系统框架"关键词&()*&%&’&数据挖掘’()*$+,-.+$/0-12$)34506#$%2.*.7353548$9:50;04(<.)$=05>7?@%)*-.9*&+,&-./&01&23.45&64&5789&1-&’/8587.4.4:5,&;26&23;066&45/8587.4.4:5&;,42<2:=6&!1&86;,>?055,&1@&;.8<.5=23-&’/858&A.15.4:3267789&1-&’/858;24

3、562<;27@<&A>+,&8@@&8684;&23()*’6.4:1:6&852@@26504.5=326-&’/8587.4.4:5&;,42<2:=>()*.1’&.4:5,&1584/86/23.45&64&5/85826:84.B.4:84/&A;,84:.4:.472/&645.7&1>+,&;27’.4.5.24235,&5-2$$-&’/8587.4.4:5&;,42<2:=’81&/24()*’&;27&18.7@2658456&1&86;,52@.;.4-&’/8587.4.4:>+,&@8

4、@&6848<=1&15,&/.33.;0<.5.&1.4-&’/8587.4.4:5&;,42<2:=84/@6&1&4518/8587.4.4:1=15&73687&-269’81&/24()*>A$(/0-=)&()*C%&’CD858).4.4:!引言准!并且大量的&’(数据将很快出现在!"$上"&’(随着互联网的飞速发展!!"#上的数据量急剧膨数据模型与半结构化数据的对应非常明显)可以说胀!但是其中蕴含的知识却未能得到充分的挖掘和利*’(数据是%%%上的半结构数据"因此基于*’(的用!因此将传统的数据挖

5、掘技术和!"$结合起来!进行%"#数据挖掘可以充分利用*’(的特点进行%"#数%"$数据挖掘成为数据挖掘技术研究的热点"目前据挖掘"&’(正逐渐成为新一代互联网数据组织和交换的标"#$%数据挖掘的难点!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!比较好的解决与用户的沟通不及时#用户试用期间积1/-王要武.管理信息系统.电子工业出版社)/002.极性的问题及时与用户交流可以达到开发出的产品与12-薛华成.管理信息系统.清华大学出版社)/002.用户的需求最紧的粘合"系统的建设不是

6、一朝一夕的13-张建林.管理信息系统.浙江大学出版社)/003.事情!有很多单位!在信息化建设中!存在操之过急的14-杨善林)刘业政.管理信息学.高等教育出版社)现象!往往会造成更大的返工"反而更降低了信息化建/002.设的速度!即成欲速则不达"15-李大军.商业的管理信息系统.清华大学出版社)/00/.参考文献16-黄海嵩.企业信息化建设指南.安徽科学技术出+,-武俊达.管理信息系统.重庆大学出版社)/00/.版社)/00/.BB电脑知识与技术认证考试!"#"$!%&’$()研究与开发01.$2+3%4/5%%

7、%%6("/6%()"*"+,-."(/相对于&’(的数据而言!传统的数据库中的数据-./01’.#2345/和6’.478/139’:&’(;<’854等"这些&’(结构性很强!即其中的数据为完全结构化的数据!而内容的挖掘系统主要采用对搜索引擎搜索出的页面文&’(上的数据最大特点就是半结构化"所谓半结构化档提取关键信息进行数据挖掘"但是目前的搜索引擎是相对于完全结构化的传统数据库的数据而言"显然!虽然采用了各种方法来提高检索结果的精度!但是结面向&’(的数据挖掘要比面向单个数据仓库的数据挖果中仍然包括了与用户请

8、求不相关的文档!其比例高掘要复杂得多"达=>?以上"并且当前&’(内容挖掘系统大多缺少用)*+异构数据库环境户交互!不能满足用户个性化的&’(挖掘"而&’(上从数据库研究的角度出发,&’(网站上的信息也半结构化数据和异构数据源问题使得从页面文档准确可以看作是一个数据库!而且是一个更大#更复杂的数提取关键信息比较困难"据库"&’(上的每一个站点就是一个数据源!每个数据针对现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。