数据挖掘英文论文数据挖掘的论文

数据挖掘英文论文数据挖掘的论文

ID:22785827

大小:67.50 KB

页数:8页

时间:2018-10-31

数据挖掘英文论文数据挖掘的论文_第1页
数据挖掘英文论文数据挖掘的论文_第2页
数据挖掘英文论文数据挖掘的论文_第3页
数据挖掘英文论文数据挖掘的论文_第4页
数据挖掘英文论文数据挖掘的论文_第5页
资源描述:

《数据挖掘英文论文数据挖掘的论文》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、数据挖掘英文论文数据挖掘的论文Web数据挖掘中XML的应用研究摘要:网络的普及基于信息的获取,随着Html技术的发展,数据信息与日俱增.面对浩瀚如烟的信息,要想得到想要的、有用的的信息,必须要对Web信息进行挖掘。而对于Html语言的数据,结构性很差,Web数据挖掘工作很难满足搜索的需要。XML语言的出现极大的改观了这一现状。由于它具有良好的结构性、层次性,所以利用它组织网络页面信息,更有利于进行数据挖掘工作。通过对XML语言的介绍,提出一个基于XML的WebMiner模型,认识XML在Web数据挖掘中的应用。 

2、 关键词:HTML;XML;电子商务;Web数据挖掘    XMLWebApplicationStudiesInDataMining  NIUYan-cheng1,BAOYing2  (1.LanzhouJiaotongUniversity,Lanzhou730030,China;2.NorthwestNormalUniversity,Lanzhou730070,China)  Abstract:ThepopularizationoftheInternetisbasedontheacquisitionofinfo

3、rmation.AstheHtmltechnologydeveloping,anumberofdatainformationisgrowing.Facingwiththemassiveinformation,wemustexploretheWebinformationthatwewantedanduseful.ButfortheHtmllanguagedata,itsstructureisverypoor.SotheexplorationoftheWebdataishardtomeettheneedsofsear

4、ching.TheemergenceoftheXMLlanguagehaschangedthatsituationgreatly.XMLlanguagehasgoodstructuralpropertyandorganizationalproperty,whichusedfororganizingthenetworkinformationismoreconducivetothedataminingwork.ThegoalofthispaperistorecommendaMinermodelbasedonXMLWe

5、bbytheintroduceoftheXMLlanguageandtoknowtheapplicationofXMLWebinthedatamining.  Keywords:HTML;XML;e-commerce;webdatamining  随着Internet的迅速发展与普及,我们进入了一个数据信息时代。当我们在互联网上搜索自己想要的信息时,面对浩瀚如烟的数据,我们由于缺乏有效的工具与方法,常常会有这样的感觉,如此庞大的信息,却没有我们想要的信息。如此,就有了“入宝山而空手返”的遗憾。于是一项新的挑战,新

6、的技术被提了出来。在这信息爆炸的时代,我们如何才能从中提取有用的信息,提高信息的利用率呢?当今,网络搜索引擎,解决了一部分的问题,但是由于其精确度不高,所以很难让用户满意。Web数据挖掘(WebDataMining)技术应运而生,已经产生了一些产品,可以对Internet上的信息进行筛选,但是数据库上的数据时结构化的数据,而Web上的数据是无结构化或半结构化的,所以,对Web上信息的挖掘要比对数据库中信息挖掘难的多。这就需要先对页面信息进行重组。  1HTML与XML  HTML(HyperTextMark-up

7、Language)即超文本标记语言,是WWW的描述语言,由TimBerners-lee提出,HTML对整个WWW的发展、知识与信息的流通起了关键的作用,HTML成了Internet上通行最广的标准格式。HTML是一种面向数据显示样式的标签语言,主要描述文档的标题、字体、颜色等外观方面的属性,由于HTML语言的特点,在进行Web页面信息的开发时,站点的数据都是由开发人员自行设计放置的,HTML只提供如何在浏览器中显示信息的方式,并没有反映数据本身所包含的语义。HTML数据本身具有自描述性和动态可变性等一系列复杂的特

8、性。在这种情况下,进行WEB数据挖掘,复杂性是非常高的,所以很难做到精确搜索。  XML全称是ExtensibleMarkupLanguage(可扩展标示语言),它不像HTML那样有固定的形式,所以是得SGML标准能在互联网上应用自如。XML并不是一个独立的、预定义的标识语言,它属于一种元语言,即用来描述其他语言的语言。XML允许用户自己设计自己的标识,必然与其他许多技术

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。