基于决策树的网站知识发现

基于决策树的网站知识发现

ID:41734945

大小:51.09 KB

页数:4页

时间:2019-08-31

基于决策树的网站知识发现_第1页
基于决策树的网站知识发现_第2页
基于决策树的网站知识发现_第3页
基于决策树的网站知识发现_第4页
资源描述:

《基于决策树的网站知识发现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于决策树方法的网站知识发现张裕钦(广东工业大学计算机学院,广东广州510090)摘要:决策树方法作为一种重要的数据挖掘方法,在知识发现领域里有着广泛的应川.本文在分析了当前网站中知识发现的重要性后,接着介绍了决策树算法以及构建决策树的方法.最后通过一个实例演示了决策树算法在网站知识发现中的应用.关键字:知识发现;Web数据挖掘;决策树;网站KnowledgeDiscoveryinWebsiteBasedonDecisionTreeApproachZhangYuQin(CollegeofComputer,GuangdongUniversityofTechnol

2、ogy,GuangzhouGuiingdong51009(),china)AbstractDecisiontreeapproachisanimportantmethodindataminning・Thispaperexpressestheimportanceofknowledgediscorveryinwebsite,andthenpresentsthedecisiontreealgorithmandtheprocessofdecisiontreebuilt.Finally,throughaninstancejhepapershowsaapplicationo

3、fdecisiontreeapproachinknowledgedicoveryinwebsite・KeywordsKnowledgedicovery;Webdatamining;Decisiontree;Website1引言随着信息技术的迅速发展‘Internet在深度和广度方面正在进行飞速发展,并以前所未冇的方式改变着人们的生活方式.这使得WWW上的一些主耍工作,如:网站设计,Web服务设计,电子商务等工作变得越來越复杂和越來越繁戡.互联网带给人们海量信息的同时,却让人们感觉知识的贫乏.其中很大一部分原因是因为人们在而对如此海量信息的时候,却不知道如何下手

4、去发现自己需要的知识,更不用说去挖掘出隐藏在大量信息后面的更深层的知识。因此,怎样从海最的数据信息「I1发现冇用的、潜在的知识便成了当前研究的热点.知识发现是指从数据集中识别正确、新颖、有潜在应川价值以及最终可为人们理解的模式的方袪山.其核心部分是数据挖掘.对于Web上的知识发现又可分为:基于Web内容的数据挖掘、基于Web结构的数据挖掘、基于Web访问的数据挖掘㈤.其中基于Web访问的数据挖掘,即Web使用挖掘,是研究川户Web浏览行为的技术和工貝,理解访问者■的浏览兴趣是捉高Web服务质杲和改善站点结构设计的重要环节.通过分析和探究用户访问情况屮的规律,可

5、以识別电子商务的潜在客户,增强对最终用八的因特网信息服务的质屋和交付,并改进web服务器系统的结构和性能⑶.分类在数据挖掘中是一项非常重要的任务,目前在商业上应川最多.分类的目的是学会一个分类的函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定的类别中的某一个.分类和回归都可用于预测.预测的目的是从利用历史数据库中的H动推导出对给定数据的推广描述,从而能对未來数据进行预测.基丁•机器学习原理的决策树分类法是一种常用的分类器构造方法,它对应的知识表示为决策树⑷.,决策树是一种常用于预测模型的算法,它通过将大量数据冇目的地分类,从中找到一些具

6、有商业价值的,潜在的信息⑸.2发现用户网站使用中的知识当前,随着动态网页技术的迅速发展.Internet上的网站基本都是采用动态网站技术來实现,并同时建立了相对安全、较完善的用户访问控制体系•比如:通过记录用户的详细访问日志来监控用户使用网站的借况和网站的运行借况.对于商业网站,更是建立了更加完善的会员管理系统,來更好的管理客户和提供齐类服务.对于服务器的日志格式一般都遵从W3C标准,如表1所示.表1日志格式字段描述DateDate.time,andtimezoneofrequestClientIPRemotehostIPand/orDNSentryUsern

7、ameRemotelognameoftheuserBytesBytestransfcrrcd(scntandreceived)ServerServernamc.IPaddressandportRequestURIqueryandstemStatushttpstatuscodereturnedtotheclientServicenameRequestedservicenameTimetakenTimetakenfortransactiontocompleteProtocolversionVersionofuserdtransferprotocalUseragen

8、tServiceproviderCoo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。