资源描述:
《数据挖掘技术在web预取中的应用研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第24卷 第4期计 算 机 学 报Vol.24No.42001年4月CHINESEJ1COMPUTERSApr.2001数据挖掘技术在Web预取中的应用研究徐宝文 张卫丰(东南大学计算机科学与工程系 南京210096)(武汉大学国家软件重点实验室 武汉430072)摘 要WWW以其多媒体的传输及良好的交互性而倍受青睐.虽然近几年来网络速度得到了很大的提高,但是由于接入Internet的用户数量剧增以及Web服务和网络固有的延迟,使得网络越来越拥挤,用户的服务质量得不到很好的保证.为此文中提出了一种智能Web预取技术,它能够加快用户浏览W
2、eb页面时获取页面的速度.该技术通过简化的WWW数据模型表示用户浏览器缓冲器中的数据,在此基础上利用数据挖掘技术挖掘用户的兴趣关联规则,存放在兴趣关联知识库中,作为对用户行为进行预测的依据.在用户端,智能代理负责用户兴趣的挖掘及基于兴趣关联知识库的Web预取,从而对用户实现透明的浏览器加速.关键词WWW,互联网,数据模型,数据挖掘,预取中图法分类号:TP391ApplyingDataMiningtoWebPre-FetchingXUBao2WenZHANGWei2Feng(DepartmentofComputerScienceandEnginee
3、ring,SoutheastUniversity,Nanjing210096)(NationalKeyLaboratoryofSoftwareEngineering,WuhanUniversity,Wuhan430072)AbstractWWWispopularforitsmultimediatransmissionandfriendlyinteractivity.Althoughthespeedofnetworkhasbeenimprovedconsiderablyinrecentyears,therapidexpansionofusingth
4、eInternet,theinheritedcharacterofdelayinthenetworkandtheRequestöResponseworkingmodeofWWWstillmaketheInternettrafficveryslowandgivenoguaranteeontheQualityofService.BecauseHTTPhasnostates,thewebservercannotknowtheusers'demandandtheusers'requestscannotbepredicted.Takingadvantage
5、ofacachemechanismandthetimelocalityofWWWaccesses,thebrowsercanpreservethedocumentseveraccessedinthelocalmachine.Bythismeans,forthedocumentsinthelocalcache,thebrowserdoesnotneedtosendtherequeststotheremoteserverortoreceivethewholeresponsesfromtheremoteone.Pre2fetchingusesthesp
6、acelocalityofaccesses.First,theusers'accessrequestsarepredictedaccordingtotheusers'currentrequest.Secondly,theexpectedpagesarefetchedintothelocalcachewhentheuserisbrowsingthecurrentpage.Finally,theuserscanaccessthesepagesdownloadedfromthelocalcache.Andthiscanreducetheaccessde
7、laytosomedegrees.Pre2fetchingisonekindofactivecachesthatcancachethepageswhicharestillnotrequestedbytheuser.Theapplicationofpre2fetchingtechnologyinthewebcangreatlyreducethewaitingtimeafterusershavesenttheirrequests.Thispaperbringsforwardanintelligenttechniqueofwebpre2fetching
8、,whichcanspeedupfetchingwebpages.Inthistechnique,weuseasimplifiedWWW