Web访问挖掘研究

Web访问挖掘研究

ID:36475936

大小:2.03 MB

页数:70页

时间:2019-05-11

Web访问挖掘研究_第1页
Web访问挖掘研究_第2页
Web访问挖掘研究_第3页
Web访问挖掘研究_第4页
Web访问挖掘研究_第5页
资源描述:

《Web访问挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、东南大学博士学位论文Web访问挖掘研究姓名:宋爱波申请学位级别:博士专业:计算机应用技术指导教师:董逸生20030801于Petri网方法。这两种方法,都不需要用户的参与协作,完全是自动的。基于Petri网方法,具有直观性和不需要反复计算推荐集合的优点,而且Petri网能很自然的描述web中的多内容并发显示和并发浏览。关键词数据挖掘web访问挖掘个性化站点管理Petri网IIResearchonWebAccessMiningAbs仃actToday,theWorldWideWebisrapidlyemergingasanimportantmedium

2、forthedissemination,exchange,andgettingofinformation.Accordingtomostpredictions,themajorityofhumaninformationwillbeavailableontheWebintenyears.Thesehugeamountsofdataraiseagrandchallenge,namely,howtoturntheWebintomoreusefulinformationutility.Atpresent,themaintoolsofgettinginform

3、ationarestillsearchengines.Today’Ssearchengines,however,areplaguedbythefollowingfourproblems:thelowprecisionproblem;thelowrecallproblem;Alimitedqueryinterfacethatisonlybasedonkeyword—orientedsearch,andhavenofunctionofcustomizationtoindividualusers.Theseproblems,inturn,Canbeattr

4、ibutedtothefollowingcharacteristicsoftheWeb.Firstandforemost,theWebisahuge,diverseanddynamiccollectionofinterlinkedhypertextdocuments.Furthermore,itiswidelybelievedthat99%oftheinformationontheWebisofnointerestto99%ofthepeople.Second,exceptforhyperlinks,theWebislargelyunstructur

5、ed.Finally,mostinformationontheWebisintheformofHTMLdocumentsforwhichanalysisandextractionofcontentisverydifficult.Therefore,itisnoteasytoovercomeallproblemscausedbysearchengines.Inthisthesis,weusewebaccessminingtodiscoverlaserbrowsingpatternssuchasaims,interests,andpreferences.

6、Thenthesepatternsareutilizedinimprovingthestructureofwebsitesandthemannerofwebservice.Thus,wecallhelpusersgettingwhattheyneedmoreeasilybypersonalizedinformationserviceandautomatedsiteadministration.ItisalsoimportantforE—commercetominethewebaccessdata.Thesignificanceliesinimprov

7、ingthecustomerrelationshipmanagement,assistinginmakingdecisionandsecuritymanagement,andhelpingmerchandisersimplementingaone-to-ODemarketingstrategy.Thedissertationiscomposedofthefollowingparts:(1)Wediscussvariousproblemsmetduringdatapreparinginwebaccessmining,thengiveasimplemet

8、hodtoidentifyuseraccesstransactionsaccordingtohostaddr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。