语义web使用挖掘研究

语义web使用挖掘研究

ID:27103169

大小:4.32 MB

页数:71页

时间:2018-12-01

语义web使用挖掘研究_第1页
语义web使用挖掘研究_第2页
语义web使用挖掘研究_第3页
语义web使用挖掘研究_第4页
语义web使用挖掘研究_第5页
资源描述:

《语义web使用挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号学号M201072373学校代码10487密级硕士学位论文语义Web使用挖掘研究学位申请人:王蒙蒙学科专业:计算机软件与理论指导教师:曹忠升副教授答辩日期:2013年1月23日AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringResearchonSemanticWebUsageMiningCandidate:WangMengmengMajor:ComputerSoftwareandTheorySupe

2、rvisor:AssociateProf.CaoZhongshengHuazhongUniversityofScienceandTechnologyWuhan430074,P.R.ChinaJanuary,2013独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位

3、论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在_____年解密后适用本授权书。本论文属于不保密□。(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日华中科技大学硕士学位论文摘要随着Web技术的快速发展及广泛应用,Internet上的Web页面数

4、目开始呈指数级的速度增长,如何结合语义知识来挖掘分析用户对Web页面的访问行为成为一个重要的研究方向。这里分别从用户的Web使用日志信息和Web页面内容信息着手,从语义距离计算、语义挖掘算法和结果序列的语义相似度分析这三个方面展开研究。在语义距离计算方面,在已有的计算方法的基础上加入页面在日志数据中的出现概率信息,由页面在本体层次树中的深度、分支度和出现概率这三个因素共同决定结点页面的语义权值,进而得到任意两个页面间的语义距离信息。实验表明,改进后的语义权值计算方法得到的结果更加合理和全面。在语义挖掘算法方面,结合Mabrou

5、keh提出的使用语义距离来辅助挖掘的理论思想,考虑到日志数据中访问时间的有序性,以吴海燕提出的AprioriAll算法的连接条件为基础,加入改进后计算得到的语义距离信息,即在算法的连接步中除了要满足已有的连接条件外还需要考虑两个连接页面的语义距离,如果大于给定的语义距离值,则不再执行连接操作。实验表明,改进后的算法挖掘得到的频繁语义访问序列具有一定的语义相关性,算法的计算规模和执行时间也得到了一定程度的改善。在结果序列的语义相似度分析方面,结合本体和本体映射的相关理论,给出一种新的页面本体的定义形式,以页面前导符的形式按照页面

6、内容关键词信息将所有的页面统一组织,通过对比前导符、关键词及其他本体因素的相似度来综合得到页面内容的语义相似程度,以此来对挖掘得到的访问序列进行语义相似度的分析。关键词:网络页面,页面本体,序列模式挖掘算法,语义距离,语义权值I华中科技大学硕士学位论文AbstractWiththerapiddevelopmentandwideapplicationofwebtechnology,thenumberofwebpagesontheInternetisgrowingwithanexponentialspeed,thenhowtoco

7、mbinethesemanticknowledgeandtheminingmethodstoanalyzeusers’behaviorhasbecomeanimportantresearchdirection.Hereweusetheweblogsandthecontentofwebpagestodotheresearch,whichincludesthecalculationofsemanticdistance,thesemanticminingalgorithmandthesemanticsimilarityofthere

8、sultingsequences.Onthecomputationofsemanticdistance,weaddtheprobabilitywhichtheWebpagesoccurredinthelogweanalyzedtotheexistingmethod.Thent

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。