《Web挖掘技术》PPT课件

《Web挖掘技术》PPT课件

ID:38604311

大小:655.00 KB

页数:88页

时间:2019-06-16

《Web挖掘技术》PPT课件_第1页
《Web挖掘技术》PPT课件_第2页
《Web挖掘技术》PPT课件_第3页
《Web挖掘技术》PPT课件_第4页
《Web挖掘技术》PPT课件_第5页
资源描述:

《《Web挖掘技术》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘原理与算法第七章Web挖掘技术1ChineseAcademyofScience第七章Web挖掘技术7.1Web挖掘的意义7.2Web挖掘的分类7.3Web挖掘的含义7.4Web挖掘的数据来源7.5Web内容挖掘方法7.6Web访问信息挖掘方法7.7Web结构挖掘方法2ChineseAcademyofScience7.1Web挖掘的意义从大量的信息中发现用户感兴趣的信息:因特网上蕴藏着大量的信息通过简单的浏览或关键词匹配的搜索引擎得到的是孤立而凌乱的“表面信息”Web挖掘可以发现潜在的、丰富的关联

2、信息。3ChineseAcademyofScience7.1Web挖掘的意义将Web上的丰富信息转变成有用的知识:Web挖掘是面向Web数据进行分析和知识提取的。因特网中页面内部、页面间、页面链接、页面访问等都包含大量对用户可用的信息,而这些信息的深层次含义是很难被用户直接使用的,必须经过浓缩和提炼。4ChineseAcademyofScience7.1Web挖掘的意义对用户进行信息个性化:网站信息的个性化是将来的发展趋势通过Web挖掘,可以达到对用户访问行为、频度、内容等的分析可以得到关于群体用户访问

3、行为和方式的普遍知识,用以改进Web服务方的设计,提供个性化的服务5ChineseAcademyofScience第七章Web挖掘技术7.1Web挖掘的意义7.2Web挖掘的分类7.3Web挖掘的含义7.4Web挖掘的数据来源7.5Web内容挖掘方法7.6Web访问信息挖掘方法7.7Web结构挖掘方法6ChineseAcademyofScience7.2Web挖掘的分类Web挖掘依靠它所挖掘的信息来源可以分为:Web内容挖掘(WebContentMining):对站点的Web页面的各类信息进行集成、概化

4、、分类等,挖掘某类信息所蕴含的知识模式。7ChineseAcademyofScience7.2Web挖掘的分类Web挖掘依靠它所挖掘的信息来源可以分为:Web访问信息挖掘(WebUsageMining):Web访问信息挖掘是对用户访问Web时在服务器方留下的访问记录进行挖掘。通过分析日志记录中的规律,可以识别用户的忠实度、喜好、满意度,可以发现潜在用户,增强站点的服务竞争力。8ChineseAcademyofScience7.2Web挖掘的分类Web挖掘依靠它所挖掘的信息来源可以分为:Web结构挖掘(W

5、ebStructureMining):Web结构挖掘是对Web页面之间的链接结构进行挖掘。在整个Web空间里,有用的知识不仅包含在Web页面的内容之中,而且也包含在页面的链接结构之中。对于给定的Web页面集合,通过结构挖掘可以发现页面之间的关联信息,页面之间的包含、引用或者从属关系等。9ChineseAcademyofScience第七章Web挖掘技术7.1Web挖掘的意义7.2Web挖掘的分类7.3Web挖掘的含义7.4Web挖掘的数据来源7.5Web内容挖掘方法7.6Web访问信息挖掘方法7.7We

6、b结构挖掘方法10ChineseAcademyofScienceWeb挖掘的含义WeB挖掘是一个看宽泛的概念,可以简单地描述为:针对包括Web页面内容、页面之间的结构、用户访问信息、电子商务信息等在内的各种Web数据应用数据挖掘方法以帮助人们从因特网中提取知识,为访问者、站点经营者以及包括电子商务在内的基于因特网的商务活动提供决策支持。11ChineseAcademyofScienceWeb挖掘与信息检索两种截然不同的观点:Web上的信息检索是Web挖掘的一个方面:Web挖掘旨在解决信息检索、知识抽取以

7、及更宽泛的商业问题,是Web上IR技术的延伸。这种观点大多来自于数据挖掘研究领域。Web挖掘是智能化的信息检索:对于IR领域的研究人员来说,Web挖掘是IR研究向着智能化的方向发展的结果。12ChineseAcademyofScienceWeb挖掘与信息检索信息检索可能经常被说成是Web挖掘的初级阶段是为了强调Web挖掘不是简单的信息索引或关键词匹配技术,而是实现信息浓缩成知识的过程,它可以支持更高级的商业决策和分析。13ChineseAcademyofScienceWeb挖掘与信息抽取Web上的IE的

8、研究目的是希望从众多的Web文挡中抽取可供分析的信息,与Web挖掘的关系也有不同的观点:IE是Web挖掘整个过程的一部分:这是因为Web上的数据一般是半结构化或无结构的,因此需要进行规格化的信息抽取这样的预处理。Web挖掘是IE的一个特殊技术:既然IE是希望把Web蕴藏的信息抽取出来,那么Web挖掘或者文本挖掘只不过是达到这个目的的特殊技术手段。14ChineseAcademyofScienceWeb挖掘与信息抽取信息抽取经常被说成是Web

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。