web数据挖掘及其教育应用

web数据挖掘及其教育应用

ID:17822637

大小:1.54 MB

页数:91页

时间:2018-09-06

web数据挖掘及其教育应用_第1页
web数据挖掘及其教育应用_第2页
web数据挖掘及其教育应用_第3页
web数据挖掘及其教育应用_第4页
web数据挖掘及其教育应用_第5页
资源描述:

《web数据挖掘及其教育应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Web数据挖掘及其教育应用华中师范大学信息技术赵呈领教授E-mail:zhcling@mail.ccnu.edu.cn目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。Web数据挖掘教育应用4Web数据挖掘概述1Web结构挖掘2Web内容挖掘35Web日志挖掘目前国内外很多人都采用该方法来研究某领

2、域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。Web挖掘就是采用数据挖掘等信息处理技术,从Web信息资源及Web使用记录中发掘对特定用户感兴趣的、有用的信息或知识的过程,其结果可以为用户决策所使用。这里所讲的Web信息,从广义上讲,包括Web文本,Web图片,Web动画(如Flash广告,视频信息)等。这里主要探讨Web文本挖掘。

3、1.1相关概念1、什么是Web数据挖掘(Web挖掘)目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。(1)网络信息搜集的需求与收集结果低效性的矛盾迫切需要对网络资源的整序与检索。(2)传统数据挖掘和文本挖掘技术的不断完善和应用。1.1相关概念2、Web挖掘产生的原因目前国内外很多人都采用该方法来

4、研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。(1)站点/主页/门户(Website/Homepage/InformationPort(2)ISP(InternetServiceProvider,Internet服务提供商)(3)IP地址/域名(4)搜索引擎/元搜索引擎(SearchEngine/MetaSearchEng

5、ine)(5)标签(Tag)(6)URL(统一资源定位器UniformResourceLocator)1.1相关概念3、Web挖掘相关概念目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。(7)链接(Hyperlink)(8)日志(Log)(9)会话(Session)(10)网络蜘蛛(WebSpi

6、der/Crawler)(11)Cookie1.1相关概念3、Web挖掘相关概念目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。(1)按挖掘内容语种:中文Web挖掘、西文Web挖掘;(2)按挖掘的终点的属性:企业门户挖掘、政务门户挖掘、个人站点挖掘;(3)按挖掘对象:Web结构挖掘、Web内容挖

7、掘和Web日志挖掘。1.2Web挖掘内容1、Web挖掘内容分类目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。