欢迎来到天天文库
浏览记录
ID:17822637
大小:1.54 MB
页数:91页
时间:2018-09-06
《web数据挖掘及其教育应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Web数据挖掘及其教育应用华中师范大学信息技术赵呈领教授E-mail:zhcling@mail.ccnu.edu.cn目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。Web数据挖掘教育应用4Web数据挖掘概述1Web结构挖掘2Web内容挖掘35Web日志挖掘目前国内外很多人都采用该方法来研究某领
2、域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。Web挖掘就是采用数据挖掘等信息处理技术,从Web信息资源及Web使用记录中发掘对特定用户感兴趣的、有用的信息或知识的过程,其结果可以为用户决策所使用。这里所讲的Web信息,从广义上讲,包括Web文本,Web图片,Web动画(如Flash广告,视频信息)等。这里主要探讨Web文本挖掘。
3、1.1相关概念1、什么是Web数据挖掘(Web挖掘)目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。(1)网络信息搜集的需求与收集结果低效性的矛盾迫切需要对网络资源的整序与检索。(2)传统数据挖掘和文本挖掘技术的不断完善和应用。1.1相关概念2、Web挖掘产生的原因目前国内外很多人都采用该方法来
4、研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。(1)站点/主页/门户(Website/Homepage/InformationPort(2)ISP(InternetServiceProvider,Internet服务提供商)(3)IP地址/域名(4)搜索引擎/元搜索引擎(SearchEngine/MetaSearchEng
5、ine)(5)标签(Tag)(6)URL(统一资源定位器UniformResourceLocator)1.1相关概念3、Web挖掘相关概念目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。(7)链接(Hyperlink)(8)日志(Log)(9)会话(Session)(10)网络蜘蛛(WebSpi
6、der/Crawler)(11)Cookie1.1相关概念3、Web挖掘相关概念目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进行了统计分析。(1)按挖掘内容语种:中文Web挖掘、西文Web挖掘;(2)按挖掘的终点的属性:企业门户挖掘、政务门户挖掘、个人站点挖掘;(3)按挖掘对象:Web结构挖掘、Web内容挖
7、掘和Web日志挖掘。1.2Web挖掘内容1、Web挖掘内容分类目前国内外很多人都采用该方法来研究某领域的论文产出与分布,发展状况,研究热点的变迁以及发展方向。本文主要利用能够揭示或表达文献核心内容的关键词或主题词在某一领域文献中出现的频次高低来确定该领域研究热点和发展方向的文献计量方法。首先构建了面相学科的主题分析模型;其次为了提高分析的精度,构建了主题词集;最后将主题词集运用到分词与索引中,并进
此文档下载收益归作者所有