在科研评估中运用数据挖掘技术的意义与方法

在科研评估中运用数据挖掘技术的意义与方法

ID:46439414

大小:97.00 KB

页数:3页

时间:2019-11-23

在科研评估中运用数据挖掘技术的意义与方法_第1页
在科研评估中运用数据挖掘技术的意义与方法_第2页
在科研评估中运用数据挖掘技术的意义与方法_第3页
资源描述:

《在科研评估中运用数据挖掘技术的意义与方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、在科研评估中运用数据挖掘技术的意义与方法李志鹏(南京大学信息管理系,江苏南京210093)[摘要]本文论述了文献计量学方法的不足,提出把数据挖掘技术运用于科研评估,并讨论了具体实现方法。[关键词]科研评估数据挖掘文献计量TheSignificanceandMethodofApplicationofDataMiningTechnologyintheEvaluationofScientificResearchLiZhiPeng(DepartmentofInformationManagement,NanjingUniversity,Nanjing210093,Jiangsu,Chin

2、a)AbstractThisarticlediscussesthedrawbacksofbibliometrics,andsuggestsapplyingdataminingtechnologyintheevaluationofscientificresearch・Then,theauthordiscussesseveralmethodstoachieveit.KeywordsEvaluationofScientificResearch;DataMining;bibliometrics科学研究是高等院校、科研院所等学术机构的重要任务。科研机构绩效评估主要根据以卜•一些指标进行:

3、论文数量与质量、专利成果、技术转让、获奖情况以及成果查新等。在构成和反映学术机构科研能力的众多因素中,文献是贯穿于整个科研过程11反映科研能力的主要因索,尤其是科技论文产出的数屋与质量已逐渐成为衡虽一个单位科技实力的璽要指标Z一。文献计量学方法目前已广泛用于评价科学生产力,评价人才、成果质最、科研机构及至整个国家的科技水平与影响力等,使决策者能够进行有效的定量化管理。引文分析方法是文献计量学中最基本的方法,也是冃前最有效的以文献数量与质量测定国家、地区、学科、机构等基础研究发展水平与速度的方法。引文评价可以更好地表现科学研究现状发生变化的情况,为建立一系列评价科学现状与发展的数

4、量标准提供了可能,也可以创造一些特殊的方法以研究科研的现状及其发展进程,描述科学发展的速度[1]。目前,依托SCI,EI,CSCD,CSSCI等引文索引的科技评价指标体系,已在两院院丄推选、基金申请、基金委资助项目后期绩效评估、高校及科研机构职称评审、成果申报、晋级考评、国家重点实验室评估等方面得到广泛应用。然而,文献计量学方法存在着一些H身缺陷,阻碍着科研评价的全面性、公正性和效率。具体表现在:(DF1前的文献计量学方法主耍是利用数据库管理系统的查询、检索及报表功能,与多维分析、统计分析方法相结合,从而得出可供决策参考的统计分析数据,是较浅的层次上的信息分析,得岀结论偏重事实

5、型,如个人学术榜、机构学术榜、地区发文量统计、学科论文统计、期刊被引统计、学科核心学者酬、核心期刊登等,缺乏高度的抽象概括,缺乏深层次上的知识发现,情报价值不够高。(2)分析结杲偏重对既有成果的分析,在对未来发展的预测上缺乏足够依据,科学性不强。文献计量学方法对未來趋势的把握往往通过时间序列曲线图的延伸来进行,是一种表而形式上的联系,没有把握各变量Z间的内在关系,因此其预测缺乏可信度。(3)文献计量学方法需要人量的人工干预,过程繁琐,工作量人。尤其是在数据处理的过程中,需要大量人工操作,H动化程度低。(4)由于工作量过人,在进行文献计量分析时往往只对数据的简单特征进行分析,无法

6、保证科研评价的金面性,例如在统计被引频率时不区分自引和他引,从而无法客观评价文献质量。(5)适应性不足,同一套分析程序在不同的数据集间可能不完全适用,即使同一数据集发牛变动后也要重新统计分析,存在重复劳动。因此,把文献计量学方法用于科研评价,盂要更多的信息技术和网络技术的支持。数据挖掘技术就为科研评价工作提供了新的手段。数据挖掘是一类新兴的信息处理技术,利用它可以从大型数据集中提取人们感兴趣的知识,这些知识是隐含的、貝有一定可信度的、对用户而言是新颖的口有潜在价值的知识。数据挖掘技术是适应信息处理新需求和社会发展各方而的迫切需要而发展起来的,能够人人增强信息分析能力,它是传统分

7、析方法的补充,已经在许多领域得到成功应用[2]。数据挖掘技术究竟能在科研评估中发挥哪些作用哪?下面从数据挖掘几个方面的作用展开讨论:1.分类聚类。分类就是构造一个分类函数(分类模型),把具有某些特征的数据项映射到某个给定的类别上,在分类之前,要划分的类别是已经确定的。聚类就是将数据项分组成多个类或簇,类Z间的数据差别应尽可能大,类内的数据差别应尽可能小,聚类中要划分的类别是未知的,它是一种不依赖丁•预先定义的类和带类标号的训练数据集的非监督学习,无需背景知识,其中类的数量由系统按照某种性能指

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。