可视化的共词聚类分析研究.pdf

可视化的共词聚类分析研究.pdf

ID:52458871

大小:714.35 KB

页数:7页

时间:2020-03-27

可视化的共词聚类分析研究.pdf_第1页
可视化的共词聚类分析研究.pdf_第2页
可视化的共词聚类分析研究.pdf_第3页
可视化的共词聚类分析研究.pdf_第4页
可视化的共词聚类分析研究.pdf_第5页
资源描述:

《可视化的共词聚类分析研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、可视化的共词聚类系统分析及实现1,2,31,2邢美凤许德山1(中国科学院国家科学图书馆北京100190)2(中国科学院研究生院北京100049)3(晋中学院晋中030600)[摘要]在分析现有文献计量软件的优缺点,以及利用文献计量方法进行科学研究的目的与工作流程的基础上,建立多种文献数据库题录字典,有效进行关键词的合并和修正,集成文献计量中统计、共词和聚类过程,设计和实现了一种可视化的共词聚类分析系统。[关键词]共词聚类可视化[分类号]TP311G350DesignandImplementationofVisualCo-w

2、ordandClusterAnalyzer1,2,31,2Xingmei-fengXude-shan1(NationalScienceLibrary,ChineseAcademyofSciences,Beijing100190,China)2(GraduateUniversityofChineseAcademyofSciences,Bejing100049,China)3(JinZhongUniversity,Jinzhong030600,China)[Abstract]Byanalyingtheadvantagesand

3、disadvantagesoftheexistingbibliometricsoftware,andthepurposeofscientificresearchandworkflowbasedonthebibliometricmethod,Thispaperestablishesavarietyofbibliographicentrydictionary,combinesandcorrectskeywordseffectively,integratestheprocessofstatistics,co-wordandthe

4、clustering,designsandcompletesasortofvisualco-wordandclusteranalyzersystem.[Keywords]co-wordclustervisual1引言文献计量软件的开发和利用对于文献计量分析学者进行学术分析、解决复杂的大数据[1]量分析问题具有重要的辅助作用。目前国外用于文献计量分析的软件种类繁多,但这些[2]软件在解决部分问题的同时仍存在一些不足:如Bibexcel可以对ISI的SCI、SSCI和A&HCI[3]数据进行分析,但对中文数据不能进行相关的分析

5、;SPSS是大型的统计学软件包,但应用于文献计量分析时,只能在其它软件的基础之上,其它软件将文献数据库中的数据转换为矩阵格式后才能进一步利用SPSS进行分析,不能直接对文献数据库中的数据进行分析;[4]UCINET是目前流行的社会网络分析软件,但利用于文献计量也是建立在其它软件的基础之上,没有其它软件如Bibexcel将文献数据库的数据格式转换并进行相应的运算之后,是不能进行文献计量分析的。国内在文献计量软件的开发上也进行了诸多的尝试,如王曰芬[5][6][7]开发了文献计量与内容分析综合应用软件,周春雷开发了CnkiRe

6、f软件工具,张云利用开源的lucene开发了中文学术文献计量软件。以上三种软件只实现了对题录信息的基[8]本统计功能;肖伟开发的学术论文共词分析系统实现了基本统计和共词的功能,但文献[9]数据库格式到系统格式由人工录入,分析时工作量很大;崔雷开发的文献共现矩阵生成软件BICOMS,完成了文献外部特征的统计功能和共现矩阵的生成,但在生成共现矩阵时,只能按照原有关键词的词频顺序,以一定的阈值过滤关键词,没有对关键词进行修正或合并。基于此,本文试图更有效地集成从文献数据库格式到共词聚类的操作流程,设计和实现一种可视化的共词聚类分

7、析系统,以期能帮助相关分析人员更方便、更迅捷、更准确地进行科学研究。[10-11]2文献计量软件开发需求分析2.1文献计量分析的目的和内容利用文献计量的方法进行分析研究,主要是研究与某一领域相关文献的一些特性,对这些特征进行总结统计,揭示这些统计数据体现出来的在某一领域的进展状况与发展趋势,揭示所要研究领域的学科结构、发展历程、各个时间段关注的热点问题、当前研究态势及发展趋势。文献计量分析的研究对象是表征相关文献特征的一些元素,主要有:题名、作者、刊名、机构、出版年份、关键词、文摘、被引次数、引文等。对这些元素进行数量统计

8、。统计方式有:TOPN统计、数量分布统计、数量增长统计。元素之间关联统计。关联统计主要是基于共词方法的统计、基于共引方法的统计等。利用以上的统计资料,得出与这一主题相关的论文年代、核心作者、高产作者、高被引作者、核心研究机构的分布。统计领域相关文献中出现的关键词、作者、机构等元素,并通过对共词矩阵和共引

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。