欢迎来到天天文库
浏览记录
ID:28009304
大小:100.51 KB
页数:13页
时间:2018-12-07
《基于plda模型与多数据源融合相关性分析的新兴主题探测研究——以石墨烯领域为例》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于PLDA模型与多数据源融合相关性分析的新兴主题探测研宄领域为例以石墨烯王效岳白如江山东理工大学科技信息研究所摘要:[目的/意义]为快速准确地前瞻识别蕴含在多数据源文本中的新兴主题,为科技创新决策提供情报支撑服务。[方法/过程]提出一种基于PLDA模型和多数据源融合相关性分析的新兴主题探测方法,从要素、趋势、主题及情景4方面分析多数据源相关性特征,构建基于多源分析文本的新兴主题探测公式。[结果/结论]通过文献调奔法并咨询石墨烯领域相关专家,表明该方法能够更加快速准确地前瞻识别出多数据源文本中的新兴主题,弥补了单一分析数据源进行主题探测的不足,丰富多数据源融合理论体系的实
2、践应用。关键词:多数据源;融合;相关性分析;新兴主题探测;作者简介:徐路路,男,1991年生,硕士生。研宂方向:数据挖掘与信息处理技术。作者简介:王效岳,男,1961年生,博士,教授。研究方向:数据挖掘与信息处理技术。作者简介:白如江,男,1979年生,博士,副教授。研宂方向:文本数据挖掘与科技情报基金:国家社会科学基金项目“未来新兴科学研究前沿研究”(项目编号:16BTQ083)ResearchontheEmergingTopicDetectionBasedontheCorrelationAnalysisofPLDAModelandMultipleDataSourceF
3、usionAbstract:[Purpose/significance]Thispaperaimstorapidlyandaccuratelyidentifyemergingtopicsthatarecontainedinmultipledatasource,andtoprovideinformationsupportserviceforscientificandtechnologicalinnovationdecision.[Method/process]Thepaperpresentsanewemergingtopicdetectionmethodbasedonthe
4、correlationanalysisofPLDAmodelandmultipledatasourcefusion.Then,thecorrelationcharacteristicsofmultipledatasourceareanalyzedfromfouraspects:factors,trends,themesandscenarios.Last,anemergingtopicdetectionformulabasedonmulti~sourceanalysistextisconstructed.[Result/conclusion]Throughliteratur
5、ereviewanddomainexpertconsultation,itshowsthatthismethodcanidentifyemergingtopicsinmultipledatasourcetextsmorequicklyandaccurately.Italsomakesupfortheshortageofsubjectdetectionfromsingleanalysisdatasource,andenrichesthepracticalapplicationofmultipledatasourcefusiontheoreticalsystem.Keywor
6、d:multipledatasource;fusion;correlationanalysis;emergingtopicdetection;科技文献是科技创新知识的主要载体,论文专利、会议报告、政府出版物等不同类型的文献记录着科学知识不断更新换代、演化发展的过程。人数据背景下,科技文献已呈指数级增长,具有多源分布、更新迅速、描述格式多样等特点m。而当前新一轮科技革命风起云涌,从徳国工业4.0战略到欧盟“地平线2020”科研计划,再到中M“十三五”国家科技创新规划,各国积极加强科技创新部署并制定科技发展战略。在此背景下,如何快速准确地前瞻识別和判断多源异构的科技文献中蕴含
7、的新兴主题,综合分析和把握重要领域科技创新发展的最新脉搏,成为情报研允的重要任务。目前很多学者进行科技文献的新兴主题探测研宄,识别学科领域内研宄前沿并取得了众多研宄成果,但也存在一些问题,如采用传统文献计量学方法(如引文分析方法)引文分析时滞性问题m以及分析数据源单一、多数据源无法有效融合等问题m。因此本文提出一种基于PLAD模型和多数据源融合的新兴主题探测方法,利用文本挖掘方法识别多种数据源内容分析,构建新兴主题判别模型,以识别科技文献中的新兴主题,为我国科技政策制定和优先发展领域筛选进行大势研判是提供有力的情报支撑服务。1
此文档下载收益归作者所有