欢迎来到天天文库
浏览记录
ID:18933382
大小:136.50 KB
页数:7页
时间:2018-09-27
《科学数据与科学文献相关关系研究——以生物信息学为例》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、科学数据与科学文献相关关系研究——以生物信息学为例韩涛(中国科学院文献情报中心北京100080;中国科学院研究生院北京100049)摘要:科学数据的高速增长和科研工作者对信息获取日益提升的需求要求科学数据库与科学文献库能实现集成信息服务,达到跨异构库知识发现的目的。本文以生物信息学为例,重点研究了生物信息学科学数据库与文献库的两种相关关系:外部关联和内部关联。前者主要是基于两者的外部相似性建立的交叉引用关系。后者则在内容层面直至知识层面实现了两者的聚合和知识关联。关键词:科学数据,科学文献,相关关系,交叉引用,知识关联分类号
2、:G202ResearchontheRelationshipBetweenScientificDataandLiterature:ExemplifiedbyBioinformaticsHanTao(LibraryofChineseAcademyofSciences,Beijing100080;GraduateSchoolofChineseAcademyofSciences,Beijing100049)Abstract:Rapidincreaseofscientificdataandneedofinformationacces
3、sofscientistsrequirethatscientificdataandliteraturemustrealizetheintegrated,synchronizedandcoherentinformationservicesandknowledgediscoverycrosstheheterogeneousdatabase.RegardingBioinformaticsasexample,twokindsofrelationshipbetweenscientificdataandliteraturearestud
4、ied:exteriorrelationshipandinteriorrelationship.Theformerisfocusedonthecross-referencerelationbasedontheexteriorsimilarity.Thelatterachievestherealizationofclusterandrelevancyatthelevelofcontentanduptoknowledge.Keywords:scientificdata,scientificliterature,relations
5、hip,cross-reference,knowledgerelevancy71引言科学文献已经不是科学研究的唯一产出,许多学科在科研过程中会产出海量的科学数据。如何将科学数据与文献很好的结合在一起,如何使其共同服务于科学研究活动,是一个迫切需要解决的问题。本文将以生物信息学为例,分析该学科中科学数据与科学文献的相关关系,从而为科学数据与文献的进一步融合与综合应用提供基础和依据。生物信息学产生基因序列、蛋白质结构等科学数据,各种数据呈指数增长,形成该学科丰富多样的科学数据库。除此之外,文献也是该学科的一个重要产出。两种产出并
6、举,是生物信息学的一个重要特征。科学数据库中的信息是由生物学语言来表达,生物学语言的翻译由文献来完成的,相对于科学数据,科学文献包含的信息更易理解和接受。生物学家不仅需要基因本身的信息,还需要有关基因功能分析的文献,这种需求是生物信息学迫切需要综合科学数据与科学文献两种资源进行科学研究的重要推动力。不仅生物信息学,还有很多其他学科都有类似的特征和需求:科学数据和科学文献是科研活动中不可或缺的重要资源;科学数据和科学文献的综合利用是学科发展的新的需求。为实现两者的综合应用,本文选取在这个方面发展比较成熟的生物信息学为例,重点分
7、析科学数据和文献的相关关系,即:(1)从外部关联的角度研究生物信息学领域科学数据与文献的相关关系,着重研究两者的交叉引用关系;7(2)从内部关联的角度研究生物信息学领域科学数据与文献的相关关系,分两个层次进行。浅层次,文献与科学数据从字面上依某一科学数据相关,即围绕某一科学数据,相关的文献集和科学数据集如何聚类。深层次,文献与科学数据从语义上依某一主题相关,即围绕某一主题,相关的科学数据集和文献集如何进行知识发现、知识关联。深层次的研究围绕主题展开,会涉及文献的关键词、摘要和科学数据的功能描述。本文研究的层次如图1所示。相关
8、关系外部关联内部关联数据与文献聚合数据与文献知识发现交叉引用图1本文研究的内容和层次72外部关联2.1外部相似性文献数据库用篇名、著者、机构、关键词、期刊名等描述文献记录。生物信息学采用类似的方法来描述各种数据,从而使得这些数据具备了与文献相类似的情报特征。表1列出科学数据(GenBank
此文档下载收益归作者所有