国家图书馆数据管理与分析平台建设-国家图书馆学刊

国家图书馆数据管理与分析平台建设-国家图书馆学刊

ID:32367850

大小:1.48 MB

页数:10页

时间:2019-02-03

国家图书馆数据管理与分析平台建设-国家图书馆学刊_第1页
国家图书馆数据管理与分析平台建设-国家图书馆学刊_第2页
国家图书馆数据管理与分析平台建设-国家图书馆学刊_第3页
国家图书馆数据管理与分析平台建设-国家图书馆学刊_第4页
国家图书馆数据管理与分析平台建设-国家图书馆学刊_第5页
资源描述:

《国家图书馆数据管理与分析平台建设-国家图书馆学刊》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、·信息组织·国家图书馆数据管理与分析平台建设张宁李雪摘要国家图书馆数据管理与分析平台是国家图书馆大数据工程的一个实验性项目。该项目选取国家图书馆五个核心系统的数据,在虚拟化平台上搭建相应的系统平台,通过数据收集、ETL处理、数据统计与分析等流程,形成统一的数据处理规范,并建立读者、资源和行为数据的标签化体系,从数据层面上揭示国家图书馆的馆藏资源、资源利用情况和用户行为等重要信息,为国家图书馆大数据利用提供理论与实践依据。图1。表2。参考文献33。关键词数据处理与分析ETL大数据标签体系TheCons

2、tructionofDataManagementandAnalysisPlatformoftheNationalLibraryofChinaZhangNingLiXueAbstract:TheDataManagementandAnalysisPlatformisanexperimentalprojectofbig-dataprogramintheNationalLibraryofChina(NLC).TheprojectselectsthedataoffivecoresystemsoftheNLC,

3、buildsthecor⁃respondingsystemplatformonthevirtualplatform,formsunifieddataprocessingspecificationthroughdatacol⁃lection,ETLprocess,datastatisticsandanalysis,andestablisheslabelsystemforreaders,resourcesandbe⁃havior,whichrevealstheimportantinformationof

4、collectionresources,utilizationoftheresources,userbehav⁃iorandotherimportantinformationintheNLCfromthedatalevel,andprovidestheoreticalandpracticalbasisfortheutilizationofbigdataintheNLC.1fig.2tabs.33refs.Keywords:DataManagementandAnalysis;Extract-Trans

5、form-Load;BigData;LabelSystem图书馆作为社会重要的信息资源中心,不仅据共享、公益服务和知识服务上,并为专业机构、担负着保存人类文化遗产、传承人类文明的重要社会团体和个人用户提供服务。例如,美国国家责任,还担负着传播文化知识、参与社会教育的医学图书馆为实现生物学和临床信息数据共享[4]重要职责。随着信息技术的高速发展,图书馆的开展的“整合生物学与临床信息项目”;美国各信息服务也愈来愈依赖互联网、云计算、大数据类公共图书馆、行业协会等非营利机构利用大数[1]等技术。因此,将大

6、数据与图书馆业务相结据开展的“数据无边界运动”,为公益服务的开展合,分析图书馆现阶段数据组织、分析、挖掘的开[5]提供帮助;哈佛大学图书馆将1200多万种书展情况,以及大数据时代用户对信息资源的利用目、音视频、手稿等数据向读者公布,并提供下载需求,对推动大数据在图书馆建设和服务中的应[6]服务,满足用户的知识服务需求。除美国外,用具有重要意义。欧洲国家的图书馆大数据应用也主要集中在数据的开放与共享上。例如,由大英图书馆、荷兰代1国内外图书馆大数据应用情况尔夫特理工大学图书馆和德国国家科学技术图随着美

7、国、英国、法国等欧美国家纷纷提出书馆等共同组建的DataCite非营利组织,为社会[2]团体提供研究数据的数字对象唯一标识符大数据发展战略,大数据逐渐成为各行业的研究热点,图书馆界也开始了相关的研究与应(DOI),帮助其寻找、识别和引用权威研究数据;[3]用。以美国为例,图书馆大数据主要应用在数欧盟委员会在2011年11月提出的“欧盟开放数80·信息组织·据战略”,向社会开放大部分公共部门数据,范围该项目旨在实现以下几点:(1)在对各重点覆盖图书馆、博物馆和档案馆等组织。应用系统相关数据内容的抽取、

8、净化与转换的过与国外相比,国内图书馆对大数据的研究和程中,形成数据管理与分析平台的统一数据处理应用起步较晚,研究内容主要集中在大数据的内规范。(2)构建标签化体系,将读者数据和资源[7]涵、特征和应用边界等基础理论上。虽然不少数据打上结构化标签,构建用户和资源的“数据学者指出大数据可应用于信息服务、学科服务、画像”。(3)通过读者属性和行为数据的分析与参考咨询、个性化服务、信息营销、预测分析和新挖掘,为图书馆的个性化服务或线上线下活动提[8]型知识服务等方面,但在实际

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。