中国医学科学院医学信息研究所

中国医学科学院医学信息研究所

ID:24045971

大小:26.50 KB

页数:4页

时间:2018-11-12

中国医学科学院医学信息研究所_第1页
中国医学科学院医学信息研究所_第2页
中国医学科学院医学信息研究所_第3页
中国医学科学院医学信息研究所_第4页
资源描述:

《中国医学科学院医学信息研究所》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、中国医学科学院医学信息研究所文献数据加工系统开发需求说明2010年12月13日一、概述中国医学科学院医学信息研究所/图书馆(简称“医信所”)承担着医学科技文献数字化和文献数据加工工作。为了提高工作效率和加工数据质量,保证数据加工工作在统一的数据处理环境中进行,形成紧密联系、相互配合、相互协调的系统环境,医信所计划开发文献数据加工系统(简称“加工系统”)。本文描述了加工系统项目需求,供竞价单位参考。二、项目需求在本项目中医学科技文献指的是以纸本出版或电子出版(光盘、电子刊物)方式发行的医学类中外文期刊、图书(含会议文献、文集汇编、科技报告)。文献数据

2、加工分为文摘加工和引文加工两部分。图书和期刊需要进行文摘加工;部分期刊(称为医学引文刊)需要进行引文加工。将来随着馆藏文献数字化工作的展开,重要纸本文献将需要进行原文加工,电子文献还将需要对包括多媒体和流媒体等格式的内容进行原文加工。本项目在第一阶段仅包括对图书和期刊进行文摘加工、对医学引文刊进行文摘和引文加工工作的支持,同时加工系统结构和数据库的设计应为将来的原文加工留下接口和空间。2.1功能需求加工系统应支持下列功能:1.加工任务导入:将按规定结构存储的XML、ACCESS、EXCEL格式的加工任务数据导入加工系统。2.加工任务筛选:按照规则将

3、加工任务分析分类。导入的任务数据在第一阶段主要进行四个步骤的筛选:a)可识别文献和不可识别文献筛选:所谓可识别文献,是指该文献的母体信息在系统中有记录,系统可以根据母体信息进行下一步筛选;不可识别文献,指系统没有找到该文献的母体信息,因此需要提交给人工进行判断。b)文献类型筛选:不同类型(期刊、图书)的文献由不同工作人员进行任务预览和处理,系统应根据文献类型将待加工任务分类后提交给相应工作人员。c)需要和不需要加工文献筛选:文献是否需要加工由文献母体属性和相应规则决定,据此系统应将不需要加工的文献筛出,提交给人工处理。需要加工的进行下一步筛选。a)

4、需要和不需要下载筛选:系统应对需要加工的文献根据积累的知识判断该文献数据有无下载、下载来源,并形成下载建议。对于提供接口支持系统直接获取数据的网络开放数据源,应通过其接口直接获取数据载入系统等待处理(请按制作1个数据源集成采集接口报价)。加工任务筛选应分为自动筛选和人工筛选。自动筛选规则主要根据对已经加工数据的历史记录分析形成,保存在知识库中,同时允许人工对规则进行调整;人工筛选主要针对自动筛选不能识别的任务数据进行筛选分类,也包括对自动筛选的结果进行审核调整。2.加工任务预处理:筛选过的加工任务按文献类型提交不同工作人员进行字段增补、审核和发布。

5、字段增补主要是为方便提刊而加上文献在本馆的馆藏位置信息(包括纸本文献位置信息和电子文献位置信息)。字段增补工作应在系统知识库的支持下自动进行,人工可以审核调整。3.下载数据格式化:对于可下载的文摘和引文数据进行下载,并将下载结果导入加工系统后,将对下载下来的文摘和引文数据进行格式化整理,形成符合格式规范的文摘和引文数据。4.加工任务分类:通过对加工任务和下载数据进行分析,将加工任务分解为扫描任务、整本加工任务、增补加工任务、引文刊加工任务。5.加工任务分配:将加工任务按规则分配给加工人员。任务分配应在知识库的支持下逐步实现自动化和智能化,即系统在对

6、加工任务进行量化估计、对加工人员的经验、能力和工作负载的情况进行分析的基础之上按照分配规则(平衡或高效等)提出工作分配计划,人工可以审核、调整分配计划,并批准发布分配计划。6.加工任务调控:加工人员应及时更新任务完成进展,管理人员可以查看任务完成状况并对任务分配进行调整。7.文摘加工:加工人员将经下载整理、扫描识别后的文摘数据批量导入加工系统后,系统应在知识库的支持下对文摘加工提供智能支持,如内容自动提取、自动标引、结果自动校对等,经人工审核校对后形成文摘加工数据。8.引文加工:加工人员将经下载整理、扫描识别后的引文数据批量导入加工系统后,系统应在

7、知识库的支持下对引文加工提供智能支持,如自动切分、结果自动校对等,经人工审核校对后形成引文加工数据。9.数据质检:系统应在知识库的支持下提供数据有效性验证、查重、自动查全等智能质检支持,同时允许人工对质检结果进行审核、回退、调整等操作,形成成品数据。1.成品数据导出:系统应支持将选定数据以XM、ACCESS、EXCEL、TXT格式导出。2.数据检索:系统应提供对成品数据的检索功能,该功能将来可扩展为对原文和多(流)媒体的全文检索和展示。3.统计报表:系统应提供按加工时间、文献类型、加工人员、加工质量等条件进行的加工工作统计报告。4.知识管理:知识管

8、理是加工流程自动化智能化的基础。目前知识管理的内容应包括文献母体知识库管理、医学标引词库管理和加工人员知识库管理三部分,支

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。