欧洲专利局专利XML数据结构及其重点属性和元素分析.pdf

欧洲专利局专利XML数据结构及其重点属性和元素分析.pdf

ID:52361801

大小:1.17 MB

页数:5页

时间:2020-03-26

欧洲专利局专利XML数据结构及其重点属性和元素分析.pdf_第1页
欧洲专利局专利XML数据结构及其重点属性和元素分析.pdf_第2页
欧洲专利局专利XML数据结构及其重点属性和元素分析.pdf_第3页
欧洲专利局专利XML数据结构及其重点属性和元素分析.pdf_第4页
欧洲专利局专利XML数据结构及其重点属性和元素分析.pdf_第5页
资源描述:

《欧洲专利局专利XML数据结构及其重点属性和元素分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、20,s年第7期si。。dT。盏}{i。m。R。。hdoi:10.3969/j.issn.1000—7695.2015.17.028欧洲专利局专利XML数据结构及其重点属性和元素分析刘会景,朱新超,齐萍,蒋君(中国科学技术信息研究所,北京100038)摘要:欧洲专利局收录了世界上最为广泛的专利数据,构建了格式标准的DOCDB专利数据库,并采取XML组织交换数据。介绍DOCDBXML交换数据组织结构的修订沿革,研究DOCDBXML文件的整体架构,并详细分析重点专利数据属性和元素,为DOCDB专利数据加

2、工和应用提供参考和依据。关键词:欧洲专利局;DOCDB;XML;专ft.1数据中图分类号:G306文献标志码:A文章编号:1000—7695(2015)17—0156—05AnalysisonAttributesandElementsofEPOXMLPatentDataLIUHuijing,ZHUXinchao,QIPing,JIANGJun(InstituteofScientificandTechnicalInformationofChina(ISTIC),Beijing100038,China)

3、Abstract:AnalyzetheDOCDBXMLpatentdataprovidedbytheEuropeanPatentOfficeanddescribeitsrevisionhistoryandoverallstructure.DetailedinvestigationontheimportantelementsandattributesintheXMLdatawillhelpwhenpro—cessingandutilizingtheDOCDBdata.Weprovideusefulre

4、ferencefortheresearchinstitutionswhenestablishingpatentda—tabase.Keywords:EPO;DOCDB;XML;PatentData文件的建议”,简称sT.36标准H。DOCDB同样采1研究背景用XML组织专利信息交换数据,并在遵循ST.36标欧洲专利局(EuropeanPatentOfice,EPO)是准的基础上有所扩展。目前世界上收集专利数据最多的政府间组织。截止近几年,我国的专利数据加工机构基于DOCDB到2013年底,欧洲专利局

5、已收录了93个国家和地专利交换数据开展了专利数据加工、检索、分析的区的专利数据。由于信息来源广泛,异构的专利数探索工作。中国专利信息中心的王潜对比了DOC—据需事先经过欧洲专利局加工、清洗、规范后,DB专利数据格式与ST.36标准提供的DTD,对比结最终形成用于与第三方、世界知识产权组织(World果为建立中国专利文献电子数据标准提供了有益启IntellectualPropertyOrganization,WIPO)和其它商业示;张帆等通过分析DOCDB专利数据的特点,机构等进行数据交换的、格式标准

6、规范的专利信息探索其在专利检索系统中的应用方法。本文概括了数据库——文献管理数据库(DocumentDatabase,欧洲专利局DOCDBXML数据交换文件的格式修订DOCDB)。沿革,通过研究XML文件中的重点专利数据属性和可扩展标记语言(eXtensibleMarkupLanguage,元素,分析了专利数据的组织特点,为DOCDB专利XML),是由W3C组织(WorldWideWebConsorti—数据加工和应用提供参考,并为我国科研机构和企um)于1998年2月正式发布的标准定义,是一种能业

7、建立专利数据库及交换标准格式专利数据提供一跨多个平台交换的格式存储数据方式。XML文定的借鉴意义。档遵从DTD(DocumentTypeDefinition)或Schema2DOCDBXML文件介绍模式,具有传统文档所没有的结构和层次特性,并具有可扩展性、灵活性和自描述性等优点。鉴于DOCDBXML采用ZIP压缩包交换格式,于每周XML在信息资源组织与检索方面的优势,世界知识二和周四定期在欧洲专利局网站更新,其中周二更产权组织于2005年公布了“使用XML来处理专利新回溯(Amend)的专利数据,周

8、四更新最新收录收稿日期:2014—07—14,修回日期:2014—11一O5基金项目:科技部国家科技支撑计划“面向科技创新的专利信息加工与服务关键技术研究与应用示范”项目中“专利信息资源整合与加工关键技术与规范研究”(2013BAH21B01)刘会景等:欧洲专利局专利XML数据结构及其重点属性和元素分析157或删除(CreateandDelete)的专利数据,解压后的的相同著录项信息的交换问题,DOCDBXML在部单个XML文件大小不超过lOOM;除此之外,压缩分数据

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。