基于XML的Excel数据提取和集成研究.pdf

基于XML的Excel数据提取和集成研究.pdf

ID:58221597

大小:1.04 MB

页数:6页

时间:2020-04-28

基于XML的Excel数据提取和集成研究.pdf_第1页
基于XML的Excel数据提取和集成研究.pdf_第2页
基于XML的Excel数据提取和集成研究.pdf_第3页
基于XML的Excel数据提取和集成研究.pdf_第4页
基于XML的Excel数据提取和集成研究.pdf_第5页
资源描述:

《基于XML的Excel数据提取和集成研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第24卷第4常熟理工学院学报(自然科学)Vol.24No.42010年4月Apr.,2010JournalofChangshuInstituteTechnology(NaturalSciences)基于XML的Excel数据提取和集成研究12夏开建,严小泉(1.常熟理工学院计算机科学与工程学院,江苏常熟215500;2.江苏国光信息产业股份有限公司,江苏常州213015)摘要:异构数据源的集成问题是当前数据处理领域内研究的一个热点,它能更有效地利用信息资源、更好地实现数据共享.针对当前企业对异构数据库中Excel数据源集成的迫切需求,本文提出一个基于XML模板的E

2、xcel数据源数据映射方案,能使数据转换更加灵活通用.该方案是实现异构数据源之间数据交换的通用方法,实现了Excel数据向标准XML文件的相互转化,有效提高了整个应用系统的性能.关键词:Excel数据源;XML模板;数据映射;异构数据源中图分类号:TP391文献标识码:A文章编号:1008-2794(2010)04-0116-05随着Internet技术的飞速发展和网络计算模式的广泛应用,异构数据源间的数据集成和转换日益频繁.异构数据源在多个应用系统中的格式、语义和层次不同,导致整个企业数据的不一致性.面对残酷的竞争和频繁的合并与收购行为,许多企业都在力图解决数据

3、碎片所带来的问题,整合这些支离破碎的异构数据源是企业之间或企业内部各部门之间协同合作的需要,超过30%的IT预算被用于构建和维护遗留系统间Excel数据源的集成.Excel简单易用,其丰富的格式控制和数据处理能力对各种信息都十分适合,比如姓名清单、产品清单、金融数据等等,也是保存统计数据的最流行的电子表格格式.但与关系数据库或XML数据库相比,Excel在数据集成、数据查询、数据分析、数据冗余等方面明显不足.许多公司和行业使用Excel来准备、编辑和保存数据,但是它不适合后期查询分析与统计,因此Excel数据源的集成和转换迫在眉睫.Java提供的跨平台语言和XML

4、提[1]供的跨平台数据格式的完美结合将成为最佳的Excel数据集成的解决方案.本文利用JAVA技术、使用XML(ExtensibleMarkupLanguage)作为Excel数据的模板配置数据和转换格式,实现Excel数据与XML数据的相互转换,降低了程序开发难度和开发成本,实现异构数据源信息系统的无缝集成.1Excel数据转换方法1.1Excel数据转换现状企业中历史遗留系统中Excel数据量通常情况下非常大,纯人工以单元格为单位将Excel数据转换成XML数据或导入到关系数据库中代码量繁重、可靠性差,代价极其巨大.因此考虑用JAVA来操作Excel,将数据转

5、换[2]成异构数据标准信息XML,该技术编程量小、准确度高且便于维护和集成处理,Excel和其它数据源集成和转收稿日期:2010-02-04作者简介:夏开建(1983—),男,江苏宿迁人,常熟理工学院计算机科学与工程学院助教,硕士,研究方向:计算机图形学、图形图像处理.夏开建,严小泉:基于XML的Excel数据提取和集成研究117换如图1所示,其中每个数据源对应一个包装器,由包装器来与其封装的数据源交互,提取各本地数据源的XML元数据,最终经过数据清除、数据集成等操作融合数据,达到异构数据源集成的目的,本文只讨论Excel数据源与XML数据的相互转换.在Web应用

6、日益盛行的今天,通过Web来集成转换Excel文件的需求越来越强烈.目前较为流行的处理Excel数据的方法主要有三种:[3](1)不操作实际的Excel文件,而是在JSP或Servlet中创建一个CSV(comma-separatedvalue)文件,CSV是用来交换电子表格文件的常用格式,任何适当的电子表格都可以通过CSV文件导出和导入,它在头文件中以applica-tion/vnd.ms-excel类型返回给浏览器,接着浏览器调用Excel显示或者下载Excel文件,但这不能算是真正意义上的操作Excel文件.图1Excel和其它数据源集成与转换(2)利用第三

7、方工具来实现Excel数据与关系数据库表文件的导入导出.例如:Microsoft公司的SQLServer2005提供的导入导出辅助工具,能够将格式比较简单的Excel数据自动导入到关系数据库中或者将数据库表记录导出到Excel文件中;开源数据库MySQL的辅助软件MySQL-Front也提供了Excel文件导入导出功能.但是此类工具的功能有限,只能实现行列规范的Excel数据和关系数据库表文件的转换.(3)利用JavaExcelAPI操作和转换Excel,转换成XML文件使它可以运行于任何平台,并且很容易地实现异构数据源集成;格式复杂的图表输出,如表1(单元格合并

8、、对齐、字

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。