基于R软件RODBC包的海量企业经营数据分析.pdf

基于R软件RODBC包的海量企业经营数据分析.pdf

ID:52457008

大小:309.83 KB

页数:4页

时间:2020-03-27

基于R软件RODBC包的海量企业经营数据分析.pdf_第1页
基于R软件RODBC包的海量企业经营数据分析.pdf_第2页
基于R软件RODBC包的海量企业经营数据分析.pdf_第3页
基于R软件RODBC包的海量企业经营数据分析.pdf_第4页
资源描述:

《基于R软件RODBC包的海量企业经营数据分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第22卷第2期西部经济管理论坛2011年6月Vo1.22,No.2WestForumonEconomyandManagementJun.2011基于R软件RODBC包的海量企业经营数据分析张缔香(南开大学风险管理与保险系天津300071)摘要:现代企业日常经营过程中往往会产生并存储大量数据,如何高效、经济地从中提取有用信息为企业的管理和决策提供支持是现代企业信息管理值得关注的一个方面。本文介绍了ODBC和RODBC,探讨了在普通个人电脑的软、硬件条件下如何利用R软件RODBC包的数据库管理功能,实现企业级海量数据

2、的挖掘与分析,并以寿险公司的死亡保险损失分布模拟为例对其进行了阐述。关键词:海量数据;统计分析;数据库;R软件中图分类号:TP311.13文献标志码:A文章编号:2095—1124(2011)02—0028一o4一操作系统与服务器端是否相同,都可以在客户端访、0DBC和R0DBC(一)ODBC概念简介问远程服务器的数据库,而不受客户和服务端之间开放数据库互连(OpenDatabaseConnectivity,操作系统的限制。ODBC)是微软公司开放服务结构(WindowsOpenServicesArchitect

3、ure,WOSA)中数据库的一个组成部分,旨在为基于SQL(StructureQueryLanguage)的数据库管理系统提供应用程序接口标准。它建立了一组规范,并提供了一组访问数据库的标准应用程序编程接口(ApplicationProgrammingInterface,API)。这些API独立于不同厂商的数据库管理系统(DatabaseManagementSystem,DBMS),也独立于具体的编程语言。连接到特定的DBMS需要特定的ODBC驱动程序的支持。目前微软公司最成熟、应用最广泛的WindowsXP操作

4、系统不但提供了众多应用广泛的DBMS的ODBC驱动程序,还提供了非图1WINDOWSXP系统里的ODBC数据源管理器程序界面SQL数据库如Dbase、Access和FoxPro,甚至平面文件(flatfile)和EXCEL电子表格文件的ODBC驱动程序①。指向目标数据库的连接简记为DSN(DataSourceName)。WindowsXP环境下DSN的设定方法:打开控制面板一>管理工具一>数据源(OD—BC),出现如图1、图2所示ODBC数据源管理器,用户可以根据数据库的类型选择相应的驱动程序来添加和配置DSN。

5、跨平台的客户一服务端结构是ODBC最具吸引力的设计理念之一。只要用户在客户端(比如个人电脑)上有合适的ODBC驱动程序,不论客户端的图2各种ODBC驱动程序选择界面收稿日期:2011—05—14作者简介:张缔香(1983一),男,研究生,研究方向:统计方法与精算。第2期张缔香:基于R软件RODBC包的海量企业经营数据分析(二)RODBC包>sqlTables(ch)R是一个开源、免费的统计软件和数学计算环不同的ODBC驱动程序返回的结果不同,可以境。它提供了弹性的、互动的环境来分析、显示数通过设定参数的方法进行过

6、滤:据,同时也提供了若干统计程序包和集成的统计工>sqlTables(ch,tableType=”TABLE”)具、函数,用户也可以编制自己的函数来完成数据分>sqlTables(ch,schema=”some..pattern”)析过程。许多与统计学相关的前沿方法都能以最快>sqlTables(ch,tablename=”somename”)的速度在R中得到实现。可以通过以下的命令读取目标表的全部内容:RODBC包最初由伦敦大学圣乔治医学院(st>sqlFetch(ch,”table_name”)George’

7、sMedicalSchool,UniversityofLondon)的返回的R对象类型为data.flame。如果目标表MichaelLapsley于1999年开发完成。2002年牛津的内容较多,可以设定max参数来限制一次读取的大学统计系的BrianRipley接手RODBC并做了大最大行数(记录的条数),也可以使用sqlFetchMore量扩展。RODBC1.0—1版本在2003年1月正式命令实现分段读取:发布。现在RODBC已经是R语言里相当成熟的数>sqlFetch(ch,”table—name”,max

8、:m)据库管理平台,得到了广泛应用。>sqlFetchMore(ch,max=m)RODBC包②@提供了两类函数形式。第一种是通常情况下,可以通过以下语句实现从目标表odbc形式的低级函数,用来实现较为底层的OD—里读取符合一定条件的所有记录:BC命令,如利用odbcConnect来实现建立到目标>sqlQuery(ch,”query_codes”)DSN的连接。第二种是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。