excel、spss、r在数据分析中的比较研究

excel、spss、r在数据分析中的比较研究

ID:27310259

大小:51.50 KB

页数:5页

时间:2018-12-02

excel、spss、r在数据分析中的比较研究_第1页
excel、spss、r在数据分析中的比较研究_第2页
excel、spss、r在数据分析中的比较研究_第3页
excel、spss、r在数据分析中的比较研究_第4页
excel、spss、r在数据分析中的比较研究_第5页
资源描述:

《excel、spss、r在数据分析中的比较研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、Excel、Spss、R在数据分析中的比较研究摘要:随着大数据时代的到来,数据分析成了一个热门的话题。市场上有各种各样的数据分析工具,如何选择数据分析工具就成了很多数据分析工作者的一个难题。而数据分析工具的选择应主要依据具体的业务逻辑,并没有最好的数据分析工具,而只有最适合的分析工具。全文选择Excel,Spss和R语言这三个数据分析工具进行比较分析。观察他们在平时的学习和工作中,特别是在数据分析过程中的表现,以得出他们最适合的工作环境。中国8/vie  关键词:大数据;分析工具;业务逻辑;比较分析;工作环境  中图分类号:TP317.3文献标识码:A:1009-3044(2017)

2、04-0235-02  统计分析软件是数据分析的主要工具。无论在工作还是学习中,我们都需要使用这些软件来进行数据分析,而分析的过程主要分为数据的整理,数据的分析,数据的报告。而市场上有很多的软件来供我们选择,如何选择一款合适的软件就成了我们需要考虑的问题。  1工具简介  Excel是微软的office系列办公软件中比较常用的一款数据处理软件。我们可以通过Excel进行数据录入,储存和分析的相�P操作。Excel提供了大量的函数功能,为我们的数据分析工作提供了便捷。而且强大的VBA编程能力,也让我们处理起数据更加个性化和多样化。  Spss(StatisticalProductand

3、ServiceSolutions),相比Excel这样的办公软件,人们更加倾向于称Spss为统计软件。因为它的数据处理能力更加强大,Excel只能做一些最基本的数据操作,而Spss则可以做一些比较高级的数理统计工作。  R语言(RLanguage)相比前两者最大的不同之处在于他是非窗口操作软件,更确切地说他是一款脚本语言。用户需要输入相应的指令才可以操作数据。R语言的强大之处在于他的包。R语言平台上提供了各种各样的数理统计包,这些包可以直接由用户使用,而并不用关心它的底层实现机制。  2三种软件在数据储存阶段的比较分析  数据存储是指分析员在搜集数据之后,把相应的数据有条理的储存起来

4、,以便在以后的分析工作中使用。数据存储是数据处理过程的第一个阶段,也是最重要的阶段,因为他直接影响着以后的操作。如果在数据的存储阶段出了问题,那么整个数据分析的过程也就是有问题的。可见数据存储过程是需要分析员特别重视的阶段。  在此阶段Excel和Spss提供了可视化的操作界面,所以分析员可以很容易的对数据进行录入处理。而R语言则没有提供相应的图形操作界面,分析员只能通过在控制台建立数据框这样的方式,把数据储存起来。可视化操作界面的优点是直观,分析员可以像在实体的纸质表格上写字一样在虚拟的表里填入数据,这样可以减少分析员在抽象脚本语言可能出现的失误。  虽然R没有提供简单的图形操作界

5、面,使得数据的输入没有Excel与Spss软件这么直观,但是R语言这种输入方式却有一个比较强势的功能,就是编程。虽然Excel和Spss也有编程功能,但是语法过于复杂。在R语言中分析员可以编写自己的脚本文件,实现数据的重复录入,从而可以节省出大量的时间,减少不必要的时间浪费。  他们三者最后都可以把数据保存为CSV格式或者TXT格式,这样就为数据的传输带来了方便。保存为这两种格式后三个软件可以实现数据的共享操作。  综上所述,Excel和Spss强在可视化的操作界面,而R语言则强在编程语言。至于最后数据的保存,三者则表现出了一致性,实现了数据在软件之间的传输。  3三种软件在数据分析

6、阶段的比较分析  数据分析传统上都认为是统计分析,而广义的数据分析则包含了更高级的算法比如机器学习、数据挖掘等。数据挖掘(DataMinning)是指从大量的数据中通过一些特定的算法,计算出隐藏在其中的有意义的信息的过程。主要的数据挖掘算法包括:人工神经网络,支持向量机,KNN算法,随机深林、决策树、回归分析等。  Excel在数据分析阶段的强大之处在于它有很强大的函数库,利用这些函数库里的函数,可以帮助我们方便地进行简单的数据分析,比如求平均数,求和等。当然也可以对数据进行优化和筛选。函数功能是Excel的灵魂,有了函数,Excel就可以组合变化出多种统计方式,来分析数据。  但是

7、,Excel只能进行简单的数理统计分析,而不能进行比较高级的算法分析。Spss相比Excel则可进行比较高级的数据分析,比如生存分析、Logistic回归、BP神经网络等。虽然Spss能进行这些算法分析,但是它本身也有局限性。由于Spss是一款可视化软件,它的载体在软件开发的阶段就已经被设计好了,分析员很难再根据自己的需要对里面的算法进行更改。这也就意味着,分析员只能使用设计者提供的方法,而设计者没有提供的方法,分析员就不能使用了。因为现在算法更新比较快,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。