如何利用excel中进行高级数据分析之回归分析

如何利用excel中进行高级数据分析之回归分析

ID:13836047

大小:217.24 KB

页数:13页

时间:2018-07-24

如何利用excel中进行高级数据分析之回归分析_第1页
如何利用excel中进行高级数据分析之回归分析_第2页
如何利用excel中进行高级数据分析之回归分析_第3页
如何利用excel中进行高级数据分析之回归分析_第4页
如何利用excel中进行高级数据分析之回归分析_第5页
资源描述:

《如何利用excel中进行高级数据分析之回归分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、如何利用Excel中进行高级数据分析  网站分析中专业的工具除了GoogleAnalytics,AdobeSitecatalyst,Webtrends, 【大数据自媒体招收VIP赞助全年享受一对一指导和全程YY视频指导(只需160享受一年VIP服务)】腾讯分析和百度统计等外,我想最常用的数据处理工具就是Excel了,Excel里头最基础的就是运算和图表的制作,稍微高级一点就是函数和数据透视表的使用了,当然你可能还会想到VBA和宏,但估计很少高手会使用这些高级的功能。  那对于高级的数据分析而言,也就是涉及统计学

2、的专业分析方法和原理的时候,是不是就一定得求助于SPSS,SAS这类专业的分析工具呢?数据分析从低级到高级层次的跳跃过程中有没有可以起承接作用的工具呢?其实是有的,这就是Excel的数据分析功能。貌似最近比较火的两本Excel书籍《谁说菜鸟不会数据分析》和《让Excel飞》都没有涉及这部分的内容。高级的数据分析会涉及回归分析、方差分析和T检验等方法,不要看这些内容貌似跟日常工作毫无关系,其实往高处走,MBA的课程也是包含这些内容的,所以早学晚学都得学,干脆就提前了解吧,请查看以下内容。  在使用之前,首先得安装

3、Excel的数据分析功能,默认情况下,Excel是没有安装这个扩展功能的,安装如下所示:  1)鼠标悬浮在Office按钮上,然后点击【Excel选项】:    2)找到【加载项】,在管理板块选择【Excel加载项】,然后点击【转到】:    3)选择【分析工具库】,点击【确定】:    4)安装完后,就可以【数据】板块看到【数据分析】功能,如下所示:    安装完后,首先来了解一下回归分析的内容。  一、回归分析  在详细进行回归分析之前,首先要理解什么叫回归?实际上,回归这种现象最早由英国生物统计学家高尔顿

4、在研究父母亲和子女的遗传特性时所发现的一种有趣的现象:身高这种遗传特性表现出”高个子父母,其后代身高也高于平均身高;但不见得比其父母更高,到一定程度后会往平均身高方向发生’回归’”。这种效应被称为”趋中回归”。现在的回归分析则多半指源于高尔顿工作的那样一整套建立变量间的数量关系模型的方法和程序。这里的自变量是父母的身高,因变量是子女的身高。  百度百科对于回归分析的定义是:回归分析(regressionanalysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛:  1)回归分

5、析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;  2)按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。    这里举个电商的例子:电子商务的转换率是一定的,网站访问数一般正比对应于销售收入,现在要建立不同访问数情况下对应销售的标准曲线,用来预测搞活动时的销售收入,如下所示:    1.首先,利用散点图描绘图形:      2.添加趋势线,并且显示回归分析的公式和R平方值:      从图得知,R平方值=0.9995,趋势线趋同于一条直线,公式是:y=0.01028x-27.4

6、24  R平方值是介于0和1之间的数字,当趋势线的R平方值为1或者接近1时,趋势线最可靠。因为R2>0.99,所以这是一个线性特征非常明显的数值,说明拟合直线能够以大于99.99%地解释、涵盖了实际数据,具有很好的一般性,能够起到很好的预测作用。  3.使用Excel的数据分析功能  1)点击【数据分析】,在弹出的选择框中选择【回归】,然后点击【确定】:    2)【X值输入区域】选择访问数的单元格,【Y值输入区域】选择销售额的单元格,同时勾选如下所示的选项,包括残差、标准残差、残差图、线性拟合图和正态概率图。

7、    3)以下内容是残差和标准残差:      4)以下是残差图:    残差图是有关于实际值与预测值之间差距的图表,如果残差图中的散点在中轴上下两侧分布,那么拟合直线就是合理的,说明预测有时多些,有时少些,总体来说是符合趋势的,但如果都在上侧或者下侧就不行了,这样有倾向性,需要重新处理。  5)以下是线性拟合图    在线性拟合图中可以看到,除了实际的数据点,还有经过拟和处理的预测数据点,这些参数在以上的表格中也有显示。  6)以下是正态概率图    正态概率图一般用于检查一组数据是否服从正态分布,是实际数

8、值和正态分布数据之间的函数关系散点图,如果这组数值服从正态分布,正态概率图将是一条直线。回归分析不一定得符合正态分布,这里只是仅仅把它描绘出来而已。  以上数据表格和图表都说明公式y=0.01028x-27.424是一个值得信赖的预测曲线,假设搞活动时流量有50万访问数的话,那么预测销售将是51373,如下图所示:  一、描述统计     中位数、众数、数据分布区间可能还比较容易可以算

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。