北大数据分析老鸟写给学弟们一封信

北大数据分析老鸟写给学弟们一封信

ID:42552327

大小:42.50 KB

页数:6页

时间:2019-09-17

北大数据分析老鸟写给学弟们一封信_第1页
北大数据分析老鸟写给学弟们一封信_第2页
北大数据分析老鸟写给学弟们一封信_第3页
北大数据分析老鸟写给学弟们一封信_第4页
北大数据分析老鸟写给学弟们一封信_第5页
资源描述:

《北大数据分析老鸟写给学弟们一封信》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、北大数据分析老鸟写给学弟们一封信以下是我在近三年做各类计量和统计分析过程小感受最深的东西,或能对大家有所帮助。当然,它不是ABC的教程,也不是细致的数据分析方法介绍,它只是“总结”和“体会”。由于我所学所做均甚朵,我也不是学统计、数学出身的,故木文没有主线,只有碎片,且文中内容仅为个人观点,许多论断没有数学证明,望统计、计最人牛轻扌n。关于软件于我个人而言,所用的数据分析软件包括EXCEL、SPSS、STATA.EVIEWSo在分析询期可以使用EXCEL进行数据清洗、数据结构调整、复杂的新变量计算(包括逻辑计算

2、);在后期呈现美观的图表时,它的制图制表功能更是无可取代的利器;但需要说明的是,EXCEL毕竟只是办公软件,它的作用人多局限在对数据木身进行的操作,而非复杂的统计和计最分析,而且,当样本量达到“万”以上级别时,EXCEL的运行速度有时会让人抓狂。SPSS是擅长于处理截面数据的傻瓜统计软件。首先,它是专业的统计软件,对“万‘‘其至“十万”样本量级别的数据集都能应付H如;其次,它是统计软件而非专业的计量软件,因此它的强项在于数据清洗、描述统计、假设检验(T、F、卡方、方差齐性、正态性、信效度等检验)、多元统计分析(

3、因了、聚类、判别、偏相关等)和一些常用的计量分析(初、中级计量教科书里提到的计量分析基木都能实现),对于复杂的、前沿的计最分析无能为力;第三,SPSS主要用于分析截面数据,在吋序和面板数据处理方面功能了了;最后,SPSS兼容菜单化和编程化操作,是名副其实的傻瓜软件。STATA与EVIEWS都是我偏好的计量软件。前者完全编程化操作,后者兼容菜单化和编程化操作;虽然两款软件都能做简单的描述统计,但是较之SPSS差了许多;STATA与EVIEWS都是计量软件,高级的计量分析能够在这两个软件里得到实现;STATA的扩展

4、性较好,我们可以上网找口己需要的命令文件(.ado文件),不断扩展其应用,但EVIEWS就只能等着软件升级了;刃外,对于时序数据的处理,EV1EWS较强。综上,各款软件有自己的强项和弱项,用什么软件取决于数据本身的属性及分析方法。EXCEL适用于处理小样本数据,SPSS、STATA、EVIEWS可以处理较大的样本;EXCEL、SPSS适合做数据清洗、新变量计算等分析前准备性工作,而STATA、EVIEWS在这方面较差;制图制表用EXCEL;对截面数据进行统计分析用SPSS,简单的计量分析SPSS、STATA、E

5、VIEWS可以实现,高级的计量分析用STATA、EVIEWS,时序分析用EVIEWSo关于因果性做统计或计量,我认为最难也最头疼的就是进行因果性判断。假如你冇A、B两个变量的数据,你怎么知道哪个变量是因(自变量),哪个变量是果(因变量)?早期,人们通过观察原因和结果之间的表面联系进行因果推论,比如恒常会合、时间顺序。但是,人们渐渐认识到多次的共同出现和共同缺失可能是因果关系,也可能是由共同的原因或其他因素造成的。从归纳法的角度來说,如果在有A的情形下出现B,没有A的情形下就没有B,那么A很可能是B的原因,但也可

6、能是其他未能预料到的因素在起作用,所以,在进行因果判断时应对大量的事例进行比较,以便提高判断的nJ'靠性。有两种解决因果问题的方案:统计的解决方案和科学的解决方案。统计的解决方案主要指运用统计和计量回归的方法对微观数据进行分析,比较受干预样本与耒接受干预样本在效果指标(因变量)上的差界。需耍强调的是,利用截面数据进行统计分析,不论是进行均值比较、频数分析,还是方差分析、相关分析,其结果只是干预与影响效果之间因果关系成立的必要条件而非充分条件。类似的,利用截面数据进行计量回归,所能得到的最多也只是变量间的数量关系

7、;计量模型中哪个变量为因变量哪个变M为口变量,完全出于分析者根据其他考虑进行的预设,与计量分析结果没冇关系。总Z,回归并不意味着因果关系的成立,因果关系的判定或推断必须依据经过实践检验的相关理论。虽然利用截面数据进行因果判断显得勉强,但如果研究者掌握了时间序列数据,因果判断仍有可为,其中最经典的方法就是进行“格兰杰因果关系检验”。但格兰杰因果关系检验的结论也只是统计意义上的因果性,而不一定是真正的因果关系,况且格兰杰因果关系检验对数据的要求较高(多期时序数据),因此该方法对截面数据无能为力。综上所述,统计、计量

8、分析的结果可以作为真正的因果关系的一种支持,但不能作为肯定或否定因果关系的最终根据。科学的解决方案主要指实验法,包括随机分组实验和准实验。以实验的方法对干预的效果进行评估,可以对除T预外的其他影响因素加以控制,从而将干预实施后的效果归因为干预本身,这就解决了因果性的确认问题。关于实验在随机实验中,样本被随机分成两组,一组经历处理条件(进入干预组),另一组接受控制条件(进入对照组),然后

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。