横截面大数据、时间序列大数据、面板大数据

横截面大数据、时间序列大数据、面板大数据

ID:78552398

大小:85.44 KB

页数:5页

时间:2022-02-03

横截面大数据、时间序列大数据、面板大数据_第1页
横截面大数据、时间序列大数据、面板大数据_第2页
横截面大数据、时间序列大数据、面板大数据_第3页
横截面大数据、时间序列大数据、面板大数据_第4页
横截面大数据、时间序列大数据、面板大数据_第5页
资源描述:

《横截面大数据、时间序列大数据、面板大数据》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、实用标准文宰精彩文档实用标准文宰涨幅%-2.72-1.00-1.44-0.98-1.33-2.92-0.56-1.48-1.94面板数据:(横坐标为t,斜坐标为y,纵坐标为z)横截面数据、时间序列数据、面板数据横截面数据:(时间固定)横截面数据是在同一时间,不同统计单位相同统计榕标组成的数据列。横截面数据是按照统计单位排列的。因此,横截面数据不要求统计对象及其范围相同,但要求统计的时间相同。也就是说必须是同一时间截面上的数据。名称浦发银行白云机场武钢股份东凤汽车中国国贸首创股份上海机场包钢股份华能国际时间序列数据:(横坐标为t,纵坐标为y)在不同时间点上收集到的数据,这

2、类数据反映某一事物、现象等随时间的变化状态或程度。如:是截面数据与时间序列数据综合起来的一种数据类型。其有时间序列和截面两I当速奏魏^我禹不耘排列吃基排在一金平面星,与只有个维度的数据排在一条线上有着明显的不同,整个表格像是一个面板,所以把paneldata译作“面板数据”0举例:如:城市名:北京.上海、重庆、天津的GDP分别为9、8(单位亿元)°这就是截面数据,在一个时间点处切开.看各个城市的不同就是截面数据。如:2000.2001>2002、2003、2004各年的北京市GDP分别为&9、10、11.12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不

3、同就是时间序列。精彩文档实用标准文宰如:2000、2001、2002.2003、2004各年中国所有直辖市的GDP分别为:北京市分别为8、9、10、11.12;上海市分别为9、10、11、12、13;天津市分别为5、6、7、8、9:重庆市分别为7、8、9、10、11(单位亿元)。这就是面板数据。城MQ2000200120022003北京1453上海2436重庆2135天津4537关于面板数据的统计分析在坊论文时经常碰见一些即足时何序列又足截面的黄据.比如分析1999-2010的公司盈余管埋影响因素•而影响盈余管理的园素有6个,那么会形成如下图的金叉提公可1公司2公司10

4、061素1国素6盘余■诊理程1阂素6。素6£.余诊优程度199920002010如上图所示的敛据即为而板第居。显然面板数据是三维的而时间序列数据和截面软据都是二绒的,把而板至义据当成时何序列做据戎者截而做据耒处理都是不合适的。处理而板敛据的软伴校多.一4殳使P3Eviews6•0、Stata等。个人推荐使用Stata-因为Stata比较适合处理而板^据,乩个性化强。以下以Stata!1.0为例来讲解怎么样处理面板^据。由于而板数据的存储结构与我们通常使用的存储结构不太一样.所在统计分析前.最好在excel中整理一下敛据.砒精彩文档实用标准文宰成如卜图所示的数据年份公司名

5、弄sri612因素6盈余背理程度1999公司12000公司1公司12010公司11999公司22000公司2公司22010公司2变量定义及输入数据启动StataM.O,Stata界面有4个组成部分,Review(在左上角)'Variables(左下角)、输出窗口(在右上角)、Command(右下角)。首先定义变量,可以输入命令,也可以通过点击DataCreatenewVariableorchangevariable。特别注意,这里要定狡的变量除了因素1、因素2……因素6、盈余管理影响程度等,还要定艾年份和公司名称两个变量,这两个变量的数据类型(Type)最好设置为int

6、(整型),公司名称不要使用中文名称或者字母等,用数字代替。定狡好变量之后可以输入数据了。数据可以直接导入(File-Import),也可以手工录入或者复制粘贴(Data-DataEdit(Browse)),手工录入数据和在excel中的操作一样。以上面说的为例‘定艾变量year>company>factor仁factor2'factor3>factor4>factor5>factor6'DA。变量company和year分别为截面变董和时间变量。显然,通过这两个变量我们可以非常清楚地确定paneIdata的数据存储格式。因此,在使用STATA估计模型之前,我们必须告诉它

7、截面变量和时间变量分别是什么,所用的命令为tsset,命令为:tssetcompanyyear输出窗口将输出相应结果。由于面板数据本身兼具截面数据和时间序列二者的特性,所以对时间序列进行操作的运算同样可以应用到面板数据身上。这一点在处理某些数据时显得非常方便。如,对于上述数据,我们想产生一个新的变量Lagactor1,也就是factorI的一阶滞后,那么我们可以采用如下命令:genLag_factor1=L•factorI统计描述:在正式进行模型的估计之前,我们必须对样本的基本分布特性有一个总体的了解。对于面板数据而言,我们至少要知道我们

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。