横截面数据、时间序列数据、面板数据

ID：10011242

大小：46.84 KB

页数：5页

时间：2018-05-20

资源描述：

《横截面数据、时间序列数据、面板数据》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、横截面数据、时间序列数据、面板数据横截面数据：（时间固定）横截面数据是在同一时间，不同统计单位相同统计指标组成的数据列。横截面数据是按照统计单位排列的。因此，横截面数据不要求统计对象及其范围相同，但要求统计的时间相同。也就是说必须是同一时间截面上的数据。如：时间序列数据：(横坐标为t,纵坐标为y)在不同时间点上收集到的数据，这类数据反映某一事物、现象等随时间的变化状态或程度。如：面板数据：(横坐标为t,斜坐标为y,纵坐标为z)是截面数据与时间序列数据综合起来的一种数据类型。其有时间序列和截面两个维度，当这类数据按两个维度排列时，是排在一个

2、平面上，与只有一个维度的数据排在一条线上有着明显的不同，整个表格像是一个面板,所以把paneldata译作“面板数据”。举例：如：城市名：北京、上海、重庆、天津的GDP分别为10、11、9、8（单位亿元）。这就是截面数据，在一个时间点处切开，看各个城市的不同就是截面数据。如：2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12（单位亿元）。这就是时间序列，选一个城市，看各个样本时间点的不同就是时间序列。如：2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为：北京市分

3、别为8、9、10、11、12；上海市分别为9、10、11、12、13；天津市分别为5、6、7、8、9；重庆市分别为7、8、9、10、11（单位亿元）。这就是面板数据。关于面板数据的统计分析在写论文时经常碰见一些即是时间序列又是截面的数据，比如分析1999-2010的公司盈余管理影响因素，而影响盈余管理的因素有6个，那么会形成如下图的数据公司1公司2公司100因素1……因素6盈余管理程度因素1……因素6盈余管理程度因素1……因素6盈余管理程度19992000……2010 如上图所示的数据即为面板数据。显然面板数据是三维的，而时间序

4、列数据和截面数据都是二维的，把面板数据当成时间序列数据或者截面数据来处理都是不合适的。处理面板数据的软件较多，一般使用Eviews6.0、Stata等。个人推荐使用Stata，因为Stata比较适合处理面板数据，且个性化强。以下以Stata11.0为例来讲解怎么样处理面板数据。由于面板数据的存储结构与我们通常使用的存储结构不太一样，所在统计分析前，最好在excel中整理一下数据，形成如下图所示的数据年份公司名称因素1因素2……因素6盈余管理程度1999公司12000公司1……公司12010公司11999公司22000公司2……公

5、司22010公司2变量定义及输入数据启动Stata11.0，Stata界面有4个组成部分，Review（在左上角）、Variables（左下角）、输出窗口（在右上角）、Command（右下角）。首先定义变量，可以输入命令，也可以通过点击Data----CreatenewVariableorchangevariable。特别注意，这里要定义的变量除了因素1、因素2、……因素6、盈余管理影响程度等，还要定义年份和公司名称两个变量，这两个变量的数据类型（Type）最好设置为int（整型），公司名称不要使用中文名称或者字母等，用数字代替。定义好变

6、量之后可以输入数据了。数据可以直接导入（File-Import），也可以手工录入或者复制粘贴（Data-DataEdit(Browse)），手工录入数据和在excel中的操作一样。以上面说的为例，定义变量year、company、factor1、factor2、factor3、factor4、factor5、factor6、DA。变量company和year分别为截面变量和时间变量。显然，通过这两个变量我们可以非常清楚地确定paneldata的数据存储格式。因此，在使用STATA估计模型之前，我们必须告诉它截面变量和时间变量分别是什么，所

7、用的命令为tsset，命令为：tssetcompanyyear输出窗口将输出相应结果。由于面板数据本身兼具截面数据和时间序列二者的特性，所以对时间序列进行操作的运算同样可以应用到面板数据身上。这一点在处理某些数据时显得非常方便。如，对于上述数据，我们想产生一个新的变量Lag_factor1，也就是factor1的一阶滞后，那么我们可以采用如下命令：genLag_factor1=L.factor1统计描述：在正式进行模型的估计之前，我们必须对样本的基本分布特性有一个总体的了解。对于面板数据而言，我们至少要知道我们的数据中有多少个截面(个体)

8、，每个截面上有多少个观察期间，整个数据结构是平行的还是非平行的。进一步地，我们还要知道主要变量的样本均值、标准差、最大值、最小值等情况。这些都可以通过以下三个命令来完成：xtdes命令用于初步

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 5



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

横截面数据、时间序列数据、面板数据

横截面数据、时间序列数据、面板数据

相关文章

相关标签