统计预测与决策课程设计论文设计

ID：40001739

大小：492.79 KB

页数：17页

时间：2019-07-17

上传者：linlin921

资源描述：

《统计预测与决策课程设计论文设计》由会员上传分享，免费在线阅读，更多相关内容在工程资料-天天文库。

目录1、引言12、预测方法介绍22.1、多元回归分析法22.2、ARIMA模型的基本原理22.3、灰色预测法32.4、组合预测模型33、模型的建立及预测33.1、线性回归预测43.2、建立ARIMA模型53.2.1、平稳化处理53.2.2、模型定阶73.2.3、模型检验83.2.4、模型预测93.3、灰色预测模型93.3.1、残差检验103.3.2、模型修正103.4、组合模型114、模型精度比较及预测125、结论13参考文献13附录1416 1引言能源是人类社会赖以存在的物质条件之一，是经济发展和社会进步的重要资源，但是现在的能源结构中大部分都是不可再生资源，能源的利用一直是一个世界性的问题。能源是一个国家经济增长和社会发展的重要物质基础,能源短缺曾长期制约我国经济的发展。经济的可持续发展对于合理的能源消费提出了更高的要求随着改革的进一步深化,我国已经顺利地实现了现代化建设的前两个目标,在向第三个迈的过程中,能源的短缺已经成为制约我国经济发展的瓶颈,我国人口众多资源相对不足,所以有关能源消费的预测和协调显得越来越重要。21世纪以来，我国的能源消费无论在消费速度还是消费结构上一直都是世界能源问题的焦点。世界一次能源消费在2007年增长了2.4%，我国占据了全球能源消费增长的一半，我国对煤炭、石油、天然气等能源消费全面的增长成了世界能源消费的“一枝独秀”。自2001年以来，国民经济进入了一个新的发展阶段，固定资产投资迅速增加，重工业比重增大，钢铁、建材、电解铝等一些高能耗产业迅速扩张，由此导致了能源消费量的急剧增加，甚至超过了经济增长速度。2002-2007年我国GDP增长速度分别为7.5%、8.3%、9.5%、9.5%、10.7%和11.4%，同期一次能源消费量的增长速度分别为9.9%、15.3%、16.1%、10.6%、9.6%和7.8%。能源大多具备不可再生性，在良性的经济体中，经济的增长绝不能只靠能源消费的增长拉动。我国能源的高速消耗，却有着较低的利用效率，说明能源消费从整体上讲还属于粗放型能源利用方式，能源消费强度很高，我国经济增长尚未完全摆脱高能耗拉动依赖，与现代集约型经济发展的要求还有很大的差距。我国能源消费现状，不能不让我们深思我国经济、能源的安全。国家能源的消耗存在如此大的问题，我们通过对近30年能源消耗数据的研究与分析，运用统计理论与方法预测我国未来几年的能源消耗数量及其比例，通过预测的数据合理整合国家能源，调整能源的消耗结构，了解未来能源的远景需求，对于保持我国社会经济健康、持续、稳定发展具有重要的理论与现实意义。本文以我国1978-2008年的全国能源消耗的数据为基础，建立了回归预测法、ARIMA预测模型、灰色预测模型和基于这三种模型的组合模型，并进行了精度比较，最后选择最优的组合预测模型对2009-2011年的全国能源消耗总量进行预测。16 本文中全国能源消耗数据的来源为：2010年的中国统计年鉴。2预测方法介绍2.1多元回归分析法研究变量间的函数关系一般使用回归分析法，回归模型为：Y=。回归分析预测法，是在分析市场现象自变量和因变量之间相关关系的基础上，建立变量之间的回归方程，并将回归方程作为预测模型，根据自变量在预测期的数量变化来预测因变量关系大多表现为相关关系，因此，回归分析预测法是一种重要的预测方法，当我们在对未来发展状况和水平进行预测时，如果能将影响预测对象的主要因素找到，并且能够取得其数量资料，就可以采用回归分析预测法进行预测。它是一种具体的、行之有效的、实用价值很高的常用市场预测方法。回归分析就是通过样本观测数据对模型进行估计，用最小二乘法分析随机误差项的分布特征，估计出回归系数，再使用该模型进行预测。一个好的估计量应满足一致性、无偏性和有效性的要求。随着回归分析中变量的增多，回归分析的计算量成倍增加，因此，多元回归分析必须借助计算机。利用EXCEL等软件进行回归分析，计算残差、制作残差图以及线性拟合图，从而根据线性图进行预测。2.2ARIMA模型的基本原理ARIMA模型是Box和Jenkins1970年提出的以随机理论为基础的时间序列分析方法，又称为“Box-Jenkins模型”，这以模型在经济领域的预测分析中得到了广泛的应用。时间序列是依赖时间t的一组随机变量，构成该时序的单个序列值虽然具有不确定性，但对整个时间序列来说，它的变化却有一定的规律性，可以用相应的数学模型来近似描述。ARIMA模型有三种基本类型：自回归模型、移动平均模型、单整自回归移动平均模型。16 单整是指将一个时间序列有非平稳性变为平稳性所要经过的差分的次数，这是对非平稳时间序列进行时间序列分析的必经步骤。假设一个随机过程含有d个单位根，其经过d次差分之后可以变换为一个平稳的自回归移动平均过程。则该随机过程称为单整自回归移动平均模型。模型中AR称为自回归分量，P为自回归分量的阶数；MA为移动平均分量，q为移动平均分量的阶数；I为差分，d为使时间序列具有平稳性所需要的差分次数。p阶自回归过程AR(p)的一般表达式为：其中白噪声过程。q阶的移动平均过程MA（q）可以表示为：，为白噪声过程。ARIMA(p,d,q)模型一般表达式为：2.3灰色预测法灰色预测法是一种对含有不确定因素的系统进行预测的方法。一般是利用时间序列数据，通过建立GM（1,1）模型进行预测。灰色预测模型的预测步骤如下：(1)首先对原始时间序列数据，做一次累加生成，得到新的序列(2)利用一次累加生成序列拟合微分方程：，得到参数和(3)解微分方程得到预测模型函数：(4)将得到的序列进行一次累减得到预测序列(5)利用历史数据对数据模型进行精度检验，若通不过检验，则利用残差对原模型进行修正。(6)通过预测方程进行预测。2.4组合预测模型不同的预测方法根据相同的信息，往往会提供不同的结果，如果简单的将误差较大的一些方法舍弃掉，将会丢弃一些有用的信息，使得模型的精度不高。组合预测法是指通过建立一个组合预测模型，把多种预测方法所得到的预测结果进行综合。由于组合模型能够较大限度地利用各种预测样本信息，所以它比单项预测模型考虑问题更系统、更全面，因而能够有效地减少单个预测模型受随机因素的影响，可以提高预测的精度和稳定性。3模型的建立及预测16 3.1线性回归预测对全国能源消耗总量1978年—2009年的消耗数据进行绘图，如下图：图1、全国能源1978年—2009年的消耗总量散点图当预测对象依时间变化呈现某种上升或下降的趋势，并且无明显的季节波动，又能找到一条合适的函数曲线反应这种变化趋势时，就可用时间t为自变量，时序数值y为因变量，将1978年的时刻定了时刻t=1，依次累加，建立趋势模型：。三次多项式预测模型是趋势外推预测模型中的一种比较常用的模型。为了探究时序数据变化的趋势，作出全国能源消费总量y的散点图如图所示：16 由图可知全国能源消耗总量没有明显的季节波动，而且大致呈抛物线或指数的趋势上升，但经过精度比较之后，三次多项式的拟合的最好，所以本文采用三次多项式模型进行拟合。利用软件EXCEL进行回归得到结果如下表一所示：表一：三次多项式模型结果变量系数标准差T统计量P值常数项34209.538549.9254.0011500.0004T10136.882277.3004.4512700.0001T^2-646.4941163.9748-3.9426440.0005T^318.582983.3716555.5115310.0000其中模型的F统计量为345.9252，相伴概率为0.00，小于0.05，所以拒绝原假设，即模型是显著的。而且各系数的显著性检验的P值都小于0.05，通过了显著性检验。模型的调整的为0.971825，接近于1，说明模型拟合效果好。因此，建立三次多项式模型如下：用该模型对2004-2011年的全国能源消费总量进行预测得到结果如表二所示：表二：2004-2011年全国能源消费总量三次多项式预测值年份20042005200620072008200920102011真实值203226.7224682246270265583285000预测值202380.4219124.89237698.4258212.3280778.2305507.6332511.9361902.6相对误差百分比（%）0.412.473.482.771.483.2建立ARIMA模型3.2.1平稳化处理用ARIMA模型拟合的时间序列必须是平稳的，如果序列不平稳，则要通过差分或序列变换等先将序列平稳化。绘制原始序列的时序图得到图形如图三所示：16 图三：y时序图由图可从直观上看出原始序列存在明显的长期递增趋势，原始序列不平稳。利用软件EViews6.0，运用单位根检验方法对序列进行平稳性检验发现原始序列确定不平稳，因此本文先对该序列取对数，令，然后对yl进行差分，差分两次之后得到平稳的序列ylii。单位根检验结果如下表二所示：表三：单位根检验结果ADF值P值临界值a=1%临界值a=5%临界值a=10%原始序列y1.7585820.9995-3.68919-2.97185-2.62512取对数后yl0.6275170.988-3.68919-2.97185-2.62512一阶差分yli-2.958250.0529-3.72407-2.98623-2.6326二阶差分ylii-4.765430.0007-3.69987-2.97626-2.62742由表可知，取对数后再做两次一步差分之后的序列yliiADF检验的p值为0.0007，小于0.05，因此拒绝序列非平稳的原假设，可以接受序列为平稳的备择假设。在此可知ARIMA模型定阶为d=2。也可由图标直观说明序列的平稳性，作出ylii的时序图如图四所示：16 图四：ylii时序图时序图也显示ylii序列平稳，结果与单位根检验相符。3.2.2模型定阶模型定阶的方法有多中，本文选择基于自相关函数和偏自相关函数的定阶方法确定模型的阶数。首先，考察平稳序列ylii的自相关图和偏自相关的性质，为拟合模型定阶，自相关函数(ACF)和偏自相关函数（PACF）图形如图五所示;图五：由图形可知，对处理后的序列ylii可以选择建立ARIMA(1,2,1)、ARIMA(1,2,2)、ARMA(2,2,1)、ARIMA(2,2,2)4种模型。分别拟合这四种模型得到结果如表四所示：16 表四：4种模型拟合结果模型变量估计系数T统计量伴生概率P值调整AICSCARIMA(1,2,1)AR(1)-0.37510-1.228110.230400.17179-4.13804-4.04288MA(1)0.745243.238980.00330ARIMA(1.2,2)AR(1)0.326321.534930.137400.27357-4.23696-4.09422MA(1)-0.25253-1.742640.09370MA(2)-0.73255-5.340260.00000ARIMA(2,2,1)AR(1)-0.25552-0.952150.350500.18863-4.15745-4.01347AR(2)-0.23472-1.227330.23160MA(1)0.594242.305320.03010ARIMA(2,2,2)AR(1)-0.76684-5.246990.000000.28900-4.25798-4.06601AR(2)-0.59005-3.948570.00060MA(1)1.2465320.409940.00000MA(2)0.9265920.036340.00000其中只有ARIMA(2,2,2)模型的各系数通过了显著性检验，而且其模型的调整是四个模型中最大的，虽然它的AIC，SC的绝对值不是最小的，ARIMA(1,2,1)模型的AIC最小，ARIMA(2,2,1)的SC最小，但它们的系数都没有通过显著性检验，而且调整也较小，所以本文选择ARIMA(2,2,2)模型，模型表达式为：3.2.3模型检验用ARIMA(2,2,2)模型做拟合得到残差序列，对残差序列进行自相关和偏自相关分析，得到结果如图三所示：16 图六由图可知。残差序列P值几乎都是大于0.05的，说明残差序列近于白噪声，基本没有可提取的信息了，模型已经提取了有规律的信息，说明模型拟合效果较好。3.2.4模型预测利用1978-2008年的时间序列建立的ARMA(2,2,2)模型：来预测2004-2010年的能源消耗总量，结果如表五所示：表五：2004-2010年全国能源消耗总量ARIMA(2,2,2)模型预测值年份2004.002005.002006.002007.002008.002009.002010.002011.00实际值203226.68224682.00246270.00265583.00285000.00预测值202971.88233243.50268974.47311049.59358189.95413129.35477104.00549931.36绝对相对误差百分比(%)0.133.819.2217.1225.683.3灰色模型预测根据历史数据序列，做一次累加得到生成序列，对于微分方程，构造数据矩阵B和数据向量Y，解该微分方程，得到其中：16 进行矩阵运算得到发展灰数a=-0.055673，内生控制灰数=45508.908，得到预测模型为：。3.3.1残差检验将得到的序列进行一次累减生成预测序列，将预测值与真实值比较得到绝对误差序列为：={0、8516.84、7337.171、3478.379、2894.069、3479.306、4761.587、6752.808、6917.228、8466.436、10356.31、9561.971、6328.756、6120.155、5915.771、6827.269、7321.323、9152.556、9938.481、1402.44、11990.47、18629.48、22636.52、27218.27、28376.96、15499.22、1831.269、11756.32、21153.92、27578.59、33369.39}计算相对误差后发现其中有些较大，甚至大于10%，最后五项的平均相对误差为7.36319507%。残差检验没有通过，下面进行关联度检验。当=0.5时，关联度大于0.6时就可以通过关联度检验了。由残差的绝对序列可知=0,=33369.39。根据公式计算每个序列值的关联系数，再求平均得到关联度r=0.650237。本文取取=0.5，r>0.6,因此模型通过了关联度检验。虽然模型通过了关联度检验，但模型没有通过残差检验，精度不够理想，所以本文对该模型进行残差修正。3.3.2模型修正根据模型得到的残差序列，去掉第一项得到新的序列，然后进行累加得到序列，在此基础上建立相应的模型：，模型两边求导得到残差修正项为：16 。原预测模型加上此修正项得到修正后的预测模型为：，其中为修正系数。最后进行累减得到原始序列预测模型：。根据所得数据，利用Excel软件，得到=-0.06924，=2893.212。根据修正项的计算公式，可得，这样经过残差修正后的模型为：其中。在此序列的基础上进行累减得到2004-2011年的全国能源消耗总量的预测值如下表六所示：表六：2004-2011年全国能源消耗总量灰色模型预测值年份20042005200620072008200920102011实际值203226.7224682246270265583285000预测值201439.6212966.946225154.6238040.3251664.1266068.2281297.3297398.4相对误差百分比(%)0.875.218.5710.3711.693.4组合模型以上三种方法有些精度较高，有些精度较低，但由于各自理论的缺陷，会使预测产生系统偏差。为了更充分的提取样本信息，提高预测精度，本文将以上三种预测模型进行组合得到一个组合的预测模型。组合模型的权重有多种，可以等概率取权重，可以采用最小二乘估计法取权重，也可以使权重，其中为残差标准差，m为单一模型的个数，或者使权重16 ，其中为第i个单一模型误差平方和，m为单一模型个数。本文采用第三种取取权重的方法，即。利用Excel软件求得权重分别为：=0.466858，=0.171932824，=0.361209557根据预测模型：对2004-2011年的全国能源消耗总量进行预测结果如下表七所示：表七：2004-2011年全国能源消耗总量组合预测值年份20042005200620072008200920102011真实值203226.68224682246270265583285000预测值202142.34219328.12238544.92260010.57283571.66309765.5338872.9370931.5相对误差百分比（%）0.532.383.132.090.504模型精度比较及预测对预测全国能源消耗总量的各个模型进行评价的指标体系采用平均绝对相对误差百分比，其计算公式为：各种方法预测结果的精度见表八。表八：四种方法预测结果的平均绝对相对误差方法ARIMA(2,2,2)灰色模型回归预测组合模型平均绝对相对误（MAPE)11.19%7.34%2.12%1.73%由表可知，在三个单一的预测模型中，回归预测模型的平均绝对相对误差最低为2.12%，预测精度最高。组合预测模型结合了单一预测模型的优势，其精度大大提高，平均绝对相对误差百分比为1.73%，是四种预测模型中最低的。因此本文采用组合预测模型往后作三期预测，得到2009-2010年全国能源消耗总量的预测值如表九所示：16 表九：2009-2010年全国能源消耗总量预测值年份200920102011预测值309765.54338872.92370931.545结论国家能源的消耗是经济发展指标的重要指标。通过预测国家的能源消耗可以为宏观的能源政策提供可信的依据，同时也可以通过预测未来几年的能源消耗总量发现我国能源消耗上的问题，制定出相关的措施，使国家经济稳定健康的增长。回归分析运用线性模型进行拟合，因此精度高，但是通过散点图拟合时也可能找不到十分吻合的线性模型。ARIMA预测模型由于不需要对时间序列的发展模式作先验的假设，可通过反复识别修改，直至获得满意的模型。模型还考察到了误差的重要性，这样有利于提高模型的精度。在灰色预测法中首先重视的是数据的累加，其次是矩阵的计算；另外，要用用后验差检验法检验，求出进行方差比与小误差概率的计算分析，只有达到预测精度要求的模型才能用以预测。通过对全国能源消耗总量的实例分析，发现基于回归预测预测模型、ARIMA预测模型和灰色模型的组合模型的精度最高，组合模型较大限度地利用各种预测样本信息，考虑问题更系统、更全面。因此，利用组合模型对全国能源消耗总量进行预测，为能源规划及政策的制定提供科学的依据。参考文献[1]中国国家统计局中国统计年鉴2009[2]徐国祥编著.统计预测与决策.上海财经大学出版社，2009[3]刘勇，汪旭辉.ARIMA模型在我国能源消费预测中的应用.经济经纬.2007，[4]徐国祥，统计预测与决策，上海：上海财经大学出版社，2008。[5]赵彦云，宏观经济统计分析，北京：中国统计出版社，2003。[6]国家统计局.中国统计年鉴.2010.[7]何晓群.多元统计分析[M].北京：中国人民大学出版社,2009[8]徐国祥.统计预测与决策.上海：上海财经大学出版社,2010.7[9]王燕.应用时间序列分析[M].北京：中国人民大学出版社,200916 附件本文利用《中国统计年鉴》得到全国能源1978~2009消耗总量如下表一所示：全国能源消耗总量（单位：万吨标准煤）年份能源消耗总量（万吨标准煤）原煤原油天然气新型能源19785714441715.1213657.42571.441200.02419795858842534.8913943.94644.4681464.719806027543699.3814164.63723.31687.719815944743396.3113613.36713.3641723.96319826206745060.6414151.28806.8712048.21119836604048077.1214859858.522245.3619847090451759.9215527.981063.562552.54419857668256207.9116409.951226.9122837.23419868085058939.6517463.61293.63153.1519878663263847.7817672.931472.7443638.54419889299768631.7918506.41766.9434091.86819899693471828.0918902.131841.7464362.0319909870373138.9218950.981974.064639.041199110378377110.7719614.992075.664981.584199210917080785.820414.792183.45786.01199311599386530.7820414.772203.8676843.587199412273792420.9620374.342332.0037609.69419951311769838222168.742623.528001.7361996138948103238.423899.062917.9089031.621997137798101005.924390.253031.5569370.264199813221497706.1522873.023305.358329.482199913383197964.2923018.933613.4379234.3392000138552.6101143.422584.073879.47310945.662001143199.2105251.422625.474152.77711169.542002151797.3115669.521403.424098.52710625.812003174990.3134917.522398.764899.72812774.292004203226.7157703.924387.26096.80115038.782005224682174802.625389.077639.18816851.152006246270191351.826597.169111.9919209.062007265583203967.727886.2210862.3422893.25200828500022030528215116852479516 理学院课程设计评分表课程名称：统计预测与决策项目评价设计方案的合理性与创造性设计与分析结果设计报告书的质量课程设计周表现情况综合成绩教师签名：日期：16 （注：1．此页附在课程设计报告之后；2．综合成绩按优、良、中、及格和不及格五级评定。）16

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 17



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

大家都在看

近期热门

统计预测与决策课程设计论文设计

统计预测与决策课程设计论文设计

最近更新

大家都在看

相关文章

相关标签