基于组合预测方法的销售预测研究与应用

基于组合预测方法的销售预测研究与应用

ID:34594340

大小:5.17 MB

页数:70页

时间:2019-03-08

上传者:U-24835
基于组合预测方法的销售预测研究与应用_第1页
基于组合预测方法的销售预测研究与应用_第2页
基于组合预测方法的销售预测研究与应用_第3页
基于组合预测方法的销售预测研究与应用_第4页
基于组合预测方法的销售预测研究与应用_第5页
资源描述:

《基于组合预测方法的销售预测研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得丢津王些太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:多火淆冀签字日期:州(阵f月fr日学位论文版权使用授权书本学位论文作者完全了解丢洼王些太堂有关保留、使用学位论文的规定。特授权丢洼工些太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:狄哺华导师签名:赢7I峻签字日期:列(f年f月f媚签字日期:Hcf年f月侈日 学位论文的主要创新点一、本文在比较分析和研究国内外销售预测模型的基础上,针对当前国内销售预测研究中存在的问题,提出了一个适合于国内企业销售预测的组合预测模型一一基于粒子群优化的支持向量机组合预测模型。利用支持向量机进行组合预测只需要通过少数样本的学习就能获得各个单项预测模型的权重系数。另外,粒子群优化算法的应用也使得支持向量机中的参数选择更加合理。二、本文选取残差改进的GM(1,1)模型、基于主成分分析和粒子群优化的支持向量机回归模型以及自适应滤波器预测模型作为组合预测模型中的单项预测模型。残差改进的GM(1,1)预测模型和支持向量机回归预测模型的选择综合了时间序列预测和回归预测两种方法的优势。而选择自适应滤波器作为组合预测模型中的一种单项预测模型进一步提高了组合模型的预测精度,同时也为该模型在国内销售预测领域的应用进行了探索。 摘要销售预测是企业管理的重要环节,’做好销售预测,对企业合理配置资源,科学组织生产,降低成本,增加利润,进一步提高企业的竞争力具有十分重要的意义。随着中国加入WTO和经济全球化的进一步发展,国际间经济交往迅速增加,企业之间的竞争更加激烈,对企业销售预测精度的要求也越来越高。因此,建立一个准确且科学的预测模型已经成为了一个亟待解决的问题。组合预测方法,即将多种预测模型以一定权重进行组合的方法。组合预测方法能够综合各个预测模型的优势,更加全面地反映预测对象的信息,大大提高预测结果的精度。本文研究重点是基于组合预测方法的销售预测研究。本文首先提出了选题背景、研究目的、研究意义及国内外研究现状,论证了销售预测在企业中的重要地位以及当前国内外销售预测研究的现状以及存在的问题。其次,在对常用的预测方法进行比较研究的基础上分析了组合预测方法的优势。再次,在研究国内外销售预测模型方法理论的基础上,建立了基于粒子群优化的支持向量机组合预测模型,选取残差改进的GM(1,1)模型,基于主成分分析和粒子群优化的支持向量机回归模型、基于LMS算法的自适应滤波器模型作为组合预测模型中的三种单项预测模型。论文对该组合模型以及其中三种单项预测模型的构建过程进行了详细的论述。最后在MATLAB和SPSS软件的辅助下,对该组合预测模型进行了实证分析,并对预测结果进行了评价。评价结果证明该组合预测模型可以使预测精度大大提高。本文提出了基于组合预测方法的企业销售预测模型。本研究对科学的销售预测方法在企业中得到广泛推广和运用,促进企业管理水平的提升具有一定的实际意义。关键词:销售预测;组合预测方法;支持向量机;GM(1,1)模型;自适应滤波器 ABSTRACTSalesforecastingplaysimportantrolesinbusinessmanagement.Makingagoodforecastisofgreatsignificancetorationalallocationofenterpriseresources,scientificproduction,reducingcosts,increasingprofits,andfurtherimprovingthecompetitivenessofenterprises.WithChina'saccessiontotheWTOandthefurtherdevelopmentofeconomicglobalization,internationaleconomicexchangesincreasedrapidly,thecompetitionbetweenenterprisesbecamefiercer,andtherequirementofsalesforecastaccuracyinenterprisesishigherandhigher.Obviously,thereshouldbeanaccurateandscientificpredictionmodel,whichisaproblemthatneedsurgentsolution.Combinationforecastingisamethodthatcombinesdifferentforecastmodelsthroughassigningcertainweightstoeachforecastmodel.Advantagesofeachforecastmodelandcomprehensiveobjectinformationisincludedinthemethod,whichgreatlyimprovestheaccuracyofpredictionresults.Tllisarticleprimarilystudiessalesforecastingbasedoncombinationforecastingmethod.Tllispaperstarts、析tlltheresearchbackground,purpose,significance,overseasanddomesticresearchstatus,anddemonstratestheimportantpositionofsalesforecastinginenterprises,aswellastheresearchonexistingproblemsofcurrentsalesforecastingstudy.Thenitremarksontheadvantagesofcombinationforecastingonthebasisofcomparativeanalyzingforecastingmethodswhicharecommonlyused.Thirdly,afterstudyingofthesalesforecastingmodeltheory,combinationforecastingofsupportvectormachinebasedonparticleswarmoptimizationisproposed,、Ⅳitllthreekindsofsinglepredictionmodels,whichareGM(1,1)modelbasedonadvancedresidualerrormodified,andsupportvectormachine(SVM)regressionmodelbasedonprincipalcomponentanalysisandparticleswarmoptimization,andmodelofadaptivefilterbasedonLMSalgorithm.Theprocessofconstructionofcombinationforecastingmodelandthreekindsofsingleforecastingmodelaredemonstratedinthispaper.Finally,MATLABandSPSSareusedtoverifythiscombinationforecastingmodelandevaluatethepredictionresults.111eevaluationresultsshowthatthiscombinationforecastingmodelCanimprovetheforecastingprecisioneffectively.Salesforecastingmodelofenterprisesbasedoncombinationforecastingmethodisproposedinthispaper.Theresearchhascertainpracticalsignificanceonthepromotionofscientificsalesforecastingmethodintheenterprise,SOastoimprove thelevelofcorporatemanagement.Keywords:Salesforecasting;Combinationforecasting;SupportVectorMachine;GM(1,1)model;AdaptiveFilter 目录第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..11.1选题背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2国内外的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..11.2.1国外的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..11.2.2国内的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..31.2.3销售预测方法现状分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..51.3研究目的与意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.51.3.1研究目的⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..51.3.2研究意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..51.4论文结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.61.5研究方法和技术路线⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯71.5.1研究方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..71.5.2技术路线⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..71.6本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.8第二章预测方法概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.1常用的预测方法概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.92.1.1时间序列预测方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.1.2回归预测方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯102.1.3人工神经网络预测方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.102.1.4组合预测方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯112.2预测方法比较分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.122.3本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯12第三章组合预测模型构建的理论基础⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯133.1单项预测方法的基本模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.133.1.1支持向量机回归预测模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..133.1.2GM(1,1)预测模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.153.1.3自适应滤波器预测模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.183.2组合预测方法的基本模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.203.3本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯22第四章基于粒子群优化的支持向量机组合预测模型的构建⋯⋯⋯⋯⋯234.1预测方法的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯234.1.1单项预测方法的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯234.1.2组合预测方法的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯244.2组合预测模型的构建⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯254.2.1单项预测模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯254.2.2基于粒子群优化的支持向量机组合预测模型⋯⋯⋯⋯⋯.374.3预测结果的评价⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯384.4本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯40第五章汽油的销售预测实证研究一一以中国石油化工股份有限公司为例⋯41 5.1公司背景介绍⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..415.2中国石油化工股份有限公司的汽油销售预测的分析⋯⋯⋯⋯⋯.415.2.1汽油销售预测影响指标的选取⋯⋯⋯⋯⋯⋯⋯⋯⋯.415.2.2组合预测实证分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..445.3预测结果的评价⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯525.4本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.53第六章结论与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.55参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..57发表论文和参加科研情况说明⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..61致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯63 第一章绪论1.1选题背景弟一早殖比经济全球化的趋势下,销售预测对于企业和国家都有重要的实际意义。如今,我国的各行各业己经由最初的卖方市场向买方市场转变,顾客的市场地位逐渐提高,这对我国的企业提出了更高的要求n1。在以“顾客是上帝”的市场经济中,企业对于顾客需求的把握不仅要着眼于现在,更重要的是把握和预测未来。特别是在互联网技术飞速发展、顾客需求千变万化、国际竞争日益激烈的今天,销售预测已经成为一个企业生存和发展的制胜法宝。销售预测,是一个对过去的销售信息采用一定的销售预测方法进行分析,并推测未来销售情况的过程。销售预测方法的选择是企业销售预测过程成败的关键。因而,国内外的学者开始致力于销售预测方法的研究。从最初的定性预测方法的研究到定量预测方法的研究,再到目前流行的组合预测方法的研究。由于每种销售预测方法的应用都有各自的前提条件、优势、劣势以及误差特性,在具体应用时,需要综合分析以确定最优的预测方法。如果没有准确的销售预测方法,企业不可能对市场的需求情况做出准确的预测,也就不可能制定准确的市场决策,企业也就不能在市场竞争中占据优势的地位。综上所述,建立一个能够反映我国企业实际情况,同时能够综合反映研究对象信息的销售预测模型,是企业销售预测成功的关键。为我国企业的销售预测建立一个具有较高预测精度的销售预测模型,不仅对企业的产品销售计划的制定具有重要的实践意义,同时对于企业整个经营决策的制定具有重要的理论意义。1.2国内外的研究现状高质量的销售预测对企业的经营决策起着至关重要的作用。在企业销售预测过程中,销售预测模型的选择是整个销售预测过程的基础,也是销售预测结果准确性的关键,因此,越来越多的国内外学者开始致力于销售预测方法的研究。1.2.1国外的研究现状国外的销售预测方法主要是定量方面的研究。定量预测方法能够对预测对象数量上的变化程度做出准确描述,预测结果不易受人的主观因素的影响。与定性预测方法相比,它对所需信息资料的质量和数量要求较高,而且所需的时间和成本都较高。国外学者提出的销售预测方法主要有BoxandJenkins预测法,VAR 天津工业大学硕士学位论文模型、人工神经网络预测法、自适应滤波器法以及组合预测方法等。博克斯一詹金斯法,即BoxandJenkins法或者ARMA模型,该法是以美国学者GeogreE.P.Box和英国统计学家GwilymM.Jenkins的名字命名的,是一种时间序列预测方法。RitanjaliMajhi,BabitaMajhi等利用基于粒子群优化算法的ARMA预测模型对某一零售企业的销售情况进行了预测,并通过将预测结果与基于最dx-乘法的ARMA模型,FLANN模型以及MLP模型的预测结果进行比较分析,结果证明了这种预测方法能够获得较高的预测精度。Zerubia,Josiane,Alengrin等则针对当前AP31A实际应用中对APiSh(p,q)模型中参数的需要,提出了一种能够有效得到该模型参数的方法,并举例说明了该方法的可行性。VAR预测法,即回归预测方法,它包含一般的线性回归和非线性回归。M.R.Taghizadeh等利用在线性回归的基础上提出的模糊线性回归,以1993—2005年的历史能源数据为基础对2006—2020年的运输能源进行了预测瞳1。而LouisW.Y.LuandChih—ChyiChiang贝U通过分析和研究美国和亚洲区域的维修记录,得出利用6维的多项式回归模型对印度x公司的LCD维修成本的预测效果最好的结论∞1。ANN预测法,即人工神经网络预测法,很多国外学者在它的基础上提出了MLP神经网络模型、径向基神经网络模型以及BP神经网络预测模型等。Mr.PritamandR.Charkha针对不同的对象利用不同的神经网络模型进行了预测。如利用基于反向传播算法和早期停止算法的前馈神经网络对股票的价格进行预测,利用径向基神经网络对股票的趋势进行预测H1。NayeraSadek和AlirezaKhotanzad禾lJ用MLP神经网络模型对网络中四种不同形式的网络量进行了预测畸,。自适应过滤法,目前主要应用在通信领域中的信号预测。基于自适应过滤法的自适应性,许多国外学者正努力研究它在其他领域预测中的应用。XiaolianZhang矛lBenM.Chen利用基于自适应滤波器思想的系统自适应框架对美国、中国和西雅图的股票进行了预测,该自适应框架包含一个内部动态模型和一个自适应滤波器哺1。他们将股票市场视为一个高度复杂的系统,在系统控制理论的基础上提出了这个基于动态反馈的自适应的框架。1969年,J.M.Bates矛DC.W.J.Geranger在《运筹学季刊》第20卷上发表论文《组合预测》(1969),文中比较系统的研究和分析了组合预测方法。自从组合预测方法被提出以来,很多国外学者积极研究这个方法在各自领域的适用性以及这个方法的优势所在盯1。G.PeterZhang在差分自回归滑动平均模型(ARIMA模型)的基础上,结合最新流行的人工神经网络预测方法提出了一种组合预测方法,这种方法能很好的反映线性变化和非线性变化,同时实验结果也表明了这种预测方法的可行性隅1。另外,HaiyanSong,StephenF.Witt和Kevin.F.Wong等将组合预测方法应用到了旅游业中,并根据旅游业的行业特点选择了适合于它的单一 第一章绪论预测方法旧。。总体而言,从国外的研究现状可以看出,国外的学者更加注重定量预测方法的应用,而且积极应用其他领域的预测方法,并将多个领域的预测方法组合进行预测。定量方法的应用使得预测结果更加可靠、准确.其他领域预测方法的应用为未来的研究奠定了基础,而将多个领域的预测方法组合预测能够综合利用研究对象多个角度的信息,预测结果更加准确。1.2.2国内的研究现状在国外各个领域的学者针对各自领域的行业特点提出了本行业的销售预测方法的同时,国内的许多学者也不甘落后,努力研究适合于中国国情的销售预测方法。与国外提出的预测方法相比,目前国内提出的销售预测方法主要包括专家意见法、情景预测法和pert计划评审技术法等定性预测法,以指数平滑法和自回归滑动平均法为代表的时间序列预测法、回归分析法、灰色预测法以及人工智能方法等定量预测方法,加权平均组合预测、最优加权系数组合预测等组合预测方法。定性预测法能够充分利用专业人员的经验以及分析判断的能力来预测事物发展变化的规律,能够对具有重大转折点的市场变化做出准确性的估计。万艳敏,陈胜等利用定性预测法中的PERT计划评审技术法对某具体公司的销售情况进行了预测‘101。时间序列预测法是通过对历史的时间序列的分析得出随着时间变化销售数据的变化规律从而通过科学的预测模型来预测未来时间产品的销售量。朱煜明等在充分借助水晶球软件包的预测模块的条件下对某省成品油的供需情况利用时间序列预测法中的指数平滑和移动平均两个模型进行了预测。灰色预测法,是时间序列预测法的一种,它是由华中科技大学控制科学与工程系的邓聚龙教授于1982年提出的一种预测方法。这种方法是通过分析历史统计数据,采用某一种预测模型进行预测。李望晨,张利平等用灰色预测模型对婴幼儿及孕产妇的死亡率进行了预测。另外,在对灰色预测模型的改进方法中,孔令云,沈娟对GM(1,1)预测模型的精度与原始数据量的关系,与预测步的关系,与发展系数的关系以及与原始数据规律性的关系等方面进行了分析研究,为以后更好的预测提供了理论基础⋯1。回归分析起源于生物学的研究,英国生物学家高尔登在研究遗传特性时发现了回归的现象。之后美国经济计量学的先驱者摩尔用它进行了经济预测的研究。目前,回归分析的理论与应用均己达到成熟的阶段。随着信息技术的发展,回归分析理论正逐步与计算机进行结合研究。王晕在通过关联度系数的分析求出预测模型所需的关键自变量,然后利用协整理论来消除虚假回归,并利用建立的多元 天津工业大学硕士学位论文线性回归模型预测了我国2006-2020年的石油需求量n2|。李菊花等在分析筛选影响油田产油量的因素的基础上利用多元线性回归模型预测了某油田的产油量n3|。此外,朱泽宇为了降低多元线性回归方程建立的难度,提出来一种新的、特殊的回归方法一一逐步回归法;而赵明则充分利用计算机统计工具EXCEL简化了回归方程的建立过程¨4l。神经网络是20世纪40年代发展起来的一种预决策技术,因其具有极强的非线性动态处理能力,强大的自适应、自学习功能而被广泛应用于不同领域。但是,由于它对样本数据过分拟合、泛化能力低等缺陷,很多学者对其进行了不同的改进。郑洪源等为了防止由于逐个输入样本而带来权重修改过频引起震荡,采用了批处理样本的方法,即一批样本并行输入网络后统一进行一次修正口引。邰丽君等则利用遗传优化算法对BP神经网络的参数进行了改进,利用遗传算法解决了BP神经网络的易陷入局部极小值的缺点n6|。支持向量机(SupportVectorMachine,SVM)是由CorinnaCortes和Vapnik等学者于1995年提出的,它在解决小样本问题、非线性问题及高维模式识别中表现出很多独特的优势,并可以推广应用于函数拟合等其他机器学习问题研究中。刘崇林就首次利用支持向量机对我国的人口进行了预测,并在文献中采用了相空间重构的方法来获得更多的信息以更有效地进行预测n7|。王强等在研究分析影响卷烟焦油量因素的基础上和WinSVM软件的支持下,利用支持向量机进行了回归预测‘18|。我国对于组合预测的研究起始于唐小我进行的一系列权系数组合预测的研究工作。1991年唐小我进行了基于最优加权系数的组合预测研究,文中系统地讨论了加权平均组合预测的有关问题,给出了最优加权系数向量的计算公式。对于后来学者研究组合预测权重有了极大的参考价值口9|。例如逢守艳,刘荣金的基于组合预测法预测黑龙江省粮食产量的文献。对于固定权重的研究,学者们研究的最多的是关于最优权系数的确定方法瞳0|。卢惠林对组合加权算术平均算子在物流配送商品销售预测中的应用进行了研究,在已有权重确定方法的基础上提出了广义最优组合预测权系数确定模型,并采用遗传算法对此模型进行求解口¨。在固定权重系数研究的基础上,很多人已经开始研究变权重系数的确定。谢开贵,周家启两人针对变权组合预测模型,提出来一种变权系数估计的电信算法,并通过实例分析验证了使用这种方法之后预测效果的显著性乜2|。王方顺等提出一种改进变权重的组合预测模型,该模型针对小样本、多维、多峰、非线性的销售时序特点,采用了基于支持向量机的三种预测方法,预测精度显著高于单项预测模型和传统变权重组合预测模型,同时也降低了变权重系数计算的复杂度瞳3I。 第一章绪论从国内的研究现状看,国内的学者侧重于对定性和定量两种预测方法的研究。针对中国复杂的市场环境,很多学者充分利用定性预测方法中人的知识和经验进行销售预测,使得预测过程更简单、快速,从而更加节省时间和费用。对于定量预测方法的研究正在逐步结合人工智能知识,但是目前对于人工智能预测方法的研究仍然处在研究阶段。1.2.3销售预测方法现状分析通过对国内外销售预测相关文献的研究,发现国内外现有的销售预测方法主要存在以下两个问题。第一,大部分只是使用了单一的预测方法,并未充分利用多种方法的优点将其整合来达到最佳的预测效果。而一些销售预测的文献中虽然采用了多种预测方法的组合方法,但都是静态固定比例的组合,这种固定比例的组合只是反映了当时的一种市场变化情况,并不具有很好的代表性和可移植性。第二,目前有关组合预测的研究中的两种预测方法,大部分都是基于时间序列数据的定量预测方法,而没有将两类预测方法进行组合,例如定性与定量方法的组合,或者是两类不同的定量预测方法的组合。1.3研究目的与意义1.3.1研究目的准确的销售预测使企业能够更好的把握市场动态,从而制定更准确、更符合市场规律的销售计划,而且有利于企业安排更合理的生产计划和库存计划,最终在市场中占据优势的地位。因此,企业需要构建一个具有较高预测精度的销售预测模型,得到更符合市场规律的、精确度更高的销售预测数据。产品的销售预测过程是一个动态的、极其复杂的过程,其预测结果不仅受市场环境的影响,也受很多其他随机、偶然因素的影响。因此,销售预测模型的选择是整个销售预测过程的关键。在深刻剖析当前销售预测方法特点的基础上,基于我国市场经济的特点,本文提出了基于组合预测方法的销售预测模型。此种方法不仅为企业的销售预测过程中提供更加可靠、有效的预测模型,而且能够大大提高预测结果的精度。1.3.2研究意义本论文主要是对基于组合预测方法的销售预测研究。针对我国企业产品的销售预测,研究组合预测方法在销售预测中的研究有着重要的理论意义和现实意义。一方面,通过对组合模型中单一预测模型以及组合模型本身如何确定的研 天津工业大学硕士学位论文究,为以后进行销售预测方面的研究奠定了理论基础,同时对指导企业进行实际的销售预测提供更多的理论研究的资料。另一方面,本文所构建的组合预测模型不仅能够充分反映历史数据的横向信息(自变量和因变量之间关系的信息)和纵向信息(时间序列数据之间的规律性发展关系),而且能够大大提高预测精度。因此,基于组合预测方法在销售预测中的研究对于企业进行实际的销售预测具有重要的现实意义。1.4论文结构本论文的研究内容是基于组合预测方法的销售预测研究。通过对预测方法的研究,本文提出了利用三种单项预测模型进行组合预测的方法。组合预测模型采用的是基于粒子群优化的支持向量机组合预测模型。三种单项预测模型分别是基于残差改进的GM(1,1)单项预测模型,基于主成分分析和粒子群优化的支持向量机回归预测模型、基于LMS算法的自适应滤波器预测模型。本论文共分五章,具体内容安排如下。第一章为绪论部分。本章介绍了问题的提出、国内外的研究现状及研究目的和意义,并对本论文的研究内容、研究方法和技术路线进行了论述。第二章为预测方法概述部分。本章对到目前为止所应用的预测方法进行了深入的分析和研究,包括每种方法的优点和缺点,在此基础上提出了本文所选择的组合预测方法,并对组合预测方法的优势进行了阐述。第三章为组合预测模型构建的理论基础部分。本章主要对本文所采用的预测模型的基本理论进行了论述,包括对GM(1,1)模型、自适应过滤法预测模型和支持向量机回归预测模型的论述,以及支持向量机组合预测模型的论述。第四章为组合预测模型构建部分,这是本论文的重点之一。本章提出了本论文所采用的组合预测模型,并对模型中三种单项预测模型以及组合预测模型的构建过程进行了详细阐述。最后,论述了常见的预测结果评价指标。第五章为实证部分,这是本论文的另一重点。本章主要是利用第四章构建的组合预测模型对中国石油化工股份有限公司的汽油的销量进行实证研究和分析。首先利用所构建的三个单一模型进行预测得出结果,然后将三种方法得出的结果作为组合预测模型的输入再进行预测得出最终结果,最后对最终预测结果的有效性进行了评价和分析。第六章为结论部分。通过第五章的实证部分论述了本文所构建的组合预测模型具有一定的研究和实际应用价值。同时,对本文所得出的结论、研究中存在的问题和不足进行了归纳和总结,并对组合预测方法后续的研究进行了展望。 第一章绪论1.5研究方法和技术路线1.5.1研究方法在本论文的研究过程中,主要运用到如下方法。(1)文献研究与实证研究相结合的方法。通过阅读国内外相关文献了解所研究的销售预测方法的研究现状,以及目前各个领域内常用的预测方法,从而构建本文的预测模型。同时,通过对中国石油化工股份有限公司这一石油企业汽油销量的实证预测,证明了本论文所构建的预测模型的有效性和实用性。(2)定性分析与定量分析相结合的方法。本论文在主成分分析前所进行的影响因子的选取过程主要采取了定性研究方法,而预测模型的预测过程则运用了定量分析方法。定性与定量方法的结合既能减少人的主观思维的影响,又能通过量化的方法提高分析结果的准确性。(3)比较分析法。本论文在构建组合预测模型的过程中,在充分了解了每种预测方法的优缺点的基础上,通过比较分析的方法构建本文的组合预测模型。1.5.2技术路线本论文针对组合预测方法在销售预测中的应用进行了研究。首先在介绍选题背景和选题意义的基础上,提出了研究课题和研究内容,并对当前国内外的研究现状进行了文献综述。其次,在借鉴和分析销售预测模型和组合模型相关研究成果的基础上,建立了以粒子群优化的支持向量机预测模型为组合模型的预测方法,以残差改进的GM(1,1)模型、基于主成分分析和粒子群优化的支持向量机回归模型和自适应过滤法预测模型为三种单项预测模型。然后,以中国石油化工股份有限公司的汽油销售为例,应用该组合模型进行了汽油销量的预测。并对预测结果进行了评价,验证了该组合模型的有效性和适用性。本文的技术路线图如图1-1所示。 天津工业大学硕士学位论文1.6本章小结图1.1技术路线销售预测在企业的整个经营过程中占据着非常重要的作用,采用科学的销售预测方法对于企业甚至整个国家都具有非常重大的理论意义和实践意义。本章主要对问题的提出、国内外的研究现状、研究目的和意义、论文的结构以及技术框架进行了阐述,从整体上对研究工作进行认识。 第二章预测方法概述2.1常用的预测方法概述在预测实践中,定性预测方法极易受人的主观因素的影响,不能对事物发展数量上做出精确的描述。因此,很多专家学者通常采用定量的预测方法进行实际预测。常用的定量预测方法包括时间序列单项预测方法、回归预测预测方法、神经网络单项预测方法以及组合预测方法。下面,本节针对各个预测方法进行深入分析,并归纳总结各个预测方法的优缺点。2.1.1时间序列预测方法时间序列预测法是指将预测目标的历史数据按照时间顺序排列成动态数列,然后分析它随时间的变化趋势,并建立数学方法进行外推的定量预测方法乜4l。常用的时间序列预测法有移动平均值预测法、指数平滑法以及ARMA方法等。此方法以“过去的发展模式会延续到未来”为原则,因而这种方法不适合于长期预测,对短期预测效果比较好心4吨5|。通过比较分析,下面将各个常用的时间序列预测方法的的概念和优缺点概括如下。①移动平均值预测法。移动平均值预测法是通过对历史数据进行一定程度的修匀,部分消除不规则的扰动。它主要包括一次移动平均法和二次移动平均法。此方法对于平稳的时间序列数据的预测具有较高的预测精度。实际上,由于现在市场环境的复杂性,一般的时间序列的变化幅度都较大,因此,该方法的预测效果并不好。另外,该方法进行预测时需要大量的原始数据,而且计算过程繁杂、工作量庞大。②指数平滑法。指数平滑法是在移动平均值法的基础上发展起来的,它是一种利用指数平滑值来预测未来需求的方法。常见的有单指数平滑法、二次指数平滑法、三次指数平滑法以及自适应指数平滑法等。指数平滑法克服了移动平均值法中的对多个历史数据同等看待的缺点,在实际的预测过程中具有良好的预测效果。该方法的短期预测效果较好,但对于长期预测的效果较差。③ARMA方法。ARMA(p,q)方法具有三种基本形式,自回归方法AR(p);移动平均方法MA(q)以及自回归移动平均方法ARMA(P,q)。利用ARMA方法进行预测的前提条件是原始预测时间序列是零均值平稳的随机序列。该方法能够克服移动平均法和指数平滑法常出现的滞后误差,是目前最好的单一变量随机时间序列预测法。但是,由于该方法对数据序列的要求较严格,因此,目前对于该方 天津工业大学硕士学位论文法的应用不是很多。④灰色预测方法。灰色系统理论是由中国华中科技大学的邓聚龙教授首次提出,是一种针对数据少、信息少的灰色系统进行研究的新方法乜引。灰色理论在实际的销售预测中常采用的方法是GM(1,1)方法。该方法的发展系数不同,所适用的情况以及预测精度也不同,例如当发展系数小于等于O.3时,该方法可以用于中长期预测而且预测精度在97%以上。在样本数据非常少或者数据缺乏的情况下,灰色预测方法往往具有较高的预测精度。灰色预测方法可以根据历史数据的特点来建立不同的灰色方法,例如可以通过建立不同维度的灰色方法进行预测。相比于回归预测方法,该方法不受样本数量的限制。但是,发展系数的大小严重影响灰色方法的预测精度,因此如果发展系数较大,那么利用灰色预测方法进行预测的结果并不理想。2.1.2回归预测方法世界上万事万物之间都存在着千丝万缕的联系,市场环境亦是如此。回归分析就是通过研究某一研究对象与影响它的因素之间的一种关系,然后建立回归进行预测的方法。相比于时间序列预测方法,回归预测将其他因素的影响考虑在内,充分利用了已有的历史信息,使得预测结果更加准确、合理。回归预测方法按照建立的回归方程是线性还是非线性划分为线性回归预测和非线性回归预测。常用的线性回归预测方法有一元线性回归预测法、多元线性回归预测法等,非线性回归预测方法有支持向量机回归预测方法等。下面针对这几种常用的回归预测方法的特点和适用性进行深入分析。①一元线性回归和多元线性回归预测方法。这两种预测方法都属于线性回归预测方法。它们都是通过分析研究对象和影响研究对象因素之间的关系来建立回归方程进行预测。一元线性回归中只考虑了单个影响因素,而多元线性回归预测方法则考虑了多个因素的影响。这两种预测方法对于研究对象和影响因素之间是线性关系的时候具有较高的预测精度,然而现实生活中这种关系通常是非线性的关系。②支持向量机回归预测方法。它属于非线性回归预测方法中的一种。支持向量机是最近几年国际上模式识别的热点,具有全局最优和良好的泛化能力瞳7。。利用支持向量机进行回归预测时通过对样本数据的学习即可获得输入和输出之间复杂的关系。核函数的引入使得支持向量机的应用更加简单、方便,预测结果更加准确。2.1.3人工神经网络预测方法人工神经网络(artificialneutralnetwork,ANN)是基于人的大脑神经 第二章预测方法概述元处理信息的方式提出的。前向反馈(backpropagation,BP)网络和径向基(radicalbasiSfunction,RBF)网络是目前技术最成熟、应用范围最广的两种网络。人工神经网络包含输入层,隐藏层和输出层,隐藏层可以有多个。从输出层到输入层具有反馈的是前向反馈网络。基本的人工神经网络拓扑结构如图2—1所示啪,29I。输入层穗食层输出层图2.1基本的人工神经网络拓扑结构相比于传统预测方法,人工神经网络具有较强自学习和自组织能力,通过对样本数据的自学习就能很好的拟合历史数据,尤其对于非线性变化的历史数据。同时,它具有很好的容错性,通过对异常数据的处理就能对研究对象进行科学的预测。但是,该方法也存在一些缺陷,例如预测过程中易陷入局部极小值、收敛速度慢、神经网络节点个数难以确定等。2.1.4组合预测方法组合预测的基本含义是指对于同一个研究问题,同时采用两种或两种以上不同预测方法进行预测。在预测实践中,对于同一个研究对象,我们通常采用不同的预测方法。不同的预测方法往往能提供研究对象的不同信息,如果简单地只是利用某一种预测方法,将会丢失很多已知的有用信息,因此,我们应该尽量避免这种情况的发生。组合预测方法能够综合利用各种预测方法所提供的信息,尽可能地提高预测精度,因而一直是近年来国内外预测学界研究的热点之一口0|。自从Bates和Granger在1969年提出组合预测模型以来,组合预测方法便被广泛应用于各个领域口¨。目前组合预测的发展己经由传统的基于固定权重的组合预测,发展到变权重组合预测的研究,以及最近新提出的人工智能方法。以支持向量机为代表的人工智能技术在销售预测方面表现出了极大的优势。它不仅能很好的解决销售预测中的线性和非线性问题,而且仅仅通过样本的学习就能获得很好的预测效果。 天津工业大学硕士学位论文2.2预测方法比较分析与回归预测方法相比,时间序列预测方法是一种依据事物的发展变化具有一定延续性的原则进行预测的方法。时间序列预测法通过研究对象的历史数据资料,对按照时间排序的动态数列进行学习,在此基础上得到最终的预测结果。该方法忽略了外界环境变化对事物的影响,仅仅通过分析时间序列数据进行预测,因此,针对变化幅度较大的数据则会造成预测精度较低的后果。与时间序列预测方法的思想不同,回归预测方法充分分析周围环境对研究对象的影响,通过影响因子与研究对象之间的方程关系进行预测。这种方法反映了一定时间、地点等客观条件下各种现象之间的内在数值联系。因此,回归预测方法对于变化较大的数据具有较高的预测精度。组合预测方法通过将两种或者两种以上的预测方法进行组合预测。因此,相比于单一的时间序列预测方法和单一的回归预测方法,组合预测方法综合了多种预测方法的优点,预测结果更加准确、可靠。综上,不同的预测方法具有不同的优点和缺点,它们之间并不是相互排斥,而且相互补充的。下面对组合预测方法的优势总结如下。①组合预测方法能够更全面的反映预测对象的信息。不同的预测方法包含了不同的样本数据、不同的预测对象信息以及不同的预测角度,因此,将这些不同的预测方法进行组合就同时获得了它们所包含的预测对象的信息,预测结果更能精确的反映研究对象的特点。在此基础上,组合预测的预测精度也将高于各单项预测方法的预测精度。②相比于某一种预测方法,组合预测能够有效地避免单一预测方法的缺点,预测结果的稳定性更好。组合预测方法是在各个单项预测方法集成的基础上进行预测,因此它的稳定性要优于各单项预测方法,预测风险也大大降低。③组合预测方法的采用使得各单项预测方法的选择更加容易。在利用某个预测方法进行预测时,通常我们需要仔细分析研究对象的特点来选择预测方法以达到更好的预测效果,这样既费时又费力,预测结果也不能达到理想效果。由于组合预测方法的预测效果要高于单项预测方法的预测效果,因此,所选择的单项预测方法就没有必要具有较高的预测精度。2.3本章小结本章主要对预测方法和组合预测方法的相关理论做了论述。首先对常用的预测方法进行了概述,然后通过多种预测方法的对比分析,提出组合预测方法所具有的优势。这些基础理论的介绍为文章后续章节奠定了理论基础。 第三章组合预测模型构建的理论基础本文提出的销售预测模型是以残差改进的GM(1,1)模型,基于主成分分析和粒子群优化的支持向量机回归模型、基于LMS算法的自适应滤波器模型为三种单项预测模型,并在三种单项预测模型的基础上以粒子群优化的支持向量机模型为组合预测模型。该组合预测模型首先采用三种单项预测模型进行预测,然后将三种预测模型所获得的预测结果作为组合预测模型的输入,实际值为输出,最后利用组合预测模型进行预测,获得最终预测值。本文提出的组合预测模型不仅能够充分利用产品销售的历史数据的信息(纵向),同时能够充分利用研究对象影响因素的数据信息(横向)。以下是对本文所构建的组合预测模型和单项预测模型的基本原理进行介绍。3.1单项预测方法的基本模型3.1.1支持向量机回归预测模型支持向量机(SupportVectorMachine,SVM)是由VNVAPNK等共同提出的一种专门解决小样本情况下机器学习问题的智能学习技术口2J。它最初用于模式识别问题,由于它对小样本数据的智能学习以及较高的泛化能力,近年来已经逐渐应用到用于解决回归问题。支持向量机回归是寻求使得结构风险最小化的方法,而不是寻求经验风险最小化,因而有效地避免了经验风险易陷入局部极小值的缺点。与传统的支持向量机进行分类不同,支持向量机回归问题的目的是找寻能够使得所有样本点能够达到总偏差最小的最优超平面。因此,在进行支持向量机进行回归时需要引入一个可选的损失函数。根据算法的不同,支持向量机回归包括s一支持向量机回归、u一支持向量机回归和最小二乘支持向量机回归等。下面对s一支持向量机回归的基本原理进行简单介绍。对于给定的样本集S,以及任意给定的占>0,如果在原始空间R”存在超平面厂@)=+6,W∈R玎,b∈R,使得IYi—f(x,)l≤s,V(t,Y∥eS,则称/(X)2+6是样本集合S的占一线性回归。与初等代数类似,I乃一厂(薯)l≤s,V(‘,Y,)∈s等价于s中任何点(一,Y。)到超 天津工业大学硕士学位论文占平面厂(x):+6的距离不超过网2。于是,占一线性回归问题转化为优化问题:.1¨¨2mm五0叫Is14+6-yfI≤g,i=1,2,⋯,7公式(3—1)于是,引入松弛变量,并使用Lagrange乘子法,得到优化问题的对偶形式:min三毫(班¨(小叫(¨m喜(小¨一喜少肛~,)∑(口?一口f)=0,0≤口?,口,≤C,i=l,2,⋯,,i=l公式(3-2)占一非线性支持向量机回归的基本思想是首先确定一个非线性映射,然后通过此映射将输入向量映射到一个高维特征空间(Hilbert空间)中,最后在高维空间中进行线性回归,来取得在原空间进行非线性回归的效果。首先将输入量x通过映射①:R”-->H映射到高维特征空间日中用函数f(x)=CO·①@)+6拟合数据(x,,yt),江1,2,...,/,/。则二次规划目标函数式、||t幽去∑(口;I一口,)(口j一吩)(_·_)+s∑(口?+口,)一∑Y,(口;l一口,)变为:,一口,)(口;一口J)①(一)①(一)+s∑(西+口,)一∑y,(口?一口,)i=Ii=l式中涉及到高维特征空间的点积运算①(一)‘①(_),且函数①是未知的、高维的。支持向量机理论仅仅考虑高维空间的点积运算K(x,,xj)=①(x,)·①(_),而不直接使用函数①,K(x,,z』)为核函数。常用的核函数主要包括下面五种:多项式核:高斯核:七(x,x’)=((x,z’)+d)P,p∈Ⅳ,d≥o公式(3-3)●,口,L,∑州l一2nm 第三章组合预测模型构建的理论基础RBF核:B样条核:m√):卅嗲)地√)=卅紫)k(x,X。)=B2Ⅳ+.([x-x’II)‰v,、sin(N+l/2)(x-工'枷户‘11F丁XSl—rx一,公式(3-4)公式(3-5)公式(3-6)公式(3-7)3.1.2GM(1,1)预测模型在各种研究中,由于不确定性因素的存在和人们认识水平的局限,人们得到的信息往往具有不确定性和模糊性。随着科学技术的发展和人类社会的进步,人们开始研究灰色系统。灰色系统是指信息不完全的系统,即该系统部分信息己知,部分信息未知。中国华中科技大学的学者邓聚龙教授在1982年首次提出了灰色系统理论,该理论是一种研究少数据、贫信息不确定性问题的新方法乜引。经过30多年的发展,灰色系统理论现己日趋完善。目前它的研究内容主要包括灰色方程和灰色矩阵、灰色序列生成、灰色关联分析、灰色聚类评估、灰色系统预测、灰色规划、灰色投入产出以及灰色控制系统等。其中灰色矩阵和灰色方程是整个灰色系统理论的基础,灰色关联分析是整个理论的分析体系。1.GM(1,1)模型的基础理论本文所研究的GM(1,1)模型是属于灰色模型GM体系中的最基本的理论。符号GM(1,1)中的G指grey,M指model,第一个1代表1阶方程,第二个1代表1个变量。如果序列X(o’为非负准光滑序列,则X(o’的1一AGO序列X(1’具有准指数规律口3|。定义3.1设X‘∞=(z‘。’(1),x‘。’(2),...,x‘。’(刀));X‘1’=(x‘1’(1),x‘1’(2),...,x‘1’(,z))称x‘。’(七)+饿‘1’(七)=6为GM(1,1)模型的原始形式。 天津工业大学硕士学位论文定义3.2设X(叭,X(1’如定义3.1所示,Z‘1’=(z‘1’(2),z‘1’(3),...,z‘1’(咒)),其中,z(1’(七)=三(∥’(后)+∥’(七一1”,称x‘0)(七)+忽㈣(七):6为GM(1,1)模型的基本形式。定理3.1设X(。’为非负序列,X‘。’=(x‘。’(1),x‘。’(2),...,x‘。’(胛)),其中,x‘。’(七)≥O(k=1,2,⋯,胛)。X(1’为X(。’的1一AGO序列,X‘1’=(x‘1’(1),x‘1’(2),...,x‘1’(,2)),其中kx‘1’(七)=∑x‘。’(f)(后=1⋯2..,门)Z(1’为X(1’的紧邻均值生成序列,Z‘1’=(z‘1’(2),z‘1’(3),...,z‘1’(胛)),其中z(1’(七)=三(x(1’(七)+x(1’(七一1)),七=2,3,⋯,,z若a=【口,6】,为参数列且】,:x‘o’(2)z‘o’(3)z‘o’(力),B=一z‘1’(2)一z‘1’(3)一z‘1’(,z)则GM(I,1)模型x‘。’(七)+忽‘1’(后)=6的最小二乘估计参数列满足a=(BrB)-1B7’】厂公式(3—8)定义3.3设X‘o’为非负序列,X‘1’为X‘o’的1一AGOvF歹U,Z‘1’为X‘1’的紧邻均值生成序列,[a,b]r=(BrB)-,BrY,则称号}+锻(1)=6为GM(1,1)模型x‘。’(七)+忽‘1’(尼)=6的白化方程,也叫影子方程。定理3.2设B,】,,a如定理3.1所述,a=[口,6]r=(B71B)-1B7’Y,则—dx—o)+僦(1):6白化方程dt的解也称时间响应函数为: 第三章组合预测模型构建的理论基础∥协(∥协≯a‘+_a公式(3一-9一)哆∑节()GM(1,1)模型x‘。’(七)+饿‘1’(七)=6的时间响应序列为曼。’(七+1)=(x(0’(1)一尝)P一靠+尝,七=1,2,...,,z公式(3—1。)口乃\育(:1—1f1)还原值为:曼‘0’(七+1)=曼。’(七+1)一曼。’(后)=(1一P。)(x(0’(1)一鲁)P—w,七=1,2,...,刀公式(3—11)定义3.4称GM(1,1)模型中的参数一a为发展系数,b为灰色作用量。一a反映了xu’及z¨’的发展态势。一般情况下,系统作用量应是外生的或前定的,而GM(1,1)是单序列建模,只用到系统的行为序列(或称输出序列、背景值),而无外作用序列(或称输入序列、驱动量)。GM(1,1)模型中的灰色作用量是从背景值挖掘出来的数据,它反映数据变化的关系,其确切内涵是灰的。灰色作用量是从内涵外延化的具体体现,它的存在时区别灰色建模与一般输入输出建模的分水岭,也是区别灰色系统观点与灰箱观点的重要标志。2.残差GM(1,1)模型的基本理论为了提高GM(1,1)模型的精度,利用残差序列建立GM(1,1)模型,对原始模型进行修正。定义3.5设s‘o’=(占‘o’(1),s‘o’(2),⋯,占‘o’(刀)),其中,占‘o’(尼)=x‘1’(七)一曼‘1’(七)为X‘1’的残差序列。若存在七。,满足V七≥ko,s‘o’(尼)的符号一致,且刀一七o≥4,则称(Is‘。’(‰)I,ls‘。’(‰+1)I,...,ls‘。’(‰+,z)I为可建模残差尾端,仍记为占‘o’=(s‘o’(‰),占‘o’(ko+1),⋯,£‘o’(刀))定义3.6设s‘∞=(g‘o’(‰),s‘o’(ko+1),...,s‘o’(门))为可建模残差尾段,其1一AGO序列占‘1’=(占‘1’(‰),s‘1’(ko+1),...,s‘1’(万))的GM(1,1)响应式为 天津工业大学硕士学位论文占(1’(七+1):(占(。’(七。)一--6一‘)e-一,L-如)+笠,k>ko公式(3—12)a£a5则残差尾段s‘o’的模拟序列为吾‘o’=(善‘o’(‰),舍‘o’(ko+1),...,垂‘o’(力)),其中吾‘。’(后+1):(一口。)(s(。’(‰)一bE)e-ac.(k-%),k>_ko公式(3—13)a8定义3.7若用参‘o’修正j(n,则称修正后的实际响应式(x㈣(1)一鱼)P埘+鱼,七<七。a(工(。’(1)一鱼)P一靠+鱼±(一口。)(s(。’(‰)一生)P一%(t一如),七≥七。aa5公式(3—14)为残差修正GM(1,1)模型,简称为残差GM(1,1),其中,残差修正值考‘。’(七+1):口。×(s(。’(‰)一bs)e-a,(k-to),七≥‰的符号应用残差尾段£(。’的符号保持a8一致。3.1.3自适应滤波器预测模型1.自适应滤波器的基本原理自适应滤波器的原理框图如图3—1所示口4I。图3—1自适应滤波器原理结构图 第三章组合预测模型构建的理论基础原理图中的X代表白适应滤波器的输入;Y代表白适应滤波器的输出;d代表自适应滤波器的期望输出;e=d—Y为估计误差,即期望输出与实际输出之差,W为需要确定的自适应滤波器的权系数。一个典型的自适应滤波器主要包括三个模块:滤波结构,该模块是通过对输入的度量来获得输出信号。如果滤波器的输出是输入信号的线性组合,则该模块是线性结构:如果滤波器的输出是输入信号的非线性组合,则该模块式非线性结构。为了降低处理问题的复杂度,现在很多学者采用依然的是线性结构,而且通常是固定的。自适应算法,该模块是通过调整滤波器的参数来提高其性能。目前常用的自适应算法有LMS算法和RLS算法两大类。性能评估,该模块是通过输入与期望输出的去评价该模型是否符合目标对象的要求。2.LMS算法的基本原理LMS算法是自适应滤波器中最常用的一种算法,它主要包括两个过程,一是滤波处理过程:这个过程首先是根据输入获得输出,然后通过输出和期望输出获得误差输出;二是自适应处理过程:该过程是通过误差输出来不断调整滤波器参数。LMS算法的步骤如下。第一步,设置变量和参量。x(n)为输入向量,或称为训练样本:w(刀)为权值向量;e(n)为误差向量;d(n)为期望输出向量;y(刀)为实际输出向量:甜为步长因子即学习因子:rl为迭代次数。第二步,初始化。各个变量和参量的初始化,例如赋给w(O)一个很小的随机非零值,刀20。第三步,利用一组输入样本计算误差输出以及新的权值向量。e(n)=d(n)-y(n)=d(n)一x(n)w(n)公式(3—15)w(刀+1)=w(n)+2ue(n)x(n)公式(3—16)第四步,判断是否满足最优化条件,若满足算法结束:若不满足,则n=,z+1,转入第三步继续执行。 天津工业大学硕士学位论文LMS算法是由梯度下降法导出的,其基本思路与梯度下降法是一致的,不同^之处仅在于用梯度向量的估计V国P(刀)来代替真实的梯度V。P(川,也就是说,是对梯度下降法的近似简化,更符合实际应用。实际上,LMS算法权系数的调整路径不会准确的按照理想的最速下降的路径,所以权系数的调整过程会产生噪声,也就是说权向量wL刀)是一个随机变量,在迭代过程中必然存在着由于随机波动产生的误差,因此LMS算法也称为随机梯度法或噪声梯度法。3.2组合预测方法的基本模型1.组合预测的基本思想组合预测方法通过将两种或者两种以上的预测方法进行组合预测。若组合预测值厂=wI厂·+w2f2+⋯+w,乒,其中八i=1,2,...m)为第f个预测模型的预测值,"IV,O=1,2,...,m)即为组合预测的权系数,则该组合模型为线性组合预测模型:若组合预测值f=g(厂t,f2,...,五),其中g为非线性函数,则该模型为非线性组合预测模型。2.组合预测方法的基本模型常见的组合预测方法主要包括以最优权重组合预测方法为代表的线性组合预测方法,以加权调和组合预测方法和支持向量机组合预测方法为代表的非线性组合预测方法。下面针对几种常用的组合预测模型的原理进行分析。①最优权重组合预测方法我国学者唐小我首次提出最优权重组合预测方法。该方法的基本思想是以某种误差准则为基本原则来求得各个单项预测方法的权重。最优组合预测是指根据某种准则构造目标函数,在约束条件下极小化(或者极大化)目标函数并求得组合模型中的加权系数的方法。最优组合预测的准则Q常见的有预测误差平方和最小、离差绝对值和最小等。其数学公式表达如下。设第f(f=1,2,...,m)种预测方法对某一预测对象进行预测的预测值为弘,w,O=1,2,...,m)为第f种单项预测方法在组合方法中的权重,则w,O=1,2,...,m)满 第三章组合预测模型构建的理论基础足的条件为:∑(wf)=1:基于方法预测精度高的原则,构造方程如下:nlillQ=Qo(w。,w2,...,W。)且s.f.∑(Ⅵ)=1公式(3—17)t=l其中Q为目标函数,sj.为约束条件。对上述方程进行求解得到的w,O=1,2,...,朋)即为组合预测的权系数口5|。②加权调和平均组合预测方法设某种研究对象的时间序列为{誓)O=1,2,...,,2),共采用m种预测方法对这一对象进行预测,预测值为Y。(第f个预测方法第t时刻的预测值),w(江1,2,...,m)为第f个预测方法在组合预测方法中的权重,则wj(待1,2,...,m)满足的条件为:∑(wj)=1且w,>0;加权调和平均的计算公式为:i=l儿22尺兰,/毛Y。(f=1,2,⋯,刀)‘363公式(3—18)③支持向量机组合预测方法支持向量机是由VNVAPNK等共同提出的一种专门解决小样本情况下机器学习问题的智能学习技术口7】。它不是基于经验风险化最小的原则,而是基于结构风险最小化的原则,这使得该方法具有了泛化能力高、全局最优的特点。另外,核函数的引入使得支持向量机通过简单的学习就能获得较高的预测精度。支持向量机组合预测方法的基本思想是:首先利用多个单项预测方法进行预测,然后将这些预测方法所得的预测值作为支持向量机的输入,实际值作为输出,通过支持向量机回归的学习,得到学习函数.厂(x),使得预测值与实际值之间的误差不超过设定的误差限。最后给出输入并利用该学习函数进行预测的过程。支持向量机组合预测方法的基本原理同支持向量机回归预测方法的基本原理相同,因此,关于支持向量机组合预测方法的原理不再赘述。 天津工业大学硕士学位论文3.3本章小结本章主要对本文所采用的组合预测模型以及三种单项销售预测模型所用的理论进行了阐述,包括主成分分析方法的理论、粒子群算法的理论、GM(1,1)模型的基本理论、支持向量机的相关理论以及基于LMS算法的自适应滤波器的基本理论。本章对后续组合预测模型的构建提供了理论基础。 第四章基于粒子群优化的支持向量机组合预测模型的构建组合预测方法在销售预测方面表现出许多优越特性,它不仅能够更全面的反映预测对象的信息,而且能够有效地避免单一预测方法的缺点。这使得它在预测领域得到了广泛的应用。对组合方法中组合预测模型以及单一预测模型如何确定的研究是整个理论的关键。如果组合预测模型中包含了不同种类的预测模型,那么预测结果将更加准确,预测效果更加稳定。4.1预测方法的选择通过对常用的预测方法比较,本论文选择将支持向量机作为组合预测方法,将灰色预测方法、支持向量机回归预测方法以及自适应滤波器预测方法作为组合预测中的单项预测方法。该组合预测模型中的灰色预测方法、支持向量机回归预测方法分别属于时间序列预测方法和回归预测方法中的一类,这使得该组合预测模型不仅包含了历史数据的横向信息,即自变量和因变量之间关系的信息,还包括了历史数据的纵向信息,即时间序列数据之间的规律性发展关系。同时,组合预测模型采用的是支持向量机方法,该方法充分利用了信息技术的优势使得计算结果更加精确以及简单。下面对选择的这几种预测方法的原因进行详细阐述。4.1.1单项预测方法的选择1.时间序列预测方法中灰色预测方法的选择时间序列预测方法是一种通过分析时间序列数据之间的发展变化规律进行预测的方法。它不仅抓住了市场发展规律中的过去和未来的规律,而且由于忽略了其他因素的影响而使这种方法计算更加简单。作为时间序列预测方法中的一种方法,灰色预测是近年提出的一种针对灰色系统的预测方法。针对既含有己知信息又含有未知或不确定信息的经济系统,灰色预测方法由于它的灰色特性而在经济领域得到充分的应用。灰色预测方法通过对随机扰动的原始数据序列进行累加得到一组具有规律性的数据序列,从而提高预测结果的精度。与其他时间序列预测方法相比,灰色预测方法更能发现原始数据的内在规律性,预测结果更加可靠。因此,灰色预测方法在样本数据非常缺乏的情况下能够表现出独特的优势。为了提高灰色预测方法的预测精度,本文对灰色预测方法的残差进行了改进。灰色预测方法中残差的改进通过对原始数据序列的预测值利用残差序列的预测值进行修正,使得预测结果更加精确。相比于其他的修正方法,残差改进的方法与灰色预测方法的思想原理相同,因此预测过程更加简便。 天津工业大学硕士学位论文2.回归预测方法中支持向量机回归预测方法的选择回归预测方法是一种通过分析因变量和自变量之间的线性或非线性关系得到因变量和自变量之间的方程关系,从而进行预测的方法。这种方法充分考察了影响因变量的因素。支持向量机回归预测方法在常见的回归预测方法的基础上,通过自身学习得到因变量和自变量之间的映射关系。这种方法不是通过简单的线性或者非线性方程得到预测值,而是通过样本数据的学习得到预测值。相比于其他的回归预测方法,它所反映的自变量和因变量之间的关系更加全面、更加复杂。另外,支持向量机回归预测方法是通过求解二次规划问题进行求解,从而保证了预测结果的全局最优性。为了简化支持向量机回归预测的输入变量,本文对支持向量机回归预测方法的影响因素进行了主成分分析。对支持向量机回归预测的影响因素进行主成分分析,不仅减少了回归分析过程中因子的个数,而且也简化了预测过程。主成分分析方法通过将多个指标进行分析从而得出少数几种主成分,为进行回归分析奠定了坚实的基础。主成分分析方法的应用为支持向量机回归预测模型带来了三大优势。一是消除了因素指标之间的影响。主成分分析主要是通过对指标变量进行变换以形成彼此相互独立的主成分。二是简化了计算复杂度。主成分的提取使得支持向量机的输入更为简单,预测速度更加迅速。三是便于利用计算机进行计算。统计分析软件一一SPSS能够完全实现主成分分析过程。这三大优势使得支持向量机回归的效果更加准确、可靠,反映的研究对象的信息更加全面。3.自适应滤波器预测方法的选择自适应滤波器是以最小误差为准则,通过不断改变滤波器系数最终达到理想预测效果的一种方法。自适应滤波器在数字信号预测领域所表现出的优越性使得很多国外学者纷纷将其应用于自身研究领域。在国内的经济领域,该方法并未得到充分应用。自适应滤波器在预测方面具有以下优势。一是在权重确定方面,在对样本数据的学习的基础上,通过多次迭代得到最终的权重系数,从而该权重的确定更加合理。二是在误差方面,由于自适应滤波器是以最小误差为准则,因此,它能够得到较高的预测精度。总之,自适应滤波器在经济销售预测领域是一种新的预测方法。4.1.2组合预测方法的选择与其他组合预测方法相比,支持向量机在预测精度、计算机应用以及学习能力方面展现出极大的优势。在预测精度方面,支持向量机不仅能够学习到输入值和输出值之间的线性映射关系,而且能够学习它们之间复杂的非线性映射关系,因此支持向量机进行组合预测方法的应用能够大大提高预测结果的准确性。在计算机的应用方面,MATLAB软件中包含有支持向量机工具箱,能够通过代码快速'4 第四章基于粒子群优化的支持向量机组合预测模型的构建的执行支持向量机的预测,这减少了人工计算的复杂度。在学习能力方面,支持向量机是基于统计学习理论的新方法,在建模过程中无须了解输入和输出值之间的关系,在样本数据的学习基础上就能获得它们之间复杂的对应关系。这三大优势使得基于支持向量机组合预测方法的预测效果更加准确、可靠,预测过程更加简便、预测速度更加快捷。为了改进支持向量机预测方法,本文对支持向量机方法中参数的选择采用了粒子群算法优化。粒子群优化算法的选择,使得参数的选择过程更加简便,参数的选择更加可靠。粒子群算法通过初始化一群粒子的方法来寻找全局最优解。因此,相比于遗传算法、网格算法等传统的优化算法,它寻找最优解的过程更加合理,最优解的值更加可靠。4.2组合预测模型的构建组合预测方法在综合利用各个预测方法优点的基础上,达到了提高预测精度的目的。本文提出以粒子群优化的支持向量机模型为组合模型,以残差改进的GM(1,1)模型,基于主成分分析和粒子群优化的支持向量机回归模型、基于LMS算法的自适应滤波器模型为三种单项预测模型的销售预测模型。本文所构建的模型不仅能够发现时间序列数据在发展变化中的规律性,而且能够充分利用自变量和因变量之间的关系。4.2.1单项预测模型1.残差改进的GM(1,1)单项预测模型(1)残差改进的GM(1,1)预测模型的原理为了丰富和完善GM(1,1)预测模型,很多学者提出了对GM(1,1)预测模型进行改进的方法,其中包括时间相应函数、发展系数、背景值、初始条件和残差的改进等方法。笔者在研究了大量改进的方法之后选择的是基于残差改进的灰色GM(1,1)单项预测模型。该模型不仅将灰色预测的优势纳入了进来,而且提高了预测精度。GM(1,1)模型残差修正的过程仍然采用GM(1,1)模型,具体的修正过程叙述如下:由于灰色预测的原始数据序列必须为非负数据,因此首先对预测值和实际值之间的残差序列占∞’进行预处理,即将所有残差修正为非负序列,新的残差为万(i)=s(f)+ma)【Is(圳,i=1,2,...,刀:然后利用预处理后的残差序列万∞’进行GM1<1S月。’(1,1)预测;最后将残差预测值进行后处理,即利用预处理的反过程得到真正的残差预测值。改进的GM(1,1)模型的预测值是原始数据的预测值和残差序列 天津工业大学硕士学位论文预测值之和。(2)残差改进的GM(1,1)预测模型的构建步骤第一步,建立原始数据序列的GM(1,1)预测模型。在己知的历史数据序列x(o’的基础上建立GM(1,1)模型,利用该模型进行预测获得预测值序列贾(0、。第二步,构建残差序列P(01。由原始数据序列x(o’和实际预测值序列j(们,获得残差序列e‘们,其中P‘o’(后)=x‘o’(后)一圣‘o’(七),k=1,2,...,,2。第三步,构建可建模残差序列s(0)。由于灰色预测的原始数据序列必须为非负数据,因此首先对预测值和实际值之间的残差序列e‘0’进行预处理,即将所有残差修正为非负序列,新的残差为£‘。’(七)=P(k)+m。掘ax。Ie(七)I,i=l,2,...,门。第四步,利用可建模残差序列s(o’建立GM(1,1)模型。利用残差序列占(o’建立GM(1,1)模型获得预测序列孝,并将该残差预测序列f进行反预处理,即吾∞’(后)=4(k)一则aXIP(七)l,f=1,2,...,门,最后得到残差预测序列为吾(o’。lS七§疗。第五步,构建残差改进的GM(1,1)预测模型。利用第一步获得的预测序列j‘o’与第四步获得的残差预测序列吾(o’相加获得最终预测结果。残差改进的GM(1,1)单项预测模型在GM(1,1)预测模型的基础上进行了残差改进,这在很大程度上提高了预测精度。具体的算法执行流程图如图4-1所示。 第四章基于粒子群优化的支持向量机组合预测模型的构建开始上构建原始数据序列GM(1,1)模型,得到预测值序列jto,上残差序列P(o)的构建J可建模残差序列£to,的构建1L构建£co,序列GM(1,1)模型,得到预测值序列吾‘o’1L残差改进的GM(1,1)模型(毒‘。)和jt。)的整合)1L结束图4.1残差改进的GM(1,1)预测模型的构建过程2.基于主成分分析和粒子群优化的支持向量机回归单项预测模型首先将影响因素进行主成分分析,然后利用主成分分析的结果作为支持向量机的输入,同时利用粒子群优化算法对支持向量机的参数进行了寻优的改进。在本文中提出的这种模型不仅对各个研究指标进行了标准化处理消除了量纲的存在,同时将多个变量抽取为几个综合指标也降低了统计分析的难度。(1)主成分分析法的基本原理主成分分析法(英文缩写principalComponentsAnalysis.PCA)是由Pearson于1901年提出的,之后霍特林(Hotelling)对主成分分析法进行了扩展。主成分分析(PrincipalComponentAnalysis)是采用降维思想,通过将多个原始变量组合成为少数几个互不相关的综合变量(即主成分),同时这些综合变量能够尽可能多地反映原始变量的绝大部分信息,且它们所包含的信息互相不重叠口8I。主成分分析方法具有几何原理明确、计算步骤简单、通用性强等优点,已经被推广应用到数据处理、过程监控、故障分类与诊断以及模式识别等领域∞8叼9|。·主成分分析的数学模型假设给定一个原始样本资料,其中有刀个样本,每个样本有p个观测指标 一天津工业大学硕士学位论文—————————————————————————二二_~x-,彳z,⋯xp,原来的指标为墨,t,⋯■,新的变量,即提取的主成分记为z】,Z2,...,Zm(m≤p)肛臣X12X22:●Xn2卜址_,~·,舯令渺墟,⋯p主成分分析法就是将p个观测指标重新组合成为聊(聊≤p)个新的综合变2q1五+口12五+⋯+口lpZp=口21Xl+口22五+⋯+口2pxp=口州Xl+口Ⅲ2X2+⋯+口叩X|D公式(4—2)简记为:乙=乃lXl+aj2五+⋯+口.驴xp,/:1,2,⋯,朋其中,该模型必须满足以下三个条件:第一,Z,,乙互不相关(i≠/,‘/:1,2,⋯,聊);第二,Z,的方差大于z:的方差,z:的方差大于乙的方差,依次类推;第三,嚷12+%22+⋯+口切2=1七:1,2,⋯,脚.。于是,E称为第一主成分,‘称为第二主成分,依此类推,共有聊(研≤矽)个主成分。其中%(‘/=1,2,⋯,P)为主成分系数。上述模型矩阵表示为:Z:似,其中 第四章基于粒子群优化的支持向量机组合预测模型的构建Z=Z1Z2:●Zm,X=X1X2:●Xp,么=口lIG12G21口22口m1口m2口l口2●:口m公式(4-3)其中彳为主成分系数矩阵。·主成分分析的几何解释我们在二维空间逃脱了主成分的几何意义。假设有刀个样本,每个样本有两个变量(X。,X:),设甩个样本在二维空间中的分布大致为椭圆,如图4—2所示。JL逝一。一\/≯.■吖。l确p。影X£/\图4.2主成分几何解释图将坐标系进行正交旋转一个角度矽,使其椭圆长轴方向取坐标Y。,在椭圆短轴方向取坐标Y:,旋转公式为公式(4-4)其中,该旋转后的公式满足{。一CsOmS/。92:++si∞n/s92臼:=:1。,且y,与y:不相关,Var(y1)>Var(Y2)旋转的目的是使这门个样本在Y。方向上的离散程度最大,即方差最大,变量y,代表了原始数据的大部分信息。同时,由于变量y。和Y:不相关,这样可以只p咿咖?:即秒阳.g∞吃也卜+茹■吖=y耽 天津工业大学硕士学位论文保留Y。,达到了降维的目的。·主成分分析方法的具体步骤假设给定一个原始样本资料,其中有r1个样本,每个样本有P个观测指标墨,置,⋯乃,原来的指标为墨,置,⋯%,新的变量,即提取的主成分记为Z1,Z2,...,Z。(m≤P)第一步,标准化处理。为了排除数量级和量纲不同带来的影响,首先对原始样本数据进行标准化处理x’u=x√一哆‘,f-1,2,...,p;J=1,2,3,刀,其中,p代表指标个数,n代表样本个数,X¨为第i个指标第/个样本的原始数据;Xi和仃,分别为第i个指标的样本均值和标准差。第二步,根据据标准化数据矩阵,计算相关系数矩阵。R,,J=∑(%-Xf)(如-XJ)k=l公式(4-5)第三步,根据协方差矩阵R,求出特征值。首先根据特征方程I俎一R=o计算特征根以,i:1,2,,,,,p并使其从大到小排列,丑,如,...,~。由于特征值是各主成分的方差,它的大小反映了各主成分的影响力。第四步,求出主成分贡献率和累计方差贡献率,确定主成分个数。主成分Z朋贡献率为耻旌-根计贡献率为/j=l值大于1并且累计贡献率达到85%一95%的原则选取主成分。第五步,计算主成分。。根据特征Zi=Ⅵ五+%五+⋯+%K,i=1,2,...,m,聊≤p,各主成分之间相互独立。 第四章基于粒子群优化的支持向量机组合预测模型的构建(2)粒子群算法的基本原理粒子群算法,也称粒子群优化算法(ParticleSwarmOptimization),缩写为PSO,最早是由美国电气工程师Eberhart和社会心理学家Kennedy在1995年给予群鸟觅食发展起来的H0】。·粒子群算法的基本模型粒子群算法基本思想是:首先初始化一群随机粒子,然后通过迭代找到最优解。在每一次迭代中,每个粒子通过两个极值更新自己。一个是粒子到目前发现的自己最好的位置记为(记为Pbest),另一个是整个种群到目前位置发现的最好位置(记为Gbest),粒子找到上述两个极值后,根据下面两个公式来更新自己的速度和位置:1,i川=删,‘+qxrandox(p,‘一z,k)+c2xrandox(pg‘一Xg‘)公式(4—7)x:=X?4-a伟',‘公式(4-8)其中,汪1,2⋯,m,m代表粒子的个数,一般取值为20.40;彩是非负数,称为惯性因子,一般取值为0.6一O.75:加速常数el和C,是非负常数,它们是调整自身经验和社会经验在其运动中所起作用的权重,常规条件下,我们取C.=c’=2.0:randO为随机函数,产生[0,1]之间的随机数;口为约束因子,目的是控制速度的权重;v■为第f个粒子第k次飞行的速度,y,‘∈[一v怎,v幺】,即粒子的飞翔速度被一个最大速度所限制。近年来,一些学者将粒子群算法推广到约束优化问题,其关键在于如何处理好约束,即解得可行性。如果约束处理的不好,其优化的结果往往出现不能收敛和结果是空集的状况。基本的粒子群算法的约束优化工作主要分为罚系数法和将粒子群的搜索范围限制在条件约束簇内两大类。本文将粒子群算法应用到了对支持向量机的参数进行优化采用的是第二类,即将粒子群的搜索范围限制在条件约束簇内。·粒子群算法的具体步骤第一步,初始化粒子群(速度和位置)、惯性因子、加速常数、最大迭代次数和算法终止的最小允许误差。具体包括粒子的位置x,和速度v.随机初始化赋值,同时需要对粒子群算法中涉及的各类参数进行设定,例如加速常数C,和e,、惯性因子缈、最大迭代次数k以及最终结束条件等。 天津工业大学硕士学位论文第二步,评价每个粒子的初始适应值。利用粒子群的适应度函数计算每个粒子的初始适应值。第三步,在当前种群中找出个体极值和种群极值,即具有最好适应度值的位置。个体最优位置的确定由下式确定:Pbest以)=群体最优位置的确定由下式确定:O),⋯,x。p))≥Pbest。O一..,X。(f))

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
大家都在看
近期热门
关闭