新疆巴州地区梅毒发病预测与控制模型的研究

新疆巴州地区梅毒发病预测与控制模型的研究

ID:78085160

大小:5.20 MB

页数:61页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
新疆巴州地区梅毒发病预测与控制模型的研究_第1页
新疆巴州地区梅毒发病预测与控制模型的研究_第2页
新疆巴州地区梅毒发病预测与控制模型的研究_第3页
新疆巴州地区梅毒发病预测与控制模型的研究_第4页
新疆巴州地区梅毒发病预测与控制模型的研究_第5页
新疆巴州地区梅毒发病预测与控制模型的研究_第6页
新疆巴州地区梅毒发病预测与控制模型的研究_第7页
新疆巴州地区梅毒发病预测与控制模型的研究_第8页
新疆巴州地区梅毒发病预测与控制模型的研究_第9页
新疆巴州地区梅毒发病预测与控制模型的研究_第10页
资源描述:

《新疆巴州地区梅毒发病预测与控制模型的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

?分类号:R181密级:公开单位代码:10760学号7602158312:10新疆医科大学XinJiangMedicalUniversity硕士学位论文THESISOFMASTERDEGREE学术性学位(学历教育)论文题目:新疆巴州地区梅毒发病预测与控制模型的研究研究生罗冬梅指导教师王凯教授学科专业名称流行病与卫生统计学研究方向传染病动力学与生物统计研究起止时间2015年12月-2018年2月所在学院公共卫生学院—2018年3月' 新疆巴州地区梅毒发病预测与控制模型的研究研究生罗冬梅指导教师王凯教授学科专业名称流行病与卫生统计学研究方向传染病动力学与生物统计2018年3月 StudythePredictionandControlofSyphilisModelInBayingolinMongolAutonomousPrefectureofXinjiangADissertationSubmittedtoXinjiangMedicalUniversityInPartialFullfillmentoftheRequirementsfortheDegreeofMasterofMedicineByLUODongmeiEpidemiologyandHealthStatisticsDissertationSupervisor:Prof.WangKaiMarch,2018 论文独创性说明本人申明所呈交的学位论文是在我个人在导师的指导下进行的研宂工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外一,论文中不包含其他人己经发表或撰写过的研宄成果。与我同工作的同志对本研宄所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:f务幹签字日期:"导师签名:^M)日期:if签字关于论文使用授权的说明本人完全了解学校关于保留、使用学位论文的各项规定,”(选择同意)以下事项:1.学校有权保留本论文的复印件和磁盘,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文;“2.学校有权将本人的学位论文提交至清华大学中国学术期刊(光盘”用于版电子杂志社出版和编入CNKI《中国知识资源总库》或其他同类数据库,传播本学位论文的全部或部分内容。学位论文作者签名:5為*签字日期:、么斗导师签名<P:签字日期:w 中英文缩略词对照表英文缩写英文全名中文译名ACFAutocorrelationFunction自相关函数ADFAugmentedDickeyFulle增广DF检验AICAkaikeInformationCriterion赤池信息量准则ARAutoregressive自回归ARMAAutoregressiveMovingAverage自回归移动平均ARIMAAutoregressiveIntegratedMovingAverage求和自回归移动平均BICBayesianInformationCriterionn贝叶斯信息准则LHSLatinHypercubeSampling拉丁超立方抽样LSELeastSquareMethod最小二乘法LS-SVMLeastSquaresSupportVectorMachine最小二乘支持向量机MAPEMeanAbsolutePercentageError平均相对误差PRCCPartialRankCorrelationCoefficient偏秩相关系数R0BasicReproductionRatio基本再生数RBFRadialBasisFunction径向基函数RMSPERootMeanSquarePercentageError均方根百分比误差SVMSupportVectorMachine支持向量机 目录摘要......................................................................................................................................1ABSTRACT........................................................................................................................3前言......................................................................................................................................5研究内容与方法..................................................................................................................81基于ARIMA模型的新疆巴州地区梅毒研究与应用.........................................81.1ARIMA模型原理.......................................................................................81.2ARIMA模型建模步骤.............................................................................102基于最小二乘支持向量机回归模型的新疆巴州地区梅毒研究与应用...........112.1LS-SVM模型原理....................................................................................122.2核函数的构造及参数确定.......................................................................143基于传染病动力学模型的新疆巴州地区梅毒研究与应用..............................153.1传染病动力学概述...................................................................................153.2传染病动力学中的几个基本概念...........................................................163.3基本的传染病动力学模型.......................................................................164模型误差分析......................................................................................................18结果....................................................................................................................................20讨论....................................................................................................................................36小结....................................................................................................................................40致谢....................................................................................................................................41参考文献............................................................................................................................42综述....................................................................................................................................46攻读硕士学位期间发表的学术论文................................................................................54导师评阅表........................................................................................................................55 新疆医科大学硕士学位论文新疆巴州地区梅毒发病预测与控制模型的研究研究生:罗冬梅导师:王凯教授摘要目的:探讨时间序列模型、最小二乘支持向量机模型及传染病动力学模型在新疆巴州地区梅毒研究与应用中的可行性,以获得预测效果较好的模型。通过模型预测提早了解新疆巴音郭楞蒙古自治州(简称巴州)地区梅毒的发病趋势,揭示梅毒的传播流行规律,找到影响梅毒流行的关键因素,为深入开展巴州梅毒的预警奠定基础,也为制定防治策略提供有力的理论和数量依据。方法:根据巴州地区梅毒的发病特征,通过因素分解、平稳性检验、模型识别、参数估计及模型诊断与优化等建模过程建立ARIMA预测模型。利用最优模型拟合2008~2014年巴州梅毒月发病数据,并对发病情况进行短期预测;其次利用数据挖掘的思想把支持向量机技术引入到梅毒预测分析中来,对最小二乘支持向量机选择合适的核函数及确定相应参数,拟合2008~2014年新疆巴州梅毒月发病数据,预测2015年1月至6月梅毒发病率;最后利用传染病动力学的思想,根据梅毒的传播特征,建立巴州梅毒的传播动力学模型。针对巴州近几年报告的梅毒发病数据,模型的未知参数采用非线性最小二乘法来估计,计算梅毒传播基本再生数,预测梅毒未来流行的长期趋势,并对模型的参数进行敏感性分析,找出影响梅毒流行的关键因素。结果:(1)首先对原始序列进行因素分解,结果显示在季节性因素上巴州梅毒发病呈周期性变化,季节指数提示3月是梅毒的高发季节。由于原始序列是一个非平稳的时间序列,因而对原序列作一阶差分。观察ACF和PACF的变化,最终在通过模型检验的可选模型中确定ARIMA(0,1,1)(1,0,1)12为最优模型。模型的拟合精度指标平均绝对误差百分比(MAPE)为16.39%,均方根误差百分比(RMSPE)为29.24%,预测数据显示2015年1月至6月梅毒发病率与上半年比较无明显变化趋势;(2)对于LS-SVM模型的建立,通常先对原始数据进行预处理,本文采取归一化处理,选择径向基函数作为核函数,采用5折交叉验证法确定正则化参数𝛾和核函数宽度σ,结果误差最小的𝛾和σ值是𝛾=222,σ=0.000102。拟合过程,LS-SVM模型的MAPE=8.89%,RMSPE=19.12%,预测2015年1月至6月期间新疆巴州梅毒的发病率保持居高不下;(3)根据梅毒的自然传播机理和人群的性活跃程度构建了巴州梅毒的传染病动力学模型,数值模拟得到参数估计值,基本再生数R=1.06(95%CI:1.01-1.15)。模型的MAPE和RMSPE0都在10%以内,利用该模型预测了10年,结果显示巴州梅毒呈上升趋势。敏感性分1 新疆医科大学硕士学位论文析发现梅毒传播系数β对R0的影响最大(|PRCC|=0.9661),其次是单位时间内核心组的性伙伴数量c1(|PRCC|=0.8794)和恢复率𝜏(|PRCC|=0.6719),说明传播系数β、核心组性伙伴数c1和恢复率𝜏是巴州梅毒流行的主要影响因素。结论:用ARIMA模型、LS-SVM模型和传染病动力学模型三种方法定量的分析预测新疆巴州地区梅毒的流行状况是可行的。短期和长期预测显示新疆巴州地区梅毒的发病有上升的趋势,提示在性交时应提高安全套使用率,加强对核心组人群的性网络的预防干预,加强对多性伴者梅毒血清学检测,及时找到核心组人群可能传染的性伴,加强治疗。关键词:梅毒,ARIMA,LS-SVM,传染病动力学2 新疆医科大学硕士学位论文StudythePredictionandControlofSyphilisModelInBayingolinMongolAutonomousPrefectureofXinjiangPostgraduate:LuoDongmeiSupervisor:Prof.WangKaiAbstractObjective:Inordertoexplorethefeasibilityofthetimeseriesmodel,leastsquaressupportvectormachinemodelandepidemicdynamicsmodelinsyphilisresearchandapplicationinBayingolinMongolAutonomousPrefectureofXinjiang,enrichingthetheoryofthepredictivecontrolmodelofinfectiousdiseases,andfindingapredictionmodelwithhigheraccuracy.BypredictingearlyunderstandtheincidencetrendofsyphilisinXinjiangBazhouarea,revealthelawofsyphilisepidemicdevelopment,findthekeyfactorsaffectingtheprevalenceofsyphilis,whichlaidthefoundationforthefurtherdevelopmentofXinjiangBazhouareasyphilisearlywarning,alsoprovidestrongtheoreticalandquantitativebasisforthepreventionandcontrolstrategy.Methods:Accordingtothecharacteristicsofsyphilis,ARIMApredictionmodelwasestablishedbyfactordecomposition,stationaritytest,modelidentification,parameterestimation,modeldiagnosisandoptimization.Usingtheestablishedmodeltofitthemonthlyincidenceofsyphilisin2008~2014years,andtopredicttheincidenceofsyphilisforashorttime.Secondly,theideaofdataminingwasintroducedintothesyphilispredictionanalysisbythesupportvectormachinetechnology,theleastsquaressupportvectormachinewasselectedtoselecttheappropriatekernelfunctionanddeterminethecorrespondingparameters.Itfittedthesyphilismonthlyincidencedatafor2008~2014years,andpredictedtheincidenceofsyphilisfromJanuary2015toJune.Thirdly,Basedonthetheoryofinfectiousdiseasedynamicsandthetransmissionmechanismofsyphilis,thedynamicmodelofsyphilistransmissionwasestablished.Theincidenceofsyphilisusingthedatainrecentyears.Thereport,byusingnonlinearleastsquaresestimationofmodelparameters,calculatedthespreadofsyphilisbasicreproductionnumber,long-termtrendforecastedfuturesyphilisepidemic,andanalyzedthesensitivityoftheparametersofthemodel,foundoutthekeyfactorsaffectingtheprevalenceofsyphilis.Results:Firstly,accordingtothefactoranalysisofthereportedsyphilisonsetdata,theresultsshowedthat3 新疆医科大学硕士学位论文theonsetofsyphiliswascyclical.Thestabilitytestshowedthatthesequencewasanon-stationarytimeseries.Therefore,theARIMAmodelofsyphiliswasestablishedbyfirstorderdifferenceoftheoriginalsequence.Bymodelidentification,ARIMA(0,1,1)(1,0,1)12(1,0,1)12wasarelativelyoptimalmodel.Themeanabsoluteerrorpercentage(MAPE)ofthefittingaccuracyindexandtherootmeansquarepercentageerror(RMSPE)ofthemodelwere16.39%and29.24%,respectively.ThepredicteddatashowedthattherewasnosignificantchangeintheincidenceofsyphilisfromJanuary2015toJune.Secondly,beforetheestablishmentofLS-SVMmodel,thefirst2008-2014yearsofdiseasesyphilisratedatawerenormalized,chooseradialbasisfunctionasthekernelfunctionandtheregularizationparameterandkernelwidthusing5-foldcross-validation,andtheminimumerrorofthegammaandsigmmavaluewere222,0.000102,respectively.Thefittingprocess,theMAPE=8.89%,RMSPE=19.12%oftheLS-SVMmodel,predictedthattheincidenceofsyphilisremainedhighintheperiodfromJanuary2015toJune.Thirdly,accordingtothenaturaltransmissionmechanismofsyphilisandthedegreeofsexualactivityofthepopulation,theinfectiousdiseasedynamicsmodelwasconstructed.Theestimatedvalueoftheparameterwasobtainedbynumericalsimulation,andthebasicregenerationnumberwasR0=1.06(95%CI:1.01-1.15).TheMAPEandRMSPEofthemodelwerewithin10%,andthemodelwasusedtopredictthelast10years,andtheresultsshowedthatsyphiliswasontherise.Thesensitivityanalysisshowedthattheinfectionrateofβmaximum(|PRCC|=0.9661),followedbyacoregroupofpartnerstochangetheamountofc1(|PRCC|=0.8794)andthecurerateof𝜏(|PRCC|=0.6719),thattheinfectionrateofbeta,acoregroupofpartnernumberc1andthecurerateisthekeyfactorinfluencing𝜏ofsyphilis.Conclusion:ItisfeasibletoanalyzeandpredicttheepidemicsituationofsyphilisinBayingolinMongolAutonomousPrefectureofXinjiangbythreemethods:ARIMAmodel,LS-SVMmodelandinfectiousdiseasedynamicmodel.Theresultsshowedthattheincidenceofsyphilishasincreased,shouldincreasetherateofcondomuserevealedtocutoffthespreadofsyphilis,preventionandinterventionofthecoregroupsofthenetworktostrengthenthesecond,strengthenthesexualpartnersofSyphilisSerologicalTest,andfoundthatthesyphilisinfectionsourcesandmayinfectsexualpartners,earlytreatment.Keywords:Syphilis;ARIMA;LS-SVM;epidemicdynamic4 新疆医科大学硕士学位论文前言梅毒(Syphilis)是一种细菌感染的性传播疾病,由梅毒螺旋体亚种引起。1500年,哥伦布感染梅毒并将病原体从美洲大陆带回欧洲,这是第一次关于梅毒大流行的记载[1-2],至此,梅毒广泛流行于世界各地,2012年全球有1800万人感染梅毒[3],梅毒给人类健康造成的危害在全世界备受影响。经典的性传播疾病包括梅毒、淋病、软下疳、腹股沟肉芽肿和性病性淋巴肉芽肿,其中梅毒被称作第一性病,其危害程度仅次与艾滋病。而且,梅毒患者也在一定程度上加剧了艾滋病毒的传播,大大提高了感染艾滋病的风险。在自然界中,梅毒的传染源是人类,传播途径主要包括直接性接触传播、间接接触传播和母婴垂直传播。梅毒的病程极为多变,其临床表现与其他疾病相似,未治疗的梅毒患者通常会经历一期、二期、潜伏期和三期梅毒这几个阶段[4]。一期梅毒的典型表现是硬下疳,病变持续几个星期后可自行愈合,二期梅毒可能出现多种方式,包括皮疹、皮肤黏膜和淋巴结的病变。一期、二期梅毒的传染性都很高,不治疗情况下症状可能会自行消失。潜伏期梅毒可持续1-10年[5-6],潜伏期虽然不表现明显的临床症状,但是体内仍然存在病原体,可导致内部器官损害或死亡。大约15%的未经治疗的病人将发展为晚期(三期)梅毒,三期梅毒是不可逆的,会导致痴呆和一些神经症状包括失明、耳聋、心脏病、主动脉炎、主动脉瘤,甚至死亡。梅毒出现全球范围的流行态势。除艾滋病以外的性病在世界范围内占疾病的一个重要部分,每年有超过34亿的性传播新发病例(主要是梅毒、淋病和衣原体滴虫病),且大多数在15岁至49岁[7]。在欧洲一些发达国家,早期梅毒出现时就立即服用了青霉素,使得梅毒的发病数明显减少。2000年以来世界各国的卫生机构报告的梅毒发病数均大幅度升高,尤其是在发展中国家,梅毒上升速度更快,这可能是由于男男同性恋人群的增多。2011年,德国梅毒发病率为4.5/10万,荷兰为3.81/10万;英国在2012年梅毒发病率为5.82/10万;2013年,丹麦的梅毒发病率为5.78/10万,而俄罗斯高达28.86/10万;美国2013年约有17375例一期和二期梅毒,比2012年增加了10%,2014年美国有63450例梅毒。上世纪90年代,梅毒报告病例数在我国东南沿海地区迅速增长,随后几年内,梅毒由沿海开放城市向内地和农村蔓延。目前,梅毒已在全国范围内流行,2000-2013年间,发病率由6.43/10万增加到32.86/10万,年均增长13.37%[8]。20-39岁是梅毒高发年龄;此外,先天梅毒的比例也在逐渐增加;性别上无较大差异,男女比平均为0.92:1;梅毒的高发职业中农民的病例数最多,离休人员的增幅最高;患者以隐性梅毒为主,隐性梅毒发病率逐年大幅增加且明显高于其他分期的梅毒。5 新疆医科大学硕士学位论文近十几年来,新疆梅毒的报告病例数呈上升趋势,已经成为我国梅毒的高发地区[9]。中国统计年鉴报告关于梅毒的数据资料显示,2008年至2014年间新疆梅毒病例数从8120(38.76/10万)例增加到21159(93.45/10万)例,且主要集中在新疆南部[10]。巴州位于新疆的东南部,梅毒发病率较高,并保持着缓慢的上涨速度,2007年巴州有梅毒患者384例,位于巴州法定传染病第8位[11],2008年发病数485例,排于第7位,2009年至2014年均位于第三位,2013年梅毒发病数849例,到2014年达到1012(75.59/10万)例[12]。新疆巴州梅毒流行形式日益严峻,因此了解梅毒的流行趋势和传播机制,对于有效控制梅毒的传播具有十分重要的意义。目前针对传染性疾病的预测方法有很多,主要有时间序列分析、马尔可夫链预测模型、人工神经网络、灰色预测模型和传染病动力学模型等。上述每一种模型都有各自的优缺点、侧重点和适用条件,如欲考察传染病短期内随时间变化的规律,ARIMA模型运用较为普遍和成熟。近年来,使用ARIMA模型和最小二乘支持向量机模型预测传染病的流行趋势已愈来愈多[13-17],但是时间序列分析和支持向量机模型都属于时序数据驱动模型,建模过程中没有加入疾病的传播机理,无法展示疾病的传播流行过程,对此,传染病动力学模型有着明显的优越性。传染病动力学模型是根据疾病自然传播史,建立体现疾病传播方式及流性特征的数学模型,通过对模型理论分析和数值模拟,揭示变化规律,预测流行趋势,最后分析疾病流行主要因素,为预防提供最优控制策略和相关的数量依据。过去30年使用动力学模型预测控制传染病的研究已不断涌现。梅毒的传播动力学模型最早由英国牛津大学的GEOFFP.GARNETT教授于1997年提出,帮助人们清晰的理解生物感染和实际感染发生过程的区别,也为控制策略的制定提供了建议[18];1999年,GEOFFP.GARNETT教授等提出“核心组”与性伙伴网络对梅毒传播的重要性,作者建议干预措施要足够灵活,以延伸到社会不同阶层,如性工作者、吸毒者与男性同性恋者[19];2010年,胡宇峰等建立了梅毒传播的系统动力学模型,主要考虑梅毒的核心传播人群,即女性性工作人群和多性伴人群[20];2013年,KateM.Mitchell等进一步分析了筛查女性性工作者与干预措施对梅毒疫情的影响[21]。总而言之,针对传染病的预测方法众多,各个国家的学者对这些方法也都做了详细的研究。但是每种传染病的传播方式不同,而且每种预测方法各有局限性和优势性,因此运用一种数学模型很难全面了解传染病的预测控制问题;另外,目前关于新疆巴州地区梅毒流行的预测与控制模型研究还很少,为了探讨各类数学模型在新疆巴州梅毒研究与应用中的可行性,首先研究新疆巴州梅毒总体发病情况,预测其未来流行状况,充分利新疆巴州流行病学调查数据资源,拟建立ARIMA乘积季节模型,探讨新疆巴州梅毒发病的高发季节,并对未来的流行趋势做出短期预测。其次为了提高梅毒发病的预测精度,考虑到时间序列模型的限制条件和最小二乘支持6 新疆医科大学硕士学位论文向量机的优越性,本文将小二乘支持向量机引入到梅毒的预测中,希望找到精度更好的预测模型。最后对新疆巴州梅毒发病传播机制进行分析并建立动力学模型,了解梅毒的流行原因和传播规律,预测传染高潮的时间,找到影响流行的主要因素,定量给出预防和控制的最优策略。总而言之,本文对新疆巴州梅毒进行深入的理论和定量研究,将传染病动力学、统计学和数据挖掘算法思想应用在梅毒的预测与控制中,综合对比分析这三种方法之间对传染病预测的效果差异,找到预测性能较优的模型。7 新疆医科大学硕士学位论文研究内容与方法1基于ARIMA模型的新疆巴州梅毒研究与应用按一系列时间点上的观测获取得到的数据称为时间序列。时间序列分析首先根据观测的时间序列数据进行研究,展示事物研究期内的变化情况,从中寻找数据内部发展趋势、周期趋势等特征,然后利用数据进行参数估计,最后拟合出较优的数学模型[22]。时间序列分析是利用数据本身,获得事物随时间变化的规律和特征,由历史延续到现在的数据变化特征预测未来的进展趋势。总结时间序列有以下三个特点:(1)时间序列数据虽然由时间点的变化得到,但是不一定是依赖时间的严格函数[17];(2)从整个时间跨度上看,事物之前的变化特征会延续到未来,数据会呈现出某种趋势或周期性变化,但也可能具有一定的随机性;(3)时间序列中前一时刻的数据会影响后一时刻的数据,呈现一定的相关性,数据之间相互不独立。原始的时间序列资料可能是平稳时间序列,也可能是非平稳时间序列。如果序列的统计性质不会随着时间的推移而发生改变,即低阶距(二阶)不变,该序列被称作平稳时间序列,相反,序列不具有二阶矩平稳性质则称为非平稳时间序列。平稳的时间序列反映在图像上就是样本曲线在某一常值上下波动,且波动范围有界,随着时间的推进,波动会逐渐平缓而回到水平值附近;非平稳时间序列的波动跟时间有关,如果序列显示明显的趋势性或周期性,且会随着时间的推进波动幅度无限的增大,该序列通常不是平稳序列。平稳序列中最简单也比较有代表性的一种序列白噪声序列,该序列指各数据点在任何时间点上都是零均值,序列是无规则随机波动的,且没有任何关联性。时间序列分析的目的就是要想方设法把序列中的相关信息提取出来,剩余的残差一旦呈现白噪声序列的特征,说明有用的相关信息已全部提取,就可以终止分析。目前时间序列方法已广泛应用于传染病分析中,包括性传播疾病的研究[23-25]。ARIMA模型是时间序列分析方法中最为常用的一种预测统计方法,该模型是假设序列是平稳的情况下建立的。ARIMA模型全称为差分自回归移动平均模型(autoregressiveintegratedmovingaverage),由美国学者Box和英国学者Jenkins于20世纪70年代初提出,亦称为box-jenkins模型或B-J模型[26]。1.1ARIMA模型原理1.1.1时间序列的分解时间序列的因素分解方法是时间序列分析中传统的探索序列发展变化的方法。该方法试图从原始数据中提取出数据的变化特征,然后根据此特征来预测未来数据的变化趋势。根据Cramer分解定理,因素分解方法将序列分解为长期趋势、季节性8 新疆医科大学硕士学位论文变化和残差三个因素。其中长期趋势指序列呈现出明显的递增、递减趋势,该趋势通过建立回归模型来体现;季节性变化指序列呈现出和季节变化相关的稳定的周期波动,可提取季节性指数来表示季节性变化特点;残差指除了长期趋势、循环波动和季节性变化以外受其他因素的影响而导致序列呈现随机波动,分析过程中通常忽略这部分残差。季节性变化因素是疾病数据有周期性波动现象,这通常是由于降雨量、温度、节假日等影响因素造成的。为了便于分析疾病的季节效应,得到量化的季节信息,通常使用季节指数这个指标来表示,该指标可探讨疾病在不同年份的相同月份是否呈现相似的性质。计算季节指数的基本步骤为[27-28]:(1)计算样本数据的总平均发病率;(2)计算研究周期内各期的平均发病率;(3)用各期的平均发病率除以总平均发病率得到季节指数。如果季节指数值大于1,意味着该季节的发病率通常高于平均水平;否则,意味着该季节的发病率低于平均水平,如果季节指数值等于1,说明没有明显的季节效应。1.1.2ARIMA模型介绍ARIMA模型包括三个基本模型:自回归模型AR(p),移动平均模型MA(q)和自回归移动平均模型ARMA(p,q)。AR与MA模型直接结合成为ARMA模型,该包含了历史数据和残差,其数学表达式为:X=X++X+−−−t1t−1pt−pt1t−1qt−q(1)其中X为t时刻的实际观测值,为t时刻残差序列,和分别是AR(p)与ttMA(q)模型的系数,p和q分别表示自相关函数(Autocorrelationfunctions,ACF)和偏自相关函数(PartialAutocorrelationfunctions,PACF)的阶数。AR、MA和ARMA模型所需的序列的均值和协方差不会随着时间而改变,因此只适用于平稳的时间序列,但在实际问题中,大多数时间序列是非平稳序列,因此引入ARIMA(p,d,q)模型,即在ARMA基础上增加差分过程,ARIMA模型数学表达式为:d(B)X=(B)tt(2)其中t为时间,X为观测序列,B为延迟算子,BX=X,=−1B,()B即ttt−1为自回归算子,()B为移动平均算子,d为差分阶数。如果传染病的季节性因素有周期性变化特征,建议使用带季节性的乘积模型ARIMA(p,d,q)(P,D,Q)S,其数学表达式为:dD(B)(B)X=(B)(B)sstst(3)其中P,D,Q分别是季节性因素的自回归的阶数、差分阶数和移动平均的阶数,9 新疆医科大学硕士学位论文()B是Q阶移动平均系数多项式,()B为P阶自动回归系数多项式。SS1.2ARIMA模型建模步骤1.2.1平稳性检验判断时间序列的平稳性通常有两种方法,一种是根据时序图和自相关图的波动变化,如果时序图呈现线性或非线性,则序列非平稳,如果自相关函数在前几个值后没有下降为0,而是逐渐下降,则序列非平稳;另一种是ADF单位根检验方法,当P<0.05,可认为序列平稳。非平稳的序列可以对其进行差分处理或取自然对数运算等方法实现平稳。1.2.2模型识别识别过程利用ACF和PACF,ACF用于衡量序列中较早的数据值是否与后面时间值有某种关系,ACF用于捕获变量和变量滞后量之间的关系。通过观测样本的ACF和PACF的振动变化,确定相应的p,d,q,P,D,Q的数值,从而选择适当阶数的ARIMA(p,d,q)(P,D,Q)S模型,其中季节长度s可从因素分解中季节性因素变化特征得到,或根据实际问题背景分析得到。对于p,q和P,Q的取值,如果样本ACF系数显示拖尾,PACF显示p阶截尾,考虑拟合AR(p)模型;如果样本ACF系数q阶截尾,PACF系数拖尾,考虑拟合MA(q)模型;样本ACF系数和PACF系数同时拖尾,此时就可以考虑序列适合于ARIMA模型。事实上,通过观察ACF和PACF来判断拖尾还是截尾,大部分凭借的是分析人员丰富的分析经验,为避免过多的主观因素影响得到接近真实的结果,可以辅助参考2倍标准差变动范围。关于非季节差分差分和季节差分阶数d,D的取值,可以在可能的取值范围内搜索获得。由于一般原始序列大多数在3阶差分以内就可实现平稳,因此阶数d,D宜取较低阶,可取1,2或3。1.2.3模型参数估计和模型诊断确定待拟合模型的类型,选择模型要拟合的阶数后,需要利用模型根据实际观测值得到未知参数的估计值。对未知参数的估计方法一般有极大似然估计、矩估计和最小二乘估计三种,本文选择最小二乘估计法来估计模型的参数。确定模型参数以后,需要对拟合出来的模型进行必要的诊断。要诊断模型是否合适,就是要看它提取的信息是否充分,典型方法是检验模型残差是否为白噪声序列,如果残差序列是白噪声序列,说明模型通过检验,模型具有一定的有效性,否则,表明残差中还有表达数据特征信的息没有被放入到模型中加以应用,意味着该模型还不能通过检验,需要重新建立模型,直到残差序列为白噪声为止。1.2.4模型优化如果一个拟合模型通过了模型诊断和参数检验,只能说明用该模型拟合实际数据是有统计学意义的,但这种模型却不是唯一的,可能有多个通过检验的模型。为10 新疆医科大学硕士学位论文从多个模型中找到最优模型,可使用赤迟信息准则(AIC)和施瓦茨贝叶斯准则(SBC)的原理。AIC准则是日本统计学家Akaike在1973年创建的,该方法的主要思想是同时权衡拟合程度的似然函数值和模型未知参数个数这两个方面,出于此考虑,得到的计算公式如下:2L2kAIC=−+nn(4)上式中,L表示对数似然函数值,n表示观测数,k为未知参数个数。AIC准则取值遵循越小越好的原则。从公式(4)可看出,AIC准则是同时考虑了未知参数个数和拟合精度,所以要使得AIC越小拟合模型就应该综合考虑未知参数个数和拟合精度。然而利用AIC准则获取最优模型时也存在一定的局限性:当观测值数量很大时,AIC准则选择的最佳模型不收敛于真实模型。为了弥补此缺陷,Akaike提出了BIC准则,计算公式如下:BIC=−2ln(L)+ln(n)k(5)其中L,n,k的含义同AIC,取值也遵循越小越好的原则。AIC准则和BIC准则的最大作用在于,根据ACF和PACF识别模型结束后确定的大量可选模型中,帮助我们寻找相对最优的拟合模型。2基于最小二乘支持向量机回归模型的新疆巴州梅毒研究与应用支持向量机(SupportVectorMachine,SVM)理论最初于1995年由Vapnik等基于统计学习理论建立起来的一种机器学习新方法[29-30],是统计学习理论中的关键算法。与其他机器学习方法相比,SVM尽量减少化泛化误差的上界实现了结构风险最小化原则,而不是采用经验风险最小化原则来最小化训练误差。结构分险最小化原则是基于VC维上同时考虑经验分险和置信度,在二者之间找到一个平衡来实现最佳的结构,使得SVM具有更好的泛化能力。此外,SVM训练过程相当于解线性约束的二次规划问题,并且其解不太可能产生局部最小值。随着统计学习理论的不断发展成熟,以及在机器学习领域受到广泛重视,到20世纪90年代,SVM成为机器学习领域受到了高度的关注,在各方面都取得了大量的研究成果。SVM提出最开始是用于处理模式识别问题的,称为支持向量机分类SVC(SupportVectorClassification)。然而,随着Vapnik提出的损失函数的引入,SVM已经被扩展到解决非线性回归问题,把支持向量机针对分类问题中得到的结论推广到回归实函数中,变成了支持向量机回归SVR(SupportVectorRegression)。目前,支持向量机已被用于模式识别、预测分析等方面,并取得了显著的效果[31-33]。在SVM和最小二乘算法的基础上,Suyken等人提出了最小二乘支持向量机LS-SVM(Least11 新疆医科大学硕士学位论文SquaresSupportVectorMachine),LS-SVM模型同样具有SVM模型的优点,它已被成功应用于许多实际工作中,如疾病诊断、非线性建模预测、视觉跟踪、偏微分方程求救等。2.1LS-SVM模型原理2.1.1SVM模型理论支持向量机分类器的原理是从线性可分开始,扩展到线性不可分的情况,然后通过一个非线性函数将一个线性不可分的空间映射到高维下线性可分的空间,该分类器仅由大量样本向量中的极少数支持向量确定,并且具有最大的边界宽度,其中涉及到的主要概念有VC维和结构风险最小化。本小节主要给出VC维和结构风险最小化的概念,然后介绍SVM模型的理论算法。(1)VC维VC维(VapnikChervonenkisDimension,VC)是为了描述一系列函数集或者学习模型性能的重要指标,在模式识别方法中被定义为:存在一个指示函数集,如果存在最大向量数目h能够把函数集合中的各种可能的2h种方式分成两类,即是函数集能够把h个样本打散,除此之外还不存在h+1的样本集能够被该函数集打散,此时最大样本数目h就是函数集的VC维。VC维不仅与函数集有关,还与学习算法有关,导致VC维不容易确定。(2)结构风险最小化结构风险最小化把函数集的经验风险和实际风险之间的关系称作推广性的界,并且经验风险𝑅𝑒𝑚𝑝(𝜔)和期望风险R(𝜔)之间至少以1-η的概率满足如下关系:2𝑙𝜂ℎ(log()+1)−log()ℎ4R(𝜔)≤𝑅𝑒𝑚𝑝(𝜔)+√.(6)𝑙其中,h是函数集的VC维,l是样本含量,η∈[0,1]。由上式可见,机器学习的实际风险的期望风险由经验风险和置信范围构成,所以,具体到实际问题中,当样本含量l固定时,如果VC维h变大,则置信范围变大,造成实际风险与期望分险间的差距越大,那么同时减小经验分险和置信范围就达到了实际风险最小化。所谓的结构风险最小化就是令二者达到折衷状态。(3)SVM模型假定要用𝜔𝑇𝑥+𝑏=0这样一个超平面把空间中的两类点分开,而且希望两类点与这个超平面的距离最大,也就是说,要使距离的带宽ρ=2/‖𝜔‖达到最大,需要用Lagrange乘子法求解下式的极小值。L(𝜔,𝑏,𝛼)=1‖𝜔‖2−∑𝑛𝛼[𝑦(𝜔𝑇𝑥+𝑏)−1]𝑖=1𝑖𝑖𝑖.(7)212 新疆医科大学硕士学位论文根据得到的解𝜔∗,𝑏∗,𝛼∗得到最优分割超平面方程𝜔∗𝑇𝑥+𝑏∗=0.任意点(𝑥)的函数值𝜔∗𝑇𝑥+𝑏∗的符号确定了该点的分类,或者说判别函数为sgn(𝜔∗𝑇𝑥+𝑏∗)。这里的建模过程仅仅依赖于训练集点对的内积,其次,判别过程仅仅依赖于未知点和训练集中支持向量的内积,这种依赖于内积的独特性质使得我们能够解决线性不可分的问题。2.1.2LS-SVM模型原理LS-SVM由J.A.KSuykens提出,它是为了便于求解而对SVM的一种改进,在分类和回归问题上有强大的学习技术。作为SVM的一个扩展,LS-SVM通过非线性映射将原始空间的不等式约束转化成一组等式约束的线性方程,提高了收敛的速度和精度。与SVM的逻辑相似,此处先介绍线性情况下的LS-SVM算法。由于将不等式约束变成了等式约束,因此优化的目标函数为min1𝜔𝑇𝜔+1𝛾𝜉𝑇𝜉(8)𝜔,𝑏,𝜉22s.t.y−xω−bI=ξ构造Lagrange函数如下ℒ(ω,b,ξ,α)=1𝜔𝑇𝜔+1𝛾𝜉𝑇𝜉+𝛼𝑇(𝑦−𝑥𝜔−𝑏𝐼−𝜉)(9)22求ℒ(ω,b,ξ,α)分别对ω,b,ξ,α求偏导,可得∗∂ℒ(ω,b,ξ,𝜉)=0→𝜔−𝑥𝑇𝛼=0𝜕𝜔∗∂ℒ(ω,b,ξ,𝜉)=0→𝛼𝑇𝐼=0𝜕𝑏∗∂ℒ(ω,b,ξ,𝜉)=0→𝛼−𝛾𝜉=0𝜕𝜉∗∂ℒ(ω,b,ξ,𝜉)=0→𝑦−𝑥𝜔−𝑏𝐼=𝜉𝜕𝛼以上等式消去ω和ξ,可得到下面的矩阵方程0𝐼𝑇𝑏0[1][]=[]1Ω+Λ𝛼𝑦𝛾其中Ω=(𝑥𝑥𝑇),𝑖,𝑗=1,2….,𝑛,Λ为n×n的单位矩阵。解该矩阵方程得到α和b,𝑖𝑗则最小二乘支持向量机的估计函数为:f(𝑥)=∑𝑛𝛼(𝑥𝑥𝑇)+𝑏(10)𝑖𝑗=1𝑗𝑖𝑗13 新疆医科大学硕士学位论文类似的,对于非线性情形,利用核函数思想,Ω=k(𝑥𝑖𝑥𝑗),𝑖,𝑗=1,2,可得估计函数为f(𝑥)=∑𝑛𝛼𝑘(𝑥,𝑥)+𝑏(11)𝑖𝑗=1𝑗𝑖𝑗2.2核函数的构造及参数确定在LS-SVM中,不同的核函数参数的选择会对模型精度和泛化能力产生很大影响,不恰当的参数选择可能会导致LS-SVM性能受限。使用广泛的核函数通常有以下三种:(1)多项式核函数𝑞K(𝑥,𝑥)=[𝛾(𝑥∙𝑥)+1],𝑞∈𝑍+(12)𝑖𝑗𝑖𝑗其中q是多项式的次数,q越小学习精度越小,q越大映射的维数就越高,大大增加了计算量。多项式核函数也具有良好的全局性,但是局部性较差。由于相距较远的点也能对核函数产生影响,所以泛化能力较好。(2)高斯核函数2‖𝑥𝑖−𝑥𝑗‖K(𝑥𝑖,𝑥𝑗)=𝑒𝑥𝑝(−2𝜎2)(13)高斯核函数又称径向基(RBF)核函数,学习能力较强,具有良好的局部性,是最常用的核函数。参数σ是由用户决定的核宽度,随着σ的增大会使泛化能力随之减弱,所有样本点被归为一个类,导致其全局性较差。(3)Sigmoid核函数K(𝑥𝑖,𝑥𝑗)=tanℎ(𝑣(𝑥𝑖∙𝑥𝑗)+𝑐)(14)Sigmoid核函数的实现包含了一个隐层的多层感知器神经网络,不同的是这里不会出现局部极小值情况,其网络的权值和隐含层节点数目是由算法自动确定的。除了上述三种方法之外,核函数还有小波核函数、傅立叶级数核函数、张量积核函数等。在支持向量机的实际应用中,还可以根据具体问题构造混合核函数[34],例如将全局核函数与局部核函数线性组合之后形成新的核函数,可以得到更好的泛化能力[35]。本文采用径向基函数作为核函数,原因是该函数的基本上不会发生维数灾难,并且超平面个数比多项式核函数要少很对,大大降低模式计算的复杂。选择合适的核函数后,相应的参数确定也是非常重要的环节,参数的好坏直接决定了预测的效果,对SVM的性能有着重要的影响。目前,SVM方法的核函数及参数的选择还没有一个统一的模式,常用的方法一般有以下三种:(1)交叉验证法[36]交叉验证法一般包括k-折交叉验证和留一交叉验证。k-折交叉验证首先把样本点随机地等分成k个互不相交的子集,然后进行k次训练与测试,即进行k次迭代。一次迭代产生的误差为𝑒𝑟𝑟𝑖=∑𝑖∈𝑆𝑖|𝑓(𝑥𝑖)−𝑦𝑖|,k次迭代完成后计算出k个误差,𝑒𝑟𝑟1,14 新疆医科大学硕士学位论文∑𝑘𝑒𝑟𝑟𝑖=1𝑖∙∙∙𝑒𝑟𝑟𝑘,平均误差𝐾𝑒𝑟𝑟=可以作为该建模误差的估计,判断模拟效果。实际𝑘操作中,k的取值一般大于2,有研究发现k的的取值在5~10之间效果较好[37-38]。留一交叉验证是取𝑘=l,即k-1作为训练样本,每次迭代留下一个样本点用来预测。10-折交叉验证和留一法的误差值都可以用来评价一个算法优劣。(2)网格搜索法网格搜索法用的是穷举法的思想,即在一个较大的范围内参数的自动寻优。网格搜索法的基本思想为:对于要寻优的参数,首先确定参数的取值区间,在给定的区间内打上网格,采用完全搜索,每一次取值组合都计算目标函数值,通过比较选择最优性质的目标函数值对应的参数为最优参数。网格法直观易理解,但如果网格取得很密,会导致计算非常耗时。除此之外,采用网格搜索法寻优的参数最多只能有2个。由于本文选择的径向基核函数的每一组参数(𝛾,𝜎)是相互独立的,可以选用网格搜索法在参数给定区间进行全局寻优,找到相对最优的𝛾,𝜎值。(3)优化算法对于参数的选择还可以采用优化算法来获得适当的参数组合,应用较为广泛的优化算法有粒子群优化模型、遗传算法模型和退火算法。粒子群优化算法在1995年由Kenned和Eberhart等提出,该算法的思想来源于模拟鸟群觅食过程中的迁徙行为,是基于群体智能的全局随机搜索的算法。该算法通过遵循当前找到的最优值来确定总体最优值,但是会过早收敛,易于陷入局部最优现象。3基于传染病动力学模型的新疆巴州梅毒研究与应用3.1传染病动力学模型概述至今,对传染病的研究策略主要有描述性研究、分析性研究、实验性研究和理论性研究。传染病动力学模型是研究传染病流行特征的一种十分重要的理论性研究[39],主要通过建立体现疾病传播特性的数学模型。由于不能在人群中进行传染病实验,因此,通过建立数学模型模拟仿真各类传染病发病机理、流行规律和预测预报就显得尤为重要。动力学方法通过研究生物种群的生长特征,全面考虑疾病的发生,以及考虑一些主要的影响因素,建立尽量切合实际的动力学模型,同时利用计算机技术对模型进行数值模拟,直观的体现控制因素对传染病发展过程的影响,清晰的反映传染病的流行特征,对疾病的变化趋势进行中长期预测,为疾病的控制策略提出合理的建议。利用动力学的思想来研究传染病的传播规律以及疾病的控制已经是十分普遍的方法。在性传播疾病研究领域,数学模型的研究可以追溯到Hethcote和Yorke[40-41],在过去的三十年发展迅速,部分原因是由于获得性免疫缺陷综合征(AIDS)的大流行。最近几年,动力学方法备受关注,已大量运用于探讨HIV和淋病的传播,但到15 新疆医科大学硕士学位论文目前为止,国内关于梅毒的动力学模型的研究还很少。相对于前文的ARIMA模型和LS-SVM模型,传染病动力学建模的优势体现在:1)可以根据疾病的发病过程和传播机理,使人们更加清楚的了解流行过程中的全局性态;2)不仅可以对未来的发展趋势进行预测,还可以通过对模型参数的敏感性分析,找到影响疾病的关键因素,为防控人员提供疾病预防措施;3)结合计算机仿真技术,定量的评价主要影响因素,以及各种干预治疗措施,供科学有效的定量参考依据;4)建模过程中将传染病动力学与生物统计学相结合,有利于深入全面的认识疾病流行方式,使建立的模型更加贴近实际情况。3.2传播动力学中的几个基本概念(1)基本再生数(thebasicreproductionnumber)R0基本再生数R0是传播动力学中十分关键的量,它的含义是在疾病发病的初期,假设人群普遍易感,一个患者者在其平均患病期与易感者接触能够传染的人数量。R0=1是判定疾病是否消亡的阈值条件,具有十分重要的现实指导意义。R0<1,说明一个感染者在平均患病期内传染人数的最大值不足1人,疾病最终将消亡;反之若R0>1,疾病将会一直存在而形成地方病。在实际工作中要想得到R0的值,通常根据所建立的数学模型经数学推导得出,或从基本再生数R0的定义直接获得。(2)有效接触率(adequatecontactrate)通常传染病的传播是通过与他人接触形成的,所以在单位时间内一个病人与其他人接触的次数叫做接触率。接触率通常与研究环境中总人口数N密切相关,记为UN()。如果易感者与染病者之间有了接触,就会造成一定的感染,假设每次接触传染的概率为β0,则一个患病个体所能传染的总人数用UN()表示,称作有效接触率。0有效接触率可以用来反映感染个体的传染能力、在环境中的活动能力和病毒的传染强弱。(3)发生率(incidence)环境中总人口数包括易感者和患病者,有时还包括潜伏者和免疫者。但是患病𝑠者与除易感者以外的人群发生感染,而易感者在总人口数中所占比例为,所以在t𝑛𝑆(𝑡)时刻单位时间内被患病者感染的人数为𝛽0𝑈(𝑁)𝐼(𝑡),这称之为疾病发生率。从发𝑁(𝑡)生率的表达式可看出,假定了接触率与总人口数成正比,所以,有效接触率可以表示为𝛽0𝑘𝑁=𝛽𝑁,其中β=𝛽0𝑘。基于此t时刻在单位时间内疾病的发生率为𝑆(𝑡)βN(t)𝐼(𝑡)=𝛽𝑆(𝑡)𝐼(𝑡)。但是,当总人口数量很大时,一个患病者在研究期内所𝑁(𝑡)能接触到的人数是有限的,所以假定接触率与总人口数成正比是不合理的。16 新疆医科大学硕士学位论文3.3基本的传染病动力学模型国内外关于传染病模型的研究最早由Kermack与McKendrick1927年提出的“仓室”(compartment)模型发展而来,他们提出的SIR模型直到现在仍被普遍使用。早期的SIR仓室模型是一个较为粗浅易懂的模型,首先将该地的总人口数分为三个仓室:易感者(susceptibles),感染者(infectives)和移出者(recovered),所以总人口数为Nt(),即Nt()=St()+It()+Rt()。此外,SIR模型还建立了一些假设条件:假设忽略种群中的动力学因素,主要研究疾病在研究期最时间的变化情况,假定环境是一个封闭环境,则环境中的总人口数是一个恒定的常数,即Nt()K。假设单位时间t内一个患者将病原体传染给易感者的数量与研究环境内的总易感者数量St()成正比,比例系数为β。假设在单位时间t内,从染病者类It()中移出的人数与患者数量成正比关系,该比例系数为γ。在上述三个假设条件下,SIR模型的传播机制图可描述如下:图1SIR模型的传播机制图Fig.1SIRmodeloftransmissionmechanismdiagram其中,仓室S表示易感者类,t时刻的数量记为S(t),含义是t时刻未患病但很有可能被感染的种群数量;仓室I表示染病者类,t时刻的数量记为I(t),代表t时刻已经是该传染病的患者并且具有一定程度传染力的种群数量;仓室R表示恢复者类,t时刻的数量记为R(t),代表t时刻已从染病者类群体中治愈而移除的数量;SI表示单位时间内一个患病者所传染的总人数,即传染的新病人数量;I表示单位时间内从染病者类移出的数量,称为移出率,当移出者是康复者时,可称为恢复率。根据每一个仓室数量变化可建立如下微分方程组:dS=−SIdtdI=SI−I(15)dtdR=IdtSIR模型中仓室R是对某传染病有免疫力的人群,因此SIR模型主要适用于患病者经过治疗恢复后具有免疫能力,而不会再次被该传染病感染的疾病,例如:流感、水痘和麻疹等疾病。但是对于某些传染病,如细菌传播性疾病脑炎、淋病等感染后17 新疆医科大学硕士学位论文治愈后不再有免疫力,这类人群再次接触病原体后会再次感染,SIR模型不再适用,针对这类疾病,1932年Kermack同Mckendrick创建了从染病者类治愈的移出人群没有免疫力的SIS模型,传播机制图为:图2SIS模型的传播机制图Fig.2SISmodeloftransmissionmechanismdiagram根据SIS传播机制图得到以下模型:dS=−SI+Idt(16)dI=SI−Idt随着越来越多的学者使用SIR与SIS动力学模型来解决实际问题,考虑到不同的疾病其传播过程截然不同,例如有的传染病治愈后成为移出者类时,免疫只是暂时的,而不会终生对该疾病免疫,后期会因为无免疫而再次感染,针对这种情况建立的模型称为SIRS模型。有时,患病者在染病者类之前会经过一段病菌潜伏期,可用SEIR模型来描述,SEIR模型中恢复者类具有永久免疫力,如果只有短暂的免疫力,可用SEIRS模型描述疾病的传播。SIS、SIR、SIRS、SEIR和SEIRS模型都没有添加动力学因素,如要考虑动力学因素,可在基本模型中添加出生率与自然死亡率等因素。传染病动力学的建模步骤一般为:(1)模型建立。分析疾病的传播机理,根据疾病的流行特点建立符合实际情况的传染病仓室模型,可建立常微分方程组模型、离散差分方程模型等。(2)数值模拟。查找模型中部分未知参数,对收集到的实际数据,运用MATLAB软件或R软件对模型进行数据仿真,并做相应的理论分析,包括对无病平衡点的求解、基本再生数的求解、自相关函数以及偏自相关函数的计算。(3)模型预测。在数值拟合过程中利用参数估计方法可估计数参数值,根据拟合结果计算模型的精度指标,如果拟合效果好,就对该传染病进行中长期预测,分析疫病未来的流行趋势。(4)提出控制策略。针对模型中有实际意义的参数进行敏感性分析,结合实际情况,从定量分析的角度给出不同因素对疾病传播的影响,找到流行的主要原因,提出控制的最优控制策略。18 新疆医科大学硕士学位论文4模型误差分析为评价模型的有效性,同时对比分析上述三个数学模型的误差,基于统计的方法本文采用平均绝对误差百分比(MAPE)和均方根误差百分比(RMSPE),这两个指标被普遍的运用于评价模型的预测精度和有效性[42-43]。MAPE和RMSPE的计算公式分别为:n)0(−)0(1x(k)xˆ(k)MAPE=0100%;nk=2x(k)(17)n)0()0()0(2x(k)−xˆ(k/)x(k)k=2RMSPE=100%;n−1)0()0(上式中x(k)表示t时刻的实际观察值,xˆ(k)表示模型的拟合值,n表示实际观察数据个数。根据相关文献[44],MAPE和RMSPE评价准则见下表1:表1MAPE和RMSPE评价标准Table1MAPEandRMSPEevaluationstandardMAPE和RMSPE(%)模型预测精度等级<10预测非常精确10-20预测较好20-50预测较合理>50预测不合格19 新疆医科大学硕士学位论文结果1数据基本情况描述2008~2014年期间梅毒的月发病数据来源于新疆巴州统计局。统计局报道的梅毒新发病例由2008年的509例上升到2014年的1012例,发病率由40.58(1/10万)上升到75.59(1/10万),发病率居高不下,呈现缓慢上升趋势,如图3所示。为探讨梅毒发病的季节性变化,收集了2008~2014年期间新疆巴州梅毒的月发病数据,数据如图4所示。图32008~2014年期间新疆巴州地区梅毒发病率Fig.3Theincidenceofnewofsyphilisfrom2008to2014inBayingolinMongolAutonomousPrefecture图42008-2014年期间新疆巴州地区梅毒月发病率Fig.4Themonthlyincidenceofnewofsyphilisfrom2008to2014ininBayingolinMongolAutonomousPrefecture20 新疆医科大学硕士学位论文2ARIMA模型建立与结果分析2.1序列的季节性分析对2008~2014年期间新疆巴州梅毒月发病率进行因素分解,结果如图5所示,趋势性、季节性和随机变化的叠加构成原始观察数据的时间序列。图中可看出,新疆巴州梅毒发病率呈波动上升的趋势,且随月份的变动呈现周期性变化,每个周期性长度为12个月,从随机变化因素可看出序列的误差波动幅度不大,分解后序列较为稳定。图5新疆巴州梅毒月发病率因素分解Fig.5ThefactorecompositionofthemonthlyincidenceofsyphilisininBayingolinMongolAutonomousPrefecture根据原始序列得到新疆巴州梅毒月发病率各月的季节指数如表2和图6所示,1月、2月、7月、9月、10月的季节指数小于1,其中最小值出现在7月(0.79),说明7月是新疆巴州梅毒发病率最低的月份,其他月份的季节指数大于或等于1,最大值出现在3月(1.22),表明3月是梅毒高发季节。表2新疆巴州月发病率的季节指数Table2TheseasonalindexofthemonthlyincidenceofsyphilisinBayingolinMongolAutonomousPrefecture时间(月)1月2月3月4月5月6月7月8月9月10月11月12月季节指数0.960.921.221.041.141.000.791.140.850.831.021.1121 新疆医科大学硕士学位论文图6梅毒月发病率的季节指数图Fig.6Theseasonalindexofthemonthlyincidenceofsyphilis2.2序列的平稳性判断根据时序图4可看出原始数据有缓慢上升的趋势,似乎不够平稳,因而对原序列进行一阶逐期差分,使用ADF(AugmentedDickey-Fuller)单位根检验方法判断平稳性,结果显示P=0.01,说明一阶差分序列已经实现平稳。2.3模型识别模型识别主要是确定模型的阶数。对平稳后的序列尝试构建ARIMA(p,d,q)(P,D,Q)S模型。由于原始序列已经通过一阶差分处理实现平稳,而季节性没有做差分,故差分项d=1,D=0。为了获得模型阶数的可能取值,绘制出梅毒发病率的自相关函数(ACF)和偏自相关函数(PACF)图,结果如图7所示,自相关系数显示无滞后与滞后一阶时明显超过2倍标准差区间,其余自相关系数都在2倍标准差区间内波动,且突然衰减到区间内变化,可初步判定自相关系数一阶截尾,偏自相关图拖尾,则p可能的取值有0或1,q可能的取值有1或2,P可能的取值有0或1,Q可能取值有1或2。图7新疆巴州梅毒月发病率一次差分序列的ACF和PACFFig.7TheACFandPACFoffirstdifferenceofthemonthlyincidenceofsyphilisinBayingolinMongolAutonomousPrefecture22 新疆医科大学硕士学位论文2.4参数估计及模型诊断与优化根据自相关函数与偏自相关函数结果的p,q和P,Q的每种取值可能组合的成多种ARIMA(p,d,q)(P,D,Q)S模型,需要对这些模型逐一进行参数检验和残差检验,筛选出通过检验的初选模型,结果如表3所示。表3中AIC与AICC最小的模型是ARIMA(0,1,1)(1,0,1)s,虽然SBC最小的模型是ARIMA(0,1,1)(0,0,0)s,但ARIMA(0,1,1)(1,0,1)s模型的SBC仅与最小的SBC相差1.11,综合AIC、AICC、SBC值的大小情况,本研究选取ARIMA(0,1,1)(1,0,1)s为最优模型。对最优模型的各参数进行参数检验,结果见表4,三个参数t检验统计量的p值均<0.001,说明三个参数都有统计学意义。同时检验ARIMA(0,1,1)(1,0,1)s模型的残差,统计量Ljung-Box=8.1522,P=0.7731,差异无统计学意义,可以认为残差序列呈白噪声,说明所建立的模型是合适的。表3ARIMA(p,d,q)(P,D,Q)s模型的组合与最优模型的选取准则检验Table3thecombinationofARIMA(p,d,q)(P,D,Q)smodelandtheselectionprinciplesoftheoptimalmodel模型AICAICCSBCARIMA(0,1,1)(0,0,0)12256.05256.21260.74ARIMA(1,1,0)(0,0,0)12265.11265.28269.80ARIMA(2,1,0)(0,0,0)12262.60262.93269.64ARIMA(0,1,1)(1,0,1)12252.48253.03261.85ARIMA(0,1,1(0,0,1)12257.80258.13264.84ARIMA(1,1,0)(1,0,1)12259.53260.09268.91ARIMA(1,1,0)(0,0,1)12266.01266.34273.04ARIMA(1,1,0)(1,0,0)12265.36265.69273.39表4ARIMA(0,1,1)(1,0,1)12模型参数检验Table4ARIMA(0,1,1)(1,0,1)12Modelparametertest模型参数回归系数标准误t值P值MA(1)0.99910.0085117.5412<0.0001MA(2)-0.97670.1097-8.9034<0.0001SAR(1)0.99910.0085117.5412<0.000123 新疆医科大学硕士学位论文2.5模型交叉验证模型交叉验证分为模型拟合阶段和验证阶段。以2008年1月至2014年6月新疆巴州梅毒的月发病率为建模数据,运用ARIMA(0,1,1)(1,0,1)12模型预测2014年7月至12月巴州梅毒发病率。拟合及预测结果如图8所示,计算拟合过程MAPE为16.39%,RMSPE为29.24%,说明ARIMA(0,1,1)(1,0,1)12模型拟合效果较好;模型预测结果显示由2014年7月至12月的梅毒月发病率数据的预测值的动态变化趋势与实际发病率基本一致,有5个预测值的95%区间包含了实际值除了2014年12月以外,各月的预测值见表5。由表5计算得到预测过程的MAPE为8.98%,RMSPE为14.32%,平均绝对误差(MAD)为0.83,表明模型短期预测精度较高,对新疆巴州梅毒疫情有预警作用。表52014年7月至12月新疆巴州梅毒发病率实际值与预测值比较Table5ComparisonoftruevalueandpredictionvalueofmonthlyincidenceofsyphilisfromJuly2014toDecember2014ininBayingolinMongolAutonomousPrefecture时间实际值预测值95%CI绝对误差相对误差2014.76.126.023.74~8.30-0.10-1.632014.87.546.984.58~9.38-0.56-7.432014.96.126.193.67~8.710.071.442014.106.496.133.50~8.75-0.36-5.552014.117.096.764.03~9.50-0.33-4.652014.1210.617.064.22~9.90-3.55-33.46图8ARIMA(0,1,1)(1,0,1)12模型拟合2008年1月至2014年6月期间梅毒发病率及预测2014年7月至2014年12月梅毒发病率Fig.8ARIMA(0,1,2)(1,1,0)12modelfittingtheincidenceofsyphilisfromJanuary2008toJune2014andpredicttheincidenceofsyphilisfromJuly2014toDecember201424 新疆医科大学硕士学位论文2.6模型预测以2008年1月至2014年12月所有的发病率数据为基础,用模型ARIMA(0,1,1)(1,0,1)12对2015年1-6月该地区梅毒发病率进行短期外部预测,并给出95%可信区间,预测结果见表6,预计2015年1-6月期间新疆巴州梅毒发病率将在7.83/10万~9.02/10万之间波动。表6ARIMA(0,1,1)(1,0,1)12模型预测新疆巴州2015年1-6月期间梅毒发病率Table6ARIMA(0,1,2)(1,1,0)12modelpredicttheincidenceofsyphilisfromJanuary2015toJune2015ininBayingolinMongolAutonomousPrefecture时间2015.12015.22015.32015.42015.52015.6预测值8.057.839.028.459.008.4495%CI上限5.765.406.455.766.195.5195%CI下限10.3510.2611.5811.1411.8111.373LS-SVM模型建立与结果分析现实中影响传染病发病的因素众多,相互关系复杂,与当地的经济、气候、地理环境等密切相关,各因素的作用通常不能或无法用精确的数学语言来描述。因此本文只研究梅毒发病率本身之间的内部规律,把传染病月发病率数据作为一个时间序列考虑。本节通过建立LS-SVM模型,对新疆巴州地区2008年1月至20014年12月的梅毒月发病率进行拟合,对2015年1-6月的发病率进行短期预测。模型的模拟和预测过程均在R3.4.3环境下进行。3.1样本数据的处理在数据分析过程中,通常使用的变量量纲不一致,在确定权重、系数、距离的时候,也会有影响,因此要进行数据标准化。标准化避免了各种不同量纲因为数据级相差太大而造成计算误差,保证较小的输出值数据不被吞食,需要对样本数据进行归一化处理。归一化处理公式为:𝑥𝑖−min⁡(𝑥)𝑦𝑖=,𝑖∈[1,𝑛](18)max(𝑥)−min⁡(𝑥)其中𝑥𝑖表示样本数据,min(x)和max(x)表示样本数据的最小值和最大值,𝑦𝑖表示归一化后的数据。对归一化后的数据建立的模型,此时模型的输出数据要进行反归一化操作,才能反映实际情况。反归一化操作就是归一化操作的逆过程。对应的公式为:𝑥𝑖=𝑦𝑖(max(𝑥)−min(𝑥))+min⁡(𝑥)(19)25 新疆医科大学硕士学位论文3.2核函数的选择不同的核函数导致输入空间到特征空间映射的结果大有不同。各种不同核函数与参数所构成的最小二乘支持向量机模型的预测效果差异很大。在多项式核函数、RBF核函数、Sigmoid核函数这三种常用核函数中,RBF核函数的参数选择容易实现,并且当参数在有效范围内改变时,使得大大较小了计算的空间复杂度,此外,RBF核函数的应用范围也是最广的,它直观反映了两个数据的距离。因此本文梅毒月发病率预测的最小二乘支持向量机方法中采用RBF核函数。3.3参数的选择确定选择RBF函数作为核函数以后,待选择的参数就是𝛾⁡和σ。对于常用的参数选择方法,本文采用k折交叉验证法寻优。首先给定参数𝛾,𝜎的可能取值范围,在该范围内重复k次迭代。将所有的数据按照训练集:测试集=7:3的标准进行划分。这样划分,既能保证有足够的数据用来学习又能够验证模型的效果。除此之外,采取随机采样的方法,即每次从所有数据中随机的选取7/10作为训练集,其余的数据作为测试集,用以验证模型的健壮性和适应性。用k次迭代的平均误差来估计预期泛化误差,以此在给定的参数范围内寻找一组使误差最小的参数。实际操作中k的取值一般从3开始,本文选定k=5,即5折交叉验证,得到的最优参数为𝛾=222,σ=0.000102.3.4结果预测与分析利用建立的LS-SVM模型对新疆巴州2008年1月至2014年12月梅毒月发病率进行拟合预测。拟合结果如下图9所示。拟合过程MAPE为8.89%,均方根RMSPE为19.12%,说明该模型的拟合效果较好,可以用此模型对新疆巴州梅毒发病进行预测。模型对2015年1-6月该地区梅毒发病率进行外部预测,结果见表7,2015年1-6月期间新疆巴州梅毒发病率最大值为9.57/10万,最小值为8.86/10万,没有出现较大值,发病率波动范围不大。表7LS-SVM模型预测新疆巴州2015年1-6月期间梅毒发病率Table7LS-SVMmodelpredicttheincidenceofsyphilisfromJanuary2015toJune2015ininBayingolinMongolAutonomousPrefecture时间2015.12015.22015.32015.42015.52015.6预测值9.579.529.218.988.878.8626 新疆医科大学硕士学位论文图9LS-SVM拟合2004-2014年梅毒月发病率Fig.9LS-SVMfittingmonthlyincidenceofsyphilisin2004-20144新疆巴州动力学模型建立与结果分析4.1梅毒传播机理分析为更好地了解梅毒的流行过程,本文构建了梅毒动力学传播的仓室模型,记录梅毒螺旋体在不同疾病状态之间的移动,如图2所示。在模型的框图中,将是否感染梅毒与疾病相关人群分为易感者(S),潜伏感染者(E)和梅毒感染者(I)三类,因此总人群数为N=S+E+I。根据梅毒的自然传播,当一个人成为性活跃者就进入了易感者类(S),此类人群包括暗娼人群、吸毒人群、男性同性恋人群等。当易感者与梅毒患者发生性交时,易感者被梅毒感染的概率为。此时,该易感者还不具有传染性,也不表现临床症状,会以一定速率进入潜伏感染者类(E)。由于潜伏感染者不易被发现,不能得到及时治疗,体内梅毒螺旋体开始繁殖增多,个体出现一些梅毒的典型临床特征,并具有很强传染性,该个体成为患病者类(I)。梅毒患者以一定的概率为接受治疗,当体内的病原体被药物完全清除后,由于免疫效果只是暂时的,所以患病者又会回到易感者类。如果缺乏有效的治疗,梅毒感染是终身的。一旦感染,梅毒患者就可能会经历疾病的各个阶段,有大约1/3的早期梅毒会发展成为晚期梅毒,其中包括神经梅毒、心血管梅毒和梅毒瘤,这些疾病是造成梅毒死亡率的主要原因。针对有关梅毒的行为流行病学,性伙伴的选择方式与性伙伴的变换数量会严重影响到梅毒的传播[45]。过去30年里,已有大量文献研究核心组概念对性传播疾病的影响。核心组(coregroups),指核心组成员有高度的危险行为,他们对梅毒的传播起着举足轻重的作用[46]。本文根据易感者的性伙伴改变率将人群分为核心组(i=1)和非核心组(i=0)。因此,图10中的每个仓室都包含这两类人群,即S0,E0,I0,S1,E1,I127 新疆医科大学硕士学位论文分别表示非核心组的易感染类,非核心组的潜伏感染类,非核心组的感染类,核心组的易感染类,核心组的潜伏感染类,核心组的感染类。图10梅毒的传播机制图Fig.10Transmissionofechinococcosisdisease4.2模型建立与基本再生数导出据根据梅毒的传播机制图建立以下梅毒动力学模型:dS0S0c000I0S0c001I1=N+I−S−−000dtNNdE0S0c000I0S0c001I1=+−(+)E0dtNNdI0=E−(+)E00dt(20)dSScIScI1=N+I−S−11100−11111111dtNNdEScIScI1=11100+11111−(+)E1dtNNdI1=E1−(+)E1dt模型(20)的参数解释如下:表示单位时间人群的进入率与退出率;0表示进入非核心组的概率;1表示进入核心组的概率;表示感染率;c0表示非核心组平均每年新性伙伴的数量;c1表示核心组平均每年新性伙伴的数量;00表示非核心组的人选择一个非核心组性伙伴的概率;01表示非核心组的人选择一个核心组性伙伴的概率;10表示核心组的人选择一个非核心组性伙伴的概率;11表示核心组的人选择一个核心组性伙伴的概率;表示人群从潜伏感染类到梅毒感染类的转化率;表示治愈率。基本再生数R0是人群中梅毒传播动力学模型研究的一个基本指标,它表示在发28 新疆医科大学硕士学位论文病初期,当所有人均为易感者时,一个病人在其平均患病期内所传染的人数[47]。通常,R0=1可作为决定疾病是否消亡的一个阈值,当R0<1时,疾病逐步消亡;而当R0>1时,疾病将始终存在而形成地方病。为计算模型的R0。首先解出模型(1)的无病平衡点。将含有病例的群体数量都设为零,即E0=,0E1=,0I0=,0I1=,0将E0,E1,I0,I1代入方程即可得出无病平衡点为:(S0,0,0,S1)0,0,=(N0,0,0,N1)0,0,。下面利用文献[48]中的方法计算模型(20)的基本再生数。首先计算模型的无病平衡点和地方病平衡点,然后再求出基本再生数R0。S0c000I0S0c001I1+E0+E0NNF=E0,v=I0+I0设ScIScI11100+11111E1+E1NNI+I11E1将F和V分别对E0,E1,I0,I1求偏导数,得出F,V00c00000c001+0000000+00F=,V=0c0c00+011101111000000+−1计算FV:c0000c000100++000−1+FV=cc0111001111++000+−1定义R=max{(FV)}0M+c+c得到00001111R=(21)02(2+++)222222其中M=c−2cc+4cc+c0000010100110110010111114.3参数说明参考现有相关文献的数据,模型(20)的参数取值如下表8所示。29 新疆医科大学硕士学位论文表8各参数符号与参数值Table8Thesymbolsandparametersvalue参数参数符号参数值出处人群的进入率与退出率0.0141[49]进入每个性活跃组概率i0=7.0,1=3.0[50]每年新性伙伴数量cic0=,5c1=50假设每个性伙伴的感染率β0.1079拟合潜伏感染到患有梅毒的转化系数1.4303拟合治愈率0.719拟合现对模型中相关参数值给出以下几点说明:(1)新疆人口平均寿命为71.12[49],因此我们估计人群的进入率与退出率的取值为=/171.12.00141,为了简便,以新疆人群的进入与退出率代替巴州。(2)根据文献研究表明[50],人群中性活跃与非性活跃人数分别占总人数30%和70%,由此取0=7.0,1=3.0。(3)由现场流行病学调查的资料[51-52],新疆巴州地区部分高危人群在调查期近一个月都有过性行为,但具体有多少个性伴资料中没有明确的显示,暂且估计活跃组每年平均新性伴数为50人,非活跃组为5人,取c0=,5c1=50。虽然此基线值比实际性伙伴数高,但是仍然可以从模型分析得到性伙伴数对梅毒流行的影响。(4)本文对于性伙伴选择采用非随机的混合模式,核心组的人选择非核心组性伴的概率大于核心组,非核心组的人选择非核心组性伴的概率大于核心组,因此,姑且假设00=7.0,01=3.0,10=6.0,11=4.0。4.4数值模拟为了计算出模型的数值解,需要先确定模型初始值,并估计出未知参数。人口数据来源于新疆各年的统计年鉴。定义M(t)为t时刻梅毒的累积发病数,那么t+1时刻的累积发病数等于t时刻的累积发病数加上t+1时刻新增加的病例数。新疆巴州地区2008年梅毒的新发病例数为509人,因此,M(t)的初始条件为M(2008)=509。由于2008年总人群数量为1254262人,推测其他初始值分别为S0=877620,E0=320,I0=360,S1=375900,E0=130,I0=149。利用非线性最小二乘法模拟参数,和的点估计值,利用boostrap抽样方法,获取参数的95%区间估计值,如表9所示。将30 新疆医科大学硕士学位论文表9中的参数值带入公式(21),计算出新疆巴州梅毒的基本再生数为R0=1.06(95%CI:1.01-1.15)。表9参数估计值Table9Parameterestimation.参数β点估计值0.111.430.7295%CI0.07-0.400.70-2.240.42-2.924.5模型评价与预测利用建立的模型拟合新疆巴州2008年至2014年间梅毒的累积发病数,结果如图11所示。图11显示实际累积发病数的点在直线附近,且置信带较窄,评价指标MAPE=3.90%,RMSPE=7.06%。若MAPE与RMSPE均<10%,表示模拟结果较精确(参考表1),说明建立的模型拟合效果很好,可用于预测。预测未来10年新疆巴州梅毒累积发病数量并作95%置信带,如图12所示。图12显示新疆巴州的发病数呈现快速上升的趋势,如果对此没有采取有效的控制措施,到2023年预计累积发病数为16465例,2024年新疆巴州梅毒的累积发病数为18145例,计算出2024新发病数达到1680例。图11拟合累积梅毒发病者数量Fig.11Fittingthenumberofpatientswithcumulativesyphilis31 新疆医科大学硕士学位论文图12梅毒中长期预测Fig.12Mediumandlongtermpredictionofsyphilis4.6参数的敏感性分析敏感性分析是指从模型(17)的所有参数中找出对模型结果有重要影响的敏感性因素,是在确定性分析的基础上,分析和测算各因素对模型结果的影响程度和敏感性程度。由于拉丁超立方抽样(LHS)方法很早就被广泛用于疾病传播模型的不确定性和敏感性分析,因此,为了检验模型中参数变化的敏感性,本文利用LHS方法对R0表达式中的相关参数进行抽样。将感兴趣的待研究参数作为输入变量,梅毒新发病例数作为输出变量,抽取样本量n=1500,计算参数的偏秩相关系数(PartrialRankCorrelation,PRCC)与P值,结果如表10所示。PRCC值表示改变该参数对基本再生数R0的统计学影响,意味着输入参数对基本再生数R0的影响程度。PRCC的绝对值越大,参数对改变R0的大小就越显著,值的正负号意味着增大或减小R0。感兴趣的输入参数有、、c0、c1和,图13展现了各参数的PRCC值,取显著性水平=.005,当参数的P值小于0.05时在条图上方用星号标志,它们与R0的PRCC值分别为0.9661、0.0251、0.5358、0.8794和-0.6719,其中除对基本再生数R0无影响外,其他参数均有统计学意义,其中感染率β对R0的影响最大(|PRCC|=0.9661),其次是核心组的性伙伴改变量c1(|PRCC|=0.8794)。因此,从敏感性分析可得到,控制梅毒流行的有效的方法是减小感染系数和增大治疗率。在此基础上进一步定量探讨参数c0和c1,,对R0的影响。32 新疆医科大学硕士学位论文表10输入参数的PRCC值Table10Thepartialrankcorrelationcoefficients(PRCC)valueofinputparametervariable参数βc0c1PRCC0.96610.02510.53580.8794-0.6719P值<0.0010.3327<0.001<0.001<0.001图13输入参数的PRCCFig.13ThePRCCvalueofinputparametervariable.4.7不同因素对基本再生数的影响当其他参数不变的情况下,利用matlab软件计算得到随着c0和c1的增加,R0也逐渐增加,如图14所示。当核心组性伙伴数c1=50时,非核心组性伙伴数c0<3才会使得R0<1。同样非核心组性伙伴数c0=5,核心组性伙伴数c1<42才会使得R0<1。这两种情况在现实中较难实现,但当二者结合,控制c0<8且c131时会使得R0更切实际的小于1。保持其他参数不变,控制参数从0增加到0.4时R0的变化情况如图15,图15显示了R0随着感染率的增加而增加,感染率曲线与直线R0=1相交于点(0.0952,1),即当<0.0952时,说明可以通过控制感染率来很好的控制梅毒传播。保持其他参数不变,控制参数从0增加到1.2时R0的变化情况如图16,图16显示了R0随着治愈率的增加而降低,治愈率曲线与直线R0=1相交于点(0.8166,1),即当>0.8166时,R0<1,说明若对感染者的治愈率达到81.66%,梅毒的流行将会被遏制。因此同时减少核心组与非核心组的性伙伴数,降低感染率和提高治愈率相结合可以更好的控制梅毒的传播。33 新疆医科大学硕士学位论文图14C0和C1对R0的影响Fig.14EffectsofC0andC1onR0图15β对R0的影响图16τ对R0的影响Fig.15EffectsofβonR0Fig.16EffectsofτonR05三种模型的误差分析结果以上分别运用ARIMA模型、LS-SVM模型和动力学模型对新疆巴州梅毒发病进行了拟合预测,三种模型的拟合和预测的效果评价见表11。表11三种模型的误差值Table11Theerrorvaluesofthreemodels数学模型MAPE(%)RMSPE(%)预测模型的有效性ARIMA模型16.3929.24预测较合理LS-SVM模型8.8919.12预测较好动力学模型3.907.06预测非常精确34 新疆医科大学硕士学位论文由表11可见,动力学模型的MAPE和RMSPE都在10%以内,在三种数学模型中动力学模型预测精度最好,可以用来预测新疆巴州梅毒的年发病趋势;LS-SVM模型的预测精度较好,但比ARIMA模型预测效果要好一些,其预测效果较为合理,ARIMA模型理论上可以用来预测2015年梅毒的月发病率。本文充分利用新疆巴州流行病学调查数据,把传染病动力学、统计学和数据挖掘算法思想应用在巴州梅毒的预测与控制中,对巴州梅毒进行了更为深入的理论和定量研究。从模型预测的精度来看,动力学模型在三者中预测效果更佳,与动力学模型相比,ARIMA模型和LS-SVM模型均属于单纯时间序列数据驱动模型,即过去的趋势保持到未来的发展,若未来发生重大变化,按过去和现在的趋势预测未来的结果可能会发生偏移。动力学模型是根据梅毒的传播机理建立的,能动态的分析梅毒的流行规律,使人们了解流行过程中的一些全局性态,因而,传染病动力学模型有着明显的优越性。由于研究的限制,本文中仅仅以月发病数据对未来发病情况进行预测,并没有考虑到其他因素,如人群行为、生活环境、地区医疗卫生服务水平、行政干预、人口流动等的影响。但由于相关的影响因素不能数据化,不能纳入分析。在后续的研究还应探索多因素影响的应用模型,采用经济实效的预测方法,掌握梅毒发病趋势,采取切实可行的防控措施。35 新疆医科大学硕士学位论文讨论1基于ARIMA模型的新疆巴州梅毒研究与应用梅毒是一种溃疡性的生殖器疾病,有利于人类免疫缺陷病毒(艾滋病病毒)的传播。近年来,新疆的梅毒流行呈现持续高发病率,成为全国范围内的高发地区。新疆梅毒病例主要集中在新疆南部,其中新疆巴州梅毒疫情较为严重,2008年至2014年期间报告的梅毒发病率呈现缓慢增长的趋势,新疆巴州梅毒流行状态较为严峻。因此尽早地了解梅毒的流性特征对梅毒的预防和控制具有十分重要的意义,可以更好的掌握未来的发展动态,加强梅毒的监测和控制。在考察传染病随时间的变化规律方法中,时间序列分析方法的使用已经非常广泛,它是根据变量本身的历史数据,分析疾病的随时间的变化规律,预测未来流行趋势。ARIMA模型是目前最为常用的时间序列分析方法,理论上ARIMA模型已有一套明确的准则,并且不必事先知道时间序列的特征,只需要通过计算机充分利用误差信息,反复识别修改,以获得一个比较满意的模型。近年来,ARIMA模型已成功运用于预防医学[53]、经济学[54]、管理科学[55]和地理学[56]等各个领域,已是一种实用性强而且预测精度较高的方法。本文首先运用因素分解方法对2008年1月至2014年12月巴州梅毒月发病率探查了数据的趋势性、季节性和随机化波动特征。因素分解显示在季节因素上梅毒呈周期性变化,计算的季节指数发现春季(3、4、5月)是巴州梅毒的高发季节,这与马超等对新疆巴州梅毒季节性分布结果一致[57],而7、9、11月是低发季节,这与大多数地区梅毒报道结果不一致,可能与巴州夏秋季节人员流动等因素有关。而后对序列进行平稳性检验、模型识别、参数估计及模型诊断与优化等建模过程建立了具有季节性的ARIMA模型,根据AIC、AICC、SBC最小选择ARIMA(0,1,1)(1,0,1)12为最优模型,因此运用ARIMA(0,1,1)(1,0,1)12模型对2014年后半年的梅毒发病率预测值与真实值进行比较,结果发现模型较好的预测了梅毒月发病率变化趋势,预测的6个月中有5个月的实际发病率落在预测发病率的95%区间以内,对于2014年12月实际发病率超出该月预测区间上限,原因可能是近年来报道的隐形梅毒较多,造成增长幅度较大[58];或当地性病防范知识普及范围低以及对性病的预防服务率低有关[59]。预测2015年1-6月的梅毒发病率,数据显示发病率将在7.83/10万~9.02/10万之间波动,与上半年比较无明显变化趋势。ARIMA模型是一种高效的短期预测模型,但是随着预测长度的增加模型预测精度会逐渐下降,不能真实的反映疾病流行趋势。本文是基于2008-2014年的数据建立的模型,仅仅往后预测了半年的数据,预测长度只有6个月,如果要对新疆巴州梅36 新疆医科大学硕士学位论文毒发病率进行更远时间的预测,就需要不断加入新发生的数据对ARIMA(0,1,1)(1,0,1)12模型进行修正、甚至重新拟合。或者为了提高模型预测精度,充分反映季节效应,最好补充逐年数据,建立更能反映实际情况的ARIMA模型。此外,影响梅毒流行的因素较复杂,可能受文化差异、地区差异、经济条件等多方面因素的影响,而时间序列方法仅从数据本身出发,属于单一自变量模型,不能研究影响因素之间相互联系与制约的复杂关系。因此,对于影响因素复杂的疾病不适宜建立ARIMA模型,ARIMA模型只能从总体上探讨疾病流行的短期趋势,而不能分析影响梅毒流行的主要因素,所以,欲有效控制梅毒的流行还需考虑其它的建模方法。2最小二乘支持向量机在新疆巴州梅毒研究中的应用在我国,传染病预测方法起步较晚,研究相对滞后,大量的相关文献资料表明目前大多数还是使用传统的预测方法。时间序列预测方法作为传统预测方法的一种,要求时间序列变量服从正态分布或者要求要有足够的样本观察点,并且对处理非线性的问题往往不尽如人意。因此,针对ARIMA模型不能解决非线性问题以及预测精度较弱,本文引入最小二乘支持向量机模型来预测巴州梅毒的流行趋势,以期获得较ARIMA模型精确度较高的预测模型。基于VC维和结构风险最小原理的支持向量机(SVM)模型作为一种新型的机器学习方法,虽然相较于其他的传统预测方法起步较晚,但在非线性拟合能力上SVM模型具有ARIMA模型无可比拟的优势。LS-SVM作为SVM在回归领域的分支,凭借其优越的预测性能已被广泛的应用于生产与生活中,如语音识别[60]、人脸检测[61]、文本分类[62]等领域。本文将LS-SVM引入到梅毒预测的应用中来,围绕着利用LS-SVM对梅毒发病率进行预测的方法展开,首先对2008-2014年新疆巴州梅毒月发病率数据进行归一化处理,避免数据因为数据级相差太大而对模型误差造成影响。在LS-SVM模型开始训练学习之前,首先要解决的问题核函数的确定以及采用何种方法估计对应的参数。考虑到径向基(RBF)函数具有空间复杂度小、应用范围广的特点,本文LS-SVM模型的核函数选择选择径向基函数。在确定核函数后,需要确定的参数只有正则化参数𝛾和核函数宽度σ,这两个参数在很大程度上决定了LS-SVM模型的学习能力和泛化能力。为了寻找到合适的𝛾和σ的组合,本文采用5折交叉验证法。从84个原始数中随机采取70%作为训练集,30%作为测试集。在给定参数𝛾,𝜎的可能取值范围内重复迭代5次,寻找一组是误差最小的𝛾和σ值是𝛾=222,σ=0.000102。LS-SVM模型拟合实际发病数结果MAPE为8.89%,RMSPE=19.12%,表明模型拟合精度较高,意味着利用LS-SVM模型进行短期预测是有效的。使用建立的LS-SVM模型对2015年1-6月新疆巴州地区梅毒发病率进行短期预测,预计2015年1-6月期间新疆巴州37 新疆医科大学硕士学位论文梅毒发病率将在8.86/10万~9.57/10万之间波动。与ARIMA(0,1,1)(1,0,1)12模型预测结果对比发现,LS-SVM模型拟合精度有所提高,模型有效,说明将LS-SVM模型引入新疆巴州梅毒预测分析是可行的,这与俞璐[63]、力琼[64]等对ARIMA模型和SVM模型的研究结论一致。通过实证分析,表明LS-SVM作为一种新的技术手段在疾病预测工作中是有益的尝试,同时也支持了LS-SVM预测能力出色的优点。LS-SVM是一种性能优越的预测模型,但在传染病预测方面的相关研究并不多。本文的研究分析属于初级阶段,还有很多问题需要进一步探讨,如针对核函数及参数选择问题,目前仍缺乏明确的理论指导。受条件限制,本文采用的核函数是比较常用的,而在实际应用中应尝试采用更多种类的效果较好的核函数。在参数确定上,通过在事先确定的范围内搜索是一种思路简单而且对搜索对象要求极低的方法,因此,如何更好地选择核函数和参数需要继续研究,以获得精确的预测模型。除此之外,针对传染病的预测方法还有很多,而且任何一种预测模型都不可能适用于所有的实际问题,可以尝试将多种方法进行组合,得到不同的组合模型,以获得更好的效果。3动力力学模型在新疆巴州梅毒研究中的应用近十几年来,中国正在经历一个极大的梅毒流行率。在我国许多梅毒高危患者无法接受常规梅毒筛查,受梅毒影响严重的地区对艾滋病毒感染的地区来说也是一个重大的公共卫生威胁。近年来,梅毒在新疆蔓延和流行,而新疆巴州地区是梅毒高发地区,梅毒发病率居高不下,因其传染性较强,经济及社会影响大,极大的威胁了人们的生命健康。在性传播疾病领域,数学模型的研究可以追溯到20世纪40年代。由于过去二十年艾滋病(AIDS)的流行,动力学的研究方法开始备受关注,但到目前为止,国内用动力学方法研究梅毒的流行与控制还比较少。与前文采用的统计学方法和数据挖掘方法对比,动力学模型能更好地从梅毒的传染进程来反映梅毒的流行特点。动力可对未来流行趋势进行中长期预测,通过敏感性分析找到影响梅毒的重要因素,同时利用计算机仿真技术分析各因素对模型的影响程度,这为梅毒的防控提出了量化的建议。为了研究清楚巴州地区梅毒未来的流行状况,本文根据梅毒的自然传播机制和人群的性活跃程度,构建了一个动力学模型,并详细展现了基本再生数R0的计算过程,数值模拟得到参数估计值和基本再生数R0=1.06(95%CI:1.01-1.15),基本再生数大于1,说明未来巴州梅毒将会始终存在。模型的拟合精度指标MAPE=3.9%,RMSPE=7.06%,两个指标都低于10%,说明模型有效性较好。利用该模型预测了新疆巴州梅毒此后10年的流行趋势,如果当前的防控策略不变,控制以及根除梅毒是38 新疆医科大学硕士学位论文很难实现的。为找到影响巴州梅毒流行的主要因素,本文对模型的参数进行了敏感性分析,结果发现感染率、核心组性伙伴数c1和治愈率是有效控住梅毒要的关键。其中感染率是指1个梅毒感染者与1个易感者在1次性行为中的平均感染率,欲降低感染率,需要降低危险的性行为,例如提高安全套使用率,避免口交、肛交等高度不安全性行为,发现有梅毒早期症状时不性交等一系列措施来切断梅毒的传播;核心组性伙伴数c1是指单位时间内1个核心组感染者的平均新性伴数量,为减少性伙伴数量,研究人员要着重针对核心组人群的性网络开展预防干预,追踪传播链中的多性伴者,加强他们的健康知识教育;恢复率是指1个感染者接受有效治疗的平均概率,为增加,提示临床医务人员在工作中要提高警惕,对有不安全性行为和多性伴者要加强梅毒血清学检测,以及时发现梅毒传染源及其可能传染的性伴,尽早治疗。事实上,梅毒的传播过程非常复杂,如人群性行为的异质性,性活跃程度、求医行为和年龄问题等不确定因素都对疾病传播结果产生影响。本文在建立模型时,为了简便起见,对模型的有些参数进行了假设,这可能会造成模型结果的不确定性。虽然这些不确定因素不可避免,但是我们的模型仍然可以说明以上问题,便于清晰地认识梅毒的传播机制。除此之外,本文的动力学模型仅仅考虑了显性梅毒的传播建模,对隐形梅毒和其他分期的显性梅毒以及先天梅毒的动力学建模有待于进一步探究。对新疆巴州地区梅毒发病趋势和控制研究,本文建立了三个数学模型:ARIMA模型、LS-SVM模型和动力学模型,其中动力学模型的预测精度是最好的,但是动力学模型的建模过程较前两种模型繁杂,需要确定的参数较多。在实际应用中,应根据预测的目的来确定选用何种模型,如果预测是为了制定疾病流行控制策略,可采用动力学模型;如果预测是为了控制近期疾病的暴发流行,可采用ARIMA模型和LS-SVM模型,进一步,如果传染病具有季节特征选用ARIMA模型较好,如果想获得更精确的预测数据,选用LS-SVM模型较好。39 新疆医科大学硕士学位论文小结本文为了探讨数学模型在新疆巴州地区梅毒流行状况的预测与控制中的应用,将时间序列模型的季节效应优势、最小二乘支持向量机的高精度短期预测优势和动力学模型的长期预测优势相结合,全面了解巴州梅毒的流行情况和未来的流行特征。通过对模型的理论分析,以及定量地模拟影响梅毒传播的相关因素,为梅毒的预防和控制提供有力依据。本文主要研究成果如下:1综合分析新疆梅毒发病数的数据特征,考虑到梅毒的季节周期性,建立了新疆巴州梅毒的ARIMA预测模型,利用该模型对新疆巴州梅毒的流行趋势做出短期预测,结果显示新疆巴州梅毒仍然存在较高的发病率,较上半年无明显变化趋势。ARIMA型预测值的动态趋势与实际发病率基本一致,说明ARIMA模型可用于预测梅毒发病率。尽管如此,为提高模型预测精度,还应不断加入新发生的数据,建立更能反映实际情况的模型。2针对ARIMA模型预测精度较弱以及不能解决非线性的问题,本文引入最小LS-SVM模型来预测巴州梅毒的流行趋势,结果表明LS-SVM模型预测效果比ARIMA模型高,说明利用LS-SVM模型来预测未来的趋势是可行的。本文对LS-SVM在传染病领域的尝试突破了传统预测方法的局限性,但是本文的工作还处于初步阶段,还需要进一步研究完善。3根据梅毒的传播机制和人群的性活跃程度,本文建立了传染病动力学模型,该模型能有效地揭示疾病发展的规律,寻找并定量分析影响疾病的关键因素,还能对梅毒进行中长期趋势。本文的动力学模型是在一些理想化的假设下建立的,研究的是确定性问题,对此,可以在其基础上加入随机因素,以获得预测更好的模型。此外,对于梅毒的季节周期性,可以考虑建立具有周期参数的传染病模型。这些都是需要我今后进一步考虑和研究的。40 新疆医科大学硕士学位论文致谢回首三年时光,有鲜花和掌声,也有失败和泪水,无不凝聚着老师、同学、朋友、家人的关怀和帮助,是他们的支持和鼓励帮助我克服困难、顺利完成学业。在此,我谨向所有指导、帮助、关心过我的人们表示我最真挚的谢意。首先,我要衷心的感谢我的导师王凯教授数年来对我的指导和关心。您严谨的治学态度、一丝不苟的治学作风、精益求精的敬业精神和诲人不倦的教学态度一直深深地感染并影响着我,令我受益匪浅。尽管工作繁忙,但您总是会在平时的学习和科研上给予我指导和关心,从论文的选题、开题、撰写到最终定稿,您亲自参与了每一个环节,并都给予了悉心的指导。您这三年来对我的教导将使我受用终生。其次,我要特别感谢疆医科大学医学工程技术学院张学良院长的大力支持,给我们提供优越的学习机会和学习环境。感谢数学教研室的各位老师:岳华、吴秀峰、王蕾老师等,感谢他们在工作、学习和生活中给与我的各种帮助。衷心感谢新疆医科大学公共卫生学院戴江红老师、曹明芹老师,姚雪梅老师,杨蕾老师,马金凤老师在学业上给予的帮助。再次,我要感谢唐丹丹、刘剡、娄鹏威、陈佳、李虎玲、冯丽、林丹丹、冯兴和王坤这些师兄妹在学习中给予的帮助,在我遇到难题时给我启发,感谢你们为我的论文写作创造了一个良好的学术氛围,与你们的友谊将是我人生中宝贵的财富。我还要感谢寝室的好姐妹陈佳、闫慈、王艳杰,感谢你们在生活上给我的关心和帮助,在我情绪低落时给我的鼓励。最后,我要特别感谢我父母,是你们默默的支持使我完成了学业,是你们无私的关爱使我勇敢的面对困难和挫折,你们对我的关心和鼓励是我在人生道路上前进的最大动力。愿你们健康幸福,也希望我的努力可以给你们带来欣慰。41 新疆医科大学硕士学位论文参考文献[1]张田生.西方梅毒史研究综述[J].中国社会历史评论,2013,14(1).[2]智涌.维纳斯的咒语—梅毒史话[J].科技文萃,1995(5).[3]WHOGuidelinesApprovedbytheGuidelinesReviewCommittee.WHOGuidelinesforthetreatmentoftreponomapallidum(syphilis)[S].Geneva:WorldHealthOrganization,2016.[4]HoEL,LukehartSA.Syphilis:usingmodernapproachestounderstandanolddisease[J].JournalofClinicalInvestigation,2011,121(12):4584.[5]TiwariAK.Evaluationofanewserologicaltestforsyphilisbasedonchemiluminescenceassayinatertiarycarehospital[J].AsianJournalofTransfusionScience,2015,9(1):65-69.[6]NoblettJ,RobertsE.Theimportanceofnotjumpingtoconclusions:syphilisasanorganiccauseofneurological,psychiatricandendocrinepresentations[J].BmjCaseReports,2015,2015(feb251).[7]MushayabasaS,BhunuCP.Modellingtheeffectsofheavyalcoholconsumptiononthetransmissiondynamicsofgonorrhea[J].NonlinearDynamics,2011,66(4):695-706.[8]龚向东,岳晓丽,滕菲,等.2000-2013年中国梅毒流行特征与趋势分析[J].中华皮肤科杂志,2014,47(5).[9]陈晶,董永慧,郅琦,等.2000-2009年新疆梅毒的流行特征和趋势[J].中华预防医学杂志,2010,44(12):1148-1150.[10]薛大奇.我国梅毒防治面临的挑战及对策[J].中国性科学,2012,21(1):15-16.[11]李玲,范书瑜,杨慧,等.2007~2011年新疆巴州法定传染病流行状况分析[J].疾病预防控制通报,2013(3):10-11.[12]马超,尔西丁·买买提.2012—2014年新疆巴州主要法定传染病流行特征分析[J].疾病预防控制通报,2015(6):11-14.[13]ZaidiAA,SchnellDJ,ReynoldsGH.Timeseriesanalysisofsyphilissurveillancedata[J].StatisticsinMedicine,1989,8(8):353–362.[14]牟瑾,谢旭,李媛,等.将ARIMA模型应用于深圳市1980~2007年重点法定传染病预测分析[J].预防医学论坛,2009(11):1051-1052.[15]徐娜,霍飞,刘长娜,等.ARIMA模型在梅毒预测中的应用[J].疾病监测,2011,26(2):103-105.42 新疆医科大学硕士学位论文[16]朱杰.基于最小二乘支持向量机的传染病预测与研究[D].苏州大学,2009.[17]俞璐.基于支持向量机回归的传染病预测系统建模[D].中国科学技术大学,2015.[18]GarnettGP,AralSO,HoyleDV,etal.Thenaturalhistoryofsyphilis.Implicationsforthetransmissiondynamicsandcontrolofinfection[J].SexuallyTransmittedDiseases,1997,24(4):185-200.[19]GarnettGP,BrunhamRC.Magicbulletsneedaccurateguns–syphiliseradication,elimination,andcontrol[J].Microbes&Infection,1999,1(5):395-404.[20]TorgersonPR,BurtisurnovKK,ShaikenovBS,etal.ModellingthetransmissiondynamicsofEchinococcusgranulosusinsheepandcattleinKazakhstan[J].VeterinaryParasitology,2003,114(2):143-153.[21]胡宇峰,孙振球,冯铁建.深圳市梅毒传播系统动力学模型[J].中国现代医学杂志,2010,20(8):1240-1242.[22]王燕.2008.应用时间序列分析[M].中国人民大学出版社.[23]ZhangX,TaoZ,JiaoP,etal.TimeseriesmodellingofsyphilisincidenceinChinafrom2005to2012[J].PlosOne,2016,11(2):e0149401.[24]王永斌,李向文,柴峰,等.ARIMA模型在我国梅毒发病率预测中的应用[J].现代预防医学,2015,42(3):385-388.[25]古文媚,李雪梅,古丽斯.ARIMA模型在梅毒发病预测中的应用[J].基层医学论坛,2015(5):692-694.[26]吴昊澄,徐旭卿,王臻.浙江省细菌性痢疾月发病率ARIMA模型建立及预测分析[J].浙江预防医学,2012,24(1):14-16.[27]易丹辉.时间序列分析方法与应用[M].北京:中国人民大学出版社,2011.[28]王伟明,周华云等.运用趋势季节模型分析江苏省疟疾流行规律[J].中国热带医学,2010,10(2):153-154.[29]FloydS,IacobsonV.Randomearlydetectionforcongestionavoidance[J].1993.[30]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42.[31]KimKJ.Financialtimeseriesforecastingusingsupportvectormachines[J].Neurocomputing,2003,55(1–2):307-319.[32]ller,KlausRobert,Smola,etal.Usingsupportvectormachinesfortimeseriesprediction[J].Chemometrics&IntelligentLaboratorySystems,2003,69(1–2):35-49.[33]GavrishchakaVV,GanguliSB.Volatilityforecastingfrommultiscaleandhigh-dimensionalmarketdata[J].Neurocomputing,2003,55(1–2):285-305.[34]AmariS,WuS.Improvingsupportvectormachineclassifiersbymodifyingkernel43 新疆医科大学硕士学位论文functions[J].NeuralNetworkstheOfficialJournaloftheInternationalNeuralNetworkSociety,1999,12(6):783-789.[35]SmitsGF,JordaanEM.ImprovedSVMregressionusingmixturesofkernels[C]//InternationalJointConferenceonNeuralNetworks.IEEEXplore,2002:2785-2790.[36]范永东.模型选择中的交叉验证方法综述[D].山西大学,2013.[37]冷北雪.基于支持向量机的电力系统短期负荷预测[D].西南交通大学,2010.[38]SylvainArlot,AlainCelisse.Asurveyofcross-validationproceduresformodelselection[J].StatisticsSurveys,2010,4(2010):40-79.[39]马知恩,周义仓,王稳地.传染病动力学的数学建模与研究[M].北京:科学出版社,2004:2.[40]DufourMC.Whatismoderatedrinking?[J].AlcoholResearch,1999,23(1):5-14.[41]FengZ,HuangW,Castillo-ChavezC.Globalbehaviorofamulti-groupSISepidemicmodelwithagestructure[J].JournalofDifferentialEquations,2015,218(2):292-324.[42]ZhangT,WangK,ZhangX.ModelingandAnalyzingtheTransmissionDynamicsofHBVEpidemicinXinjiang,China[J].PlosOne,2015,10(9):e0138765.[43]LouP,WangL,ZhangX,etal.ModellingseasonalbrucellosisepidemicsinBayingolinMongolAutonomousPrefectureofXinjiang,China,2010-2014[J].BiomedResearchInternational,2016,2016(1):5103718.[44]DelurgioSA.Forecastingprinciplesandapplications[M].RICHARDD.IRWIN,INC,1998.[45]JohnsonKM,AlarcónJ,WattsDM,etal.SexualnetworksofpregnantwomenwithandwithoutHIVinfection[J].Aids,2003,17(4):605-12.[46]汤后林,吕繁.性网络与HIV传播[J].中国艾滋病性病,2006,12(4):373-375.[47]PedroSA,TchuencheJM.HIV/AIDSdynamics:impactofeconomicclasseswithtransmissionfrompoorclinicalsettings[J].JournalofTheoreticalBiology,2010,267(4):471-485.[48]vandenDriesscheP,WatmoughJ.Reproductionnumbersandsub-thresholdendemicequilibriaforcompartmentalmodelsofdiseasetransmission[J].MathBiosci.2002,180(1–2):29-48.[49]ZhangT,WangK,ZhangX.ModelingandanalyzingthetransmissiondynamicsofHBVepidemicinXinjiang,China[J].PlosOne,2015,10(9):e0138765.[50]GarnettGP,AndersonRM.Contacttracingandtheestimationofsexualmixingpatterns:theepidemiologyofgonococcalinfections[J].SexuallyTransmittedDiseases,1993,20(4):181.44 新疆医科大学硕士学位论文[51]车惠淑,张春强,吐逊·阿义,等.新疆巴州2009-2013年吸毒人群哨点监测分析[J].中国保健营养旬刊,2014,24(4):2287-2288.[52]买合木提·木斯塔帕,张春强,古米来古力·比拉力.新疆巴州2011─2014年暗娼人群哨点监测分析[J].中国农村卫生,2015(14):39-39.[53]吴家兵,叶临湘,尤尔科.ARIMA模型在传染病发病率预测中的应用[J].数理医药学杂志,2007,20(1):90-92.[54]周宇.ARIMA模型在石油价格预测分析中的应用[J].北方经贸,2017(8):23-24.[55]于连敏.ARIMA模型在我国GDP预测中的应用[J].时代金融旬刊,2017(7).[56]陈文慧,刘庆,朱红梅,等.快速城市化进程中土地利用冲突时空演化特征与模拟预测─以长株潭城市群为例[J].江苏农业科学,2017,45(9):286-291.[57]马超.新疆巴音郭楞蒙古自治州主要法定传染病流行特征分析及流行趋势预测[D].新疆医科大学,2015.[58]孙敏.2011-2015年巴州人民医院法定报告性传播疾病流行病学分析[J].世界最新医学信息文摘(连续型电子期刊),2016,16(44):181-181.[59]买合木提·木斯塔帕,张春强,古米来古力·比拉力等.新疆巴州2011─2014年暗娼人群哨点监测分析[J].中国农村卫生,2015,(14):39-39.[60]陈伟,田一明,单新颖.基于改进蚁群算法优化的最小二乘支持向量机在语音识别中的应用[J].科技展望,2017,27(21).[61]刘红健,胡蓉.K近邻和最小二乘支持向量机相融合的人脸识别[J].激光杂志,2014(11):23-25.[62]张庙林,牛犇.基于粗糙集和最小二乘支持向量机的文本分类方法[J].信息记录材料,2017,18(5):99-102.[63]俞璐.基于支持向量机回归的传染病预测系统建模[D].中国科学技术大学,2015.[64]力琼.支持向量机回归在传染病预测中的应用研究[D].苏州大学,2010.45 新疆医科大学硕士学位论文综述梅毒流行状况的预测和控制研究进展罗冬梅综述王凯教授审校梅毒是由苍白密螺旋体苍白亚种(Treponemapallidumsubspeciespallidum,TP)俗称梅毒螺旋体引起的一种慢性、全身性性传播疾病(Sexuallytransmitteddisease,STD),呈世界性分布。本文从梅毒的流行病学调查、三种流行病学数学模型包括时间序列模型、最小二乘支持向量机模型和传染病动力学模型方面综述了近年来梅毒在预防和控制方面的研究成果。1引言梅毒是我国目前流行的主要性病之一,尽管存在着有效的防御措施,如安全套的有效使用和相对低廉的治疗方案,每年梅毒感染率还是很高。梅毒主要通过性接触传播,或母婴传播[1]。梅毒的感染源是人类,感染梅毒螺旋体后可表现为有症状的显性梅毒也可能呈现无症状状态。临床上可将梅毒分为一期、二期、潜伏期和三期梅毒,一期梅毒的典型表现是硬下疳,病变持续几个星期后可自行愈合,二期梅毒可能出现多种方式,包括皮疹、皮肤黏膜和淋巴结的病变。隐性梅毒涨幅逐年增大[2],由于隐性梅毒不表现临床症状,容易被忽略而延误病情,进而发展为晚期梅毒。此外,隐性梅毒患者近年来上升较快,由于不具有显著的临床特征,其潜在危害性应该引起重视。梅毒潜伏期为5-25年[3-5],传染性强,对社会危害性大,已成为严重的公共卫生问题。在青霉素发明之前,梅毒是一种无法治愈的致命疾病,至今,青霉素治疗梅毒已超过60年[6],但还没有切实有效的梅毒疫苗出现[7]。在性传播疾病中,梅毒虽然没有艾滋病的危险性强,但是其致死性却很高,事实上梅毒的流行在很大程度上也增加了HIV的传染,根据相关的研究结果表明梅毒患者感染HIV的危险性较较健康人增加2-5倍[8]。因此,控制梅毒流行的同时也能控制HIV的发生。梅毒不仅给自身的健康造成不可逆转的伤害,还给家庭带来沉重的经济负担,以及影响婴儿的生命质量。因此如何有效控制梅毒的流行,对全球的卫生部门来说仍是严峻的挑战。本文现就梅毒流行病学及在预防控制方面的研究进展综述如下。2梅毒流行病学调查研究梅毒在全世界流行,除艾滋病以外的性病在全球范围内占疾病的一个重要部分,每年有超过34亿的性传播感染的新发病例(主要是梅毒、淋病、衣原体滴虫病)[9],且大多数在15岁至49岁之间。在欧洲,2004年至2013年期间梅毒成上升趋势,有46 新疆医科大学硕士学位论文些国家的梅毒发病率还高于发展中国家。例如2011年德国发病率为4.5/10万,荷兰为3.81/10万;2012年英国为5.28/10万;2013年,丹麦梅毒发病率为5.0/10万,而俄罗斯高达28.86/10万,同年美国疾病控制与预防中心报告约有17375例一期梅毒和二期梅毒,比2012年增加了10%[10]。在我国,20世纪90年代末以来梅毒呈现明显快速上升趋势。1998年全国梅毒发病人数达到53768例,发病率4.31/10万,是1993年的25倍;2009年与2010年梅毒均居全国甲乙类传染病病种的第3位,2010梅毒病例数比2009年增长了16.43%[11]。2000-2013年间,梅毒高发地区在西北地区(新疆、青海、宁夏)、长江三角洲(浙江、上海)和闽江地区等,其发病率大都超过50/10万[12]。梅毒高发年龄在20-50之间,一般女性发病人数高于男性;农民、待业和不详为主为梅毒高发职业;患者主要以一期梅毒和隐性梅毒为主[13]。新疆是梅毒的高发区域,近年来梅毒报告数呈上升趋势,梅毒发病率远远高于全国发病水平[11]。根据中国统计年鉴报告2000-2004年新疆梅毒发病率变化幅度不大,2005-2012呈快速增长,到2014年新疆梅毒发病21159(93.45/10万)例[14]。梅毒疫情主要集中在新疆南部,其中巴州法定传染病发病报告顺位由2008年的第7位上升到2011年的第三位[15],发病数从2008年的509(40.58/10万)例上升到2014年的1012(75.59/10万)例[16],呈快速上升趋势。此外,乌鲁木齐的梅毒疫情较为严重,2013发病率为55.77/10万[14],石河子市,发病率由2005年的3.27/10万增加至2012年的63.29/10万[17],博乐市,发病率由2010年的36.13/10万增加至2015年的80.34/10万[18],均呈现流行态势。3传染病预测方法概述流行病学预测模型是基于传染病的流行进程、主要影响因素及因素间相互关系建立的,可用数学表达式定量描述疾病流行特征,数学模拟传染病的传播过程,揭示疾病影响因素的量的制约关系[19]。预测模型的建立可对未来的发展情况实现预测,同时为疾病的预防和控制手段的实施提供了有力的理论依据。流行病学预测模型已广泛应用于性传播疾病中,尤其是在艾滋病的研究上尤为突出。目前对于疾病的预测数学模型一直发挥着极其关键的作用,常用的有有时间序列分析法、传染病动力学模型和灰色预测等。3.1ARIMA模型的应用概况ARIMA是用于预测的一种统计方法模型,全称叫Box-Jenkins自回归移动平均模型[20]。具有随时间变化特征的原始数据所拥有的依存关系表现了研究对象随时间变化的延续性,用一定的数学公式近似描述这个序列,就可以从可用该序列的过去和现在来预测未来的情况。建模过程涉及三个阶段:模型识别、参数估计和模型诊断,这些过程的迭代对于找到最合适的模型是至关重要的。时间序列预测方法一般适用于短期预测分析,其中ARIMA模型是目前在国际上47 新疆医科大学硕士学位论文应用最为广泛的时间序列预测方法之一[21-22],该模型综合考察了序列的各种变化,并量化了模型参数,在传染病的预测中具有普遍的适用性。1989年,AAZaidi等利用监测的梅毒数据分别建立了男性和女性的一期、二期梅毒ARIMA模型,以及先天梅毒的ARIMA模型[23],分析了模型的季节性和趋势性。模型预测结果表明未来两年男性的发病率无明显增长,但是女性和低于一岁儿童的先天梅毒发病率有所增长。2003年,丁守銮等建立了ARIMA预测模型对1980-1997年山东省平邑县的肾综合征出血热进行了拟合[24],对模型白噪声检验后验证模型的有效性,用所建模型预测了未来1年的月发病率。2009年,牟瑾等对深圳市1980-2007年法定传染病的发病数进行建模[25],结果发现ARIMA模型对梅毒的发病趋势模拟效果较好,可以为传染病的预测提供理论依据。随后,Comeaux等认为梅毒病例的增加可能是由于经济压力和行为选择造成的,对此,作者建立了ARIMA、ARCH/GARCH模型[26],预测美国人群的患病分险。2013年,Chau-KuangChen等为了探讨美国梅毒发病率及其相关危险因素之间的关系,建立了的ARIMA模型和广义自回归条件异方差(GARCH)模型[27]。作者收集1957-2009年美国梅毒发病率,收集的危险因素包括美国人均收入、失业率、贫困率、接受不到九年教育的人口百分比和人均酒精消费量。研究结果表明贫困率、饮酒、失业率和滞后三年的梅毒感染率为主要危险因素,呈现了一个可视化的医疗趋势,为卫生专业人员和政策制定者提供科学的预防策路依据。3.2最小二乘支持向量机模型的应用概况支持向量机(SupportVectorMachine,SVM)是Cortes和Vapnik于20世纪90年代提出的基于统计学习理论的机器学习方法[28]。SVM尽量减少化泛化误差的上界实现了结构风险最小化原则,而不是采用经验风险最小化原则来最小化训练误差。SVM最开始主要是用来处理模式识别问题,随着Vapnik提出的损失函数的引入,SVM已经被扩展到解决非线性回归问题,把支持向量机针对分类问题中得到的结论推广到回归实函数中,提出了最小二乘支持向量机(LeastSquaresSupportVeotorMaohine,LS-SVM)方法。LS-SVM方法同样具有SVM的优点,可以解决小样本、维数灾难等问题,也具有优秀的泛化能力和非线性拟合的优势。LS-SVM的提出在理论上丰富了传染病预测模型的研究。在机器学习领域SVM方法已成为不可或缺的部分,国内外学者也对此作了大量的研究。1995年,Vapnik的提出的统计学习理论的本质[28],标志着统计学习理论已逐步走向成熟。之后的几年,一些学者在SVM的基础上提出了关于时间序列数据的最小二乘支持向量机[29-31]。2008年,李丽娟提出了基于LS-SVM的广义预测控制算法[32],得到一个预测精度较高的模型,为数学预测模型在精度控制上提供了坚实基础。2009年,朱杰将LS-SVM技术引入到传染病预测分析中来[33],探索了将LS-SVM技术应用到传染病预测上的效果,结果表明LS-SVM用于传染病的预测上是具有可行48 新疆医科大学硕士学位论文的,可以为梅毒的防治提供一些信息;2010年,美国梅哈里医学院的Chau-KuangChen收集1984-2007年美国50个地区的梅毒发病数据[34],利用SVM方法对梅毒的危险因素进行排序,最终收入中位数、失业率、贫困率、酒精消费量这几个因素进入模型,其中收入中位数排所有危险因素的首位。2012年,HYCai等先将ARIMA模型和LS-SVM模型用于传染病发生趋势进行预测,然后将预测结果输入到LS-SVM进行学习[35]。最后,得到组合模型的预测结果,模拟了乙型肝炎的发病率,结果表明组合模型可以降低乙型肝炎发病率的预测误差,使预测结果更加真实可靠。同年,朱红等提出了一种基于模糊粒化的SVM预测方法[36],先利用模糊粒化模型对时间序列的数据资料进行粒化,这能使原始数据减少的同时而不减少原始信息,再用SVM对疾病趋势进行预测。结果发现该方法学习性能良好,稳定性强,模型预测精度较高。2015年,俞璐将SVR引入到数学预测模型中[37],同时考虑到疾病具有季节变化的周期性,ARIMA模型在解决周期性问题具有一定的优势,作者有效的结合了ARIMA模型和SVM模型,建立了ARIMA-SVR模型。组合模型具备了两种模型各自的优点,不仅能分析到疾病的季节性影响,还能利用数据挖掘的思想提高模型预测的精度,具有很好的利用价值。3.3传染病动力学模型的应用概况近几年,对于传染病的研究中,建立动力学模型作为预测和控制的一种工具发挥着越来越重要的作用。传染病动力学是梅毒流行病学研究方法的延伸,根据疾病的传播机制,建立能够反映疾病流行特性的数学模型,探究各影响因素对模型结果的影响程度,从而提出有力的控制措施,为卫生部门制定实施疾病的防治提供理论基础和科学依据。与统计学方法和机器学习方法相比,动力学方法能根据疾病的传播机理来建立模型,能更清晰的反映疾病的流行过程,掌握疾病流行的全局性态,模型更贴近实际[38]。近30年来,愈来愈多的学者运用传染病动力学模型解决各种各样的传染病预测控制问题,取得不菲成果。梅毒的传播动力学模型最早由英国牛津大学动物系的GEOFFP.GARNETT教授于1997年提出[39]。作者根据梅毒螺旋体在的传播机制构建了梅毒的动力学模型,反映了梅毒的内在传播动力学。通过建立无治疗和有治疗这两种动力学模型,定量的给出实施治疗措施后发病率的下降,尤其对早期梅毒的有效治疗,不仅能抑制梅毒在人群间的传播,对公共卫生策略的制定有十分重要的指导意义。1999年,GEOFFP.GARNETT教授在文献[40]中提出“核心组”与性伙伴网络对梅毒传播的重要性,作者建议干预措施要足够灵活,以延伸到社会不同阶层,如性工作者、吸毒者与男性同性恋者,以及改善医院设施、改变教育方法、及时调整干预措施等。2002年,BABAKPOURBOHLOUL等又在此基础上提出关于控制梅毒的策略[41],文献将人群按年龄分为5个层,按性活跃不同分为3个层,按性别49 新疆医科大学硕士学位论文分为两个层,以此构建了一个梅毒性网络传播模型,展现了不同的组合方式之间对梅毒传染的影响大小,特别是在性活跃最强的组。除此之外,研究结果表明该年梅毒发病率的大幅上升与1年前大规模治疗措施有关,由此说明当人口流动性较高,以及干预措施无法实现全面覆盖时,大规模治疗可能不是一个控制梅毒传播的最佳策略。随后,对于梅毒动力学的研究变得越来越广泛深入。2010年,胡宇峰等建立了梅毒传播的系统动力学模型[42],主要考虑梅毒的核心传播人群,即女性性工作人群和多性伴人群,并且考虑了安全套使用、健康干预、筛查和人口经济学因素,以及其他防治政策和治疗等各个因素对疾病传播的影响,模型预测2011-2015年梅毒将稳步上升,提示相关工作人员应关注高危人群的分析研究。2013年,KateM.Mitchell进一步分析了筛查女性性工作者与干预措施对梅毒疫情的影响,作者对中国云南省女性性工作者与商业性伙伴之间梅毒传播情况构建数学模型[43],模型表明干预措施达到五年时,每年的梅毒筛查可使梅毒的患病明显下降,但是非商业性伙伴的影响将达到最大。鉴于之前建模研究表明大规模治疗后梅毒发病率会很快大幅反弹,作者提出快速筛查梅毒患病率,且对他们实施治疗后,反弹时间要得多。4结语综上所述,应用于传染病预测的数学模型有很多,但是每种模型的侧重点不同,各有优缺点,所以一种模型很难将一个传染病问题研究清楚。如梅毒传播动力学模型有些理想化,重要的参数基本再生数只能发病率间接估算,导致有些预测值与实际值有较大差别。但是,现有模型的不足也为以后的研究提供了新思路。所有的预测模型都是基于过往数据资料的变化趋势而延续到未来的发展,因此,疾病的相关因素若在未来会发生重大变化,按之前的数据趋势预测未来,结果可能会发生一些偏移。因此,在实际工作中需建立动态分析评价的策略,不断更新数据,修正已有的预测模型,得到更切合实际情况的预测与控制策略,经济实效地掌握梅毒发病趋势,从而采取相应的防控措施。50 新疆医科大学硕士学位论文参考文献[1]GonzálezV,FernándezG,DopicoE,etal.EvaluationoftheVitrosSyphilisTPAchemiluminescenceimmunoassayasafirst-linemethodforreversesyphilisscreening[J].JournalofClinicalMicrobiology,2015,53(4):1361-4.[2]蔡小丹,许敏鸿,许良杰,等.潜伏梅毒患者临床相关因素研究[J].中国热带医学,2006,6(9):1602-1603.[3]叶兴东,刘颖,戴向农,等.2000~2011年广州地区梅毒疫情报告结果分[C]//中华医学会第十九次全国皮肤性病学术年会.2013.[4]TiwariAK.Evaluationofanewserologicaltestforsyphilisbasedonchemiluminescenceassayinatertiarycarehospital[J].AsianJournalofTransfusionScience,2015,9(1):65-69.[5]NoblettJ,RobertsE.Theimportanceofnotjumpingtoconclusions:syphilisasanorganiccauseofneurological,psychiatricandendocrinepresentations[J].BmjCaseReports,2015,2015(feb251).[6]吴凹成,季必华.梅毒对替代治疗药物的耐药现状及机制(综述)[J].安徽卫生职业技术学院学报,2017,16(3):97-99.[7]姚玲(综述),曾铁兵(审校).梅毒疫苗的研究进展[J].微生物学免疫学进展,2013,41(1):65-69.[8]李璇,王辉.HIV/梅毒共感染国内外研究进展[J].中国艾滋病性病,2011(5):610-612.[9]MushayabasaS,BhunuCP.Modellingtheeffectsofheavyalcoholconsumptiononthetransmissiondynamicsofgonorrhea[J].NonlinearDynamics,2011,66(4):695-706.[10]DivisionofSTDpreventionCDC[R].SyphilisSurveillenceReportDec.2006[11]龚向东,岳晓丽,滕菲,等.2000-2013年中国梅毒流行特征与趋势分析[J].中华皮肤科杂志,2014,47(5).[12]张伟东,姚建义.1998-2007年中国梅毒流行病学特征分析[J].疾病监测,2009,4(11):830-831.[13]王惠榕,颜苹苹,林勋,等.福建省2004-2012年梅毒流行特征分析[J].海峡预防学杂志,2014,20(1):15-17.[14]陈晶,董永慧,郅琦,等.2000-2009年新疆梅毒的流行特征和趋势[J].中华预防医学杂志,2010,44(12):1148-1150.51 新疆医科大学硕士学位论文[15]李玲,范书瑜,杨慧,等.2007~2011年新疆巴州法定传染病流行状况分析[J].疾病预防控制通报,2013(3):10-11.[16]马超,尔西丁·买买提.2012—2014年新疆巴州主要法定传染病流行特征分析[J].疾病预防控制通报,2015(6):11-14.[17]张晔,张波,玛依莎,等.新疆石河子市2005-2012年梅毒流行病学分析[J].甘肃医药,2014,33(2):141-143.[18]马依拉,吴剑波,迪丽娜尔,等.2010-2015年新疆博乐市梅毒流行病学特征分析[J].公共卫生与预防医学,2017,28(1):116-117.[19]李丹.应用三种数学模型对传染病疫情进行预测和分布拟合[D].中国医科大学,2005.[20]Brockwell.时间序列的理论与方法[M].高等教育出版社,2001.[21]ZhangX,ZhangT,YongAA,LiX.ApplicationandComparisonsofFourTimeSEriesModelsinEpidemiologicalSurveillanceData.PLoSONE[J].2014,9(2):e88075.[22]NobreFF,MonteiroABS,TellesPR,WilliamsonGD.DynamiclinearmodelandSARIMA:acomparisonoftheirforecastingperformanceinepidemiology.SatMed[J].2001,20(20):3051-69.[23]ZaidiAA,SchnellDJ,ReynoldsGH.Timeseriesanalysisofsyphilissurveillancedata[J].StatisticsinMedicine,1989,8(8):353–362.[24]丁守銮,康家琦,王洁贞.ARIMA模型在发病率预测中的应用[J].中国医院统计,2003,10(1):23-26.[25]牟瑾,谢旭,李媛,等.将ARIMA模型应用于深圳市1980~2007年重点法定传染病预测分析[J].预防医学论坛,2009(11):1051-1052.[26]ComeauxC,ChenCK,Pierre-SaintA,etal.PredictingtheUnitedStatessyphilisratesinyears1957-2009basedonARIMA,ARCH,andGARCHtimeseriesmodels[C]//AphaMeetingandExposition.2011.[27]Chau-KuangChen,EdD.InvestigatingriskfactorsassociatedwithsyphilisrateintheUnitedStatesbasedonARIMAandARCH/GARCHtimeserisemodels[J].EuropeanInternationalJournalofScienceandTechnology,2013(11).[28]VapnikV.StatisticalLearningTheory[M].NewYork:JohnWiley&Sons,1998.[29]KimKJ.Financialtimeseriesforecastingusingsupportvectormachines[J].Neurocomputing,2003,55(1-2):307-319.[30]ThissenU,BrakelRV,WeijerAPD,etal.Usingsupportvectormachinesfortimeseriesprediction[J].Chemometrics&IntelligentLaboratorySystems,2003,69(1–2):35-49.52 新疆医科大学硕士学位论文[31]GavrishchakaVV,GanguliSB.Volatilityforecastingfrommultiscaleandhigh-dimensionalmarketdata[J].Neurocomputing,2003,55(1-2):285-305.[32]李丽娟.最小二乘支持向量机建模及预测控制算法研究[D].浙江大学信息科学与工程学院浙江大学,2008.[33]朱杰.基于最小二乘支持向量机的传染病预测与研究[D].苏州大学,2009.[34]ChenCK,AbdullahA.RankingImportantRiskFactorsWhichAffectUnitedStatesSyphilisRatesBasedonSupportVectorMachine[C]//AphaMeetingandExposition.2010.[35]CaiHY,Qing-HuiWU,Jing-QiaoLV.StudyonCombinationModelinPredictionofInfectiousDiseases[J].ComputerSimulation,2012,12(1):59-62.[36]朱红,郝杰,马金凤.基于模糊信息粒化的SVM在传染病预测中的应用研究[J].医学信息旬刊,2012,25(8):9-10.[37]俞璐.基于支持向量机回归的传染病预测系统建模[D].中国科学技术大学,2015.[38]OxmanGL,SmolkowskiK,NoellJ.Mathematicalmodelingofepidemicsyphilistransmission.Implicationsforsyphiliscontrolprograms[J].SexuallyTransmittedDiseases,1996,23(1):30-39.[39]GarnettGP,AralSO,HoyleDV,etal.Thenaturalhistoryofsyphilis.Implicationsforthetransmissiondynamicsandcontrolofinfection[J].SexuallyTransmittedDiseases,1997,24(4):185-200.[40]GarnettGP,BrunhamRC.Magicbulletsneedaccurateguns–syphiliseradication,elimination,andcontrol[J].Microbes&Infection,1999,1(5):395-404.[41]PourbohloulB,RekartML,BrunhamRC.Impactofmasstreatmentonsyphilistransmission:amathematicalmodelingapproach[J].SexuallyTransmittedDiseases,2003,30(30):297-305.[42]胡宇峰,孙振球,冯铁建.深圳市梅毒传播系统动力学模型[J].中国现代医学杂志,2010,20(8):1240-1242.[43]MitchellKM,CoxAP,MabeyD,etal.TheImpactofSyphilisScreeningamongFemaleSexWorkersinChina:AModellingStudy[J].PlosOne,2013,8(1):e55622.53 新疆医科大学硕士学位论文攻读硕士学位期间发表的学术论文[1]罗冬梅,王娜,吴秀峰,等.ARIMA模型在新疆巴州梅毒疫情预测中的应用[J].数学的实践与认识,2017,47(7):111-117.[2]罗冬梅,吴顺华,王凯.新疆巴州地区梅毒的动力学建模与仿真[J].中华地方病学杂志,2017,36(7):542-546.54 55

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭