动态工业过程的故障诊断方法研究

动态工业过程的故障诊断方法研究

ID:33503055

大小:7.42 MB

页数:80页

时间:2019-02-26

上传者:U-24835
动态工业过程的故障诊断方法研究_第1页
动态工业过程的故障诊断方法研究_第2页
动态工业过程的故障诊断方法研究_第3页
动态工业过程的故障诊断方法研究_第4页
动态工业过程的故障诊断方法研究_第5页
资源描述:

《动态工业过程的故障诊断方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

万方数据锌卷昙/J大’UDC密级学位论文动态工业过程的故障诊断方法研究作者姓名:指导教师:申请学位级别:学科专业名称:论文提交日期:学位授予日期:评阅人:王龙期|j谭树彬副教授东北大学信息科学与工程学院硕士学科类别:工学控制理论与控制工程2014年6月论文答辩日期:2014年6月2014年7月答辩委员会主席:李鸿儒杨卫国、段勇东北大学2014年6月 万方数据AThesisinControlTheoryandControlEngineeringResearchonFaultDiagnosisMethodofDynamicIndustrialProcessByWangLongnaSupervisor:AssociateProfessorTanShubinNortheasternUniversityJune2014 万方数据独创性声明本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢=亡二卮ko学位论文作者虢%荡呷日期:加1年.9易.7够学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。作者和导师同意网上交流的时间为作者获得学位后:半年口一年口一年半口学位论文作者签名:%庞嘲p导签字日期:矿肼、秒莎.>易。签.名 万方数据东北大学硕士学位论文摘要动态工业过程的故障诊断方法研究摘要由于工业过程复杂的内部机制、各种过程干扰和随机噪声的存在、惯性环节和储能环节的存在、闭环控制器的广泛应用、以及采样间隔较短等原因,使得过程变量的采样数据往往具有与时间相关的动态性。对复杂的工业过程很难建立精确的过程模型及故障模型,故本文研究是基于数据驱动的动态故障诊断方法,属于多变量统计过程控锘IJ(MSPC)领域。MSPC方法是先对历史数据进行离线建模分析然后对在线数据进行实时监控的故障诊断方法,能够切实有效的评估工业过程的运行状态并进行故障检测。本文的主要研究工作包括:(1)详细总结了工业过程数据动态性产生的原因和影响;简单介绍了故障诊断的过程和方法的分类;主要从基于MSPC方法方面阐述了动态数据故障诊断方法的研究现状,并总结了故障诊断方法针对数据动态性改进的几个主要方面。(2)主要介绍了动态主元分析(DPCA)禾II动态独立元分析(DICA)两种应用较广的非质量动态故障诊断方法。首先,介绍了基于DPCA的故障诊断;然后,针对DPCA不能很好地处理实际工业过程数据的非高斯性,对DICA方法及应用于故障诊断的过程进行了详细研究;最后,利用田纳西.伊斯曼过程(TE)的典型故障证明了,DICA在检测DPCA难以检测的小故障方面的优越性。(3)提出了子空间辨识和动态独立元分析(SI—DICA)相结合的故障诊断方法。首先,理论证明DICA方法潜隐变量的相关性,并仿真验证了DICA故障诊断方法由于人为引入的动态性会造成连续误警的现象;然后,详细介绍了典型变量分析(CVA)这一子空间辨识方法;最后,提出了子空间辨识和动态独立元分析相结合的SI—DICA方法,并通过实验验证了本方法避免了连续误警现象的产生,同时降低了误警率,进一步提高了故障检测率,减小了故障延迟。(4)对本文提出方法存在的问题和改进方面进行了设想,对故障诊断方法未来可能的发展趋势进行了总结。关键词:故障诊断;动态ICA;子空间辨识;典型变量分析 万方数据ResearchonFaultDiagnosisMethodofDynamicIndustrialPnUstriarocessAbstractThecommonprocessdataaredynamicinnature,whichcanbecausedbythecomplicatedprocessmechanism,randomerrorsandprocessdisturbances,theexistenceofinertiallinkandenergystoragelink,theextensiveadoptionoffeed.backcontrolandtherequirementofreal—timesampling,era1.However,itisdifficulttobuildaprocessmodelfordisturbancedetection.So,thestudiesondynamicfaultdiagnosismethodsinthisthesisismultivariatestatisticalprocesscontrol(MSPC)fieldmainlybasedondatadrivenmethod.MSPCmethodisakindoffaultdiagnosismethodincludingoff-linemodelinganalysisofhistoricaldataandtheonlinemonitoringofreal-timedata,andcaneffectiveevaluatetherunningstateofindustrialprocessandfaultdetection.Inthisthesis,themaincontentsareasfollows:(1)SummarizethecausesandeffectsofIndustrialprocessdatadynamicindetail;simpleintroducetheprocessoffaultdiagnosisandclassificationofdisturbancediagnosismethods;describethestudystatusofthefaultdiagnosismethodsondynamicdataandsummarizetheseveralaspectsofdynamicdatafaultdiagnosismethodsimprovement.(2)Mainlyintroducedynamicprincipalcomponentanalysis(DPCA)anddynamicindependentcomponentanalysismethod(DICA),theun—qualityprocessmonitoringmethodswhicharewidelyused.Firstly,introducethedisturbancedetectionmethodbasedonDPCA;secondly,becausetheDPCAcannotdealthedatawithnon—gaussiandistribution,introducetheDICAfaultdetectionmethodindetail;atlast,statethatDICAhastheadvantageindetectingsmallfaultwhichishardtodetectforDPCAthroughtheTEsimulation.(3)Proposesadynamicfaultdiagnosismethod,thecombinationofsubspaceidentificationanddynamicindependentcomponentanalysis(SI-DICA).Firstly,provethecorrelationoflatentvariablesoftheDICAintheoryandthesimulationprovingthattheartificialdynamiccharacteristicswillcausethephenomenonofcontinuousfalsealarm;..III.. 万方数据东北大学硕士学位论文Abstractsecondly,introducethesubspaceidentificationmethods,canonicalvariableanalysis(CVA);atlast,proposestheSI—DICAdynamicfaultdiagnosismethod,thecombinationofsubspaceidentificationanddynamicindependentcomponentanalysis,andthroughsimulationresearch,theeffectivenessofthemethod,avoidingthephenomenonoffalsealarmcontinuously,reducingthefalsealarmrate,furtherimprovingthefaultdetectionrateandreducethedetectiondelayatthesametimeisproved.(4)Makeanimaginationontheimprovementinfaultdiagnosismethodproposedinthisthesis,andsummarizethepossiblefuturedevelopmenttrendonthefaultdiagnosismethodinthefutureKeywords:faultdiagnosis;dynamicICA;subspaceidentification;canonicalvariableanalysis..IV.. 万方数据目录独创性声明⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯I摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯IIAbstract.⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯..III第1章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11.1引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2故障诊断的基本问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2.1故障诊断的过程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯~11.2.2故障诊断的性能评价指标⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一21.3动态工业过程故障诊断的基本问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.31.3.1数据的动态性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..41.3.2动态工业过程故障诊断方法的发展⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一51.4本文的主要工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.61.5本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.7第2章基于DPCA和DICA的故障诊断方法⋯⋯⋯⋯⋯⋯⋯⋯⋯一92.1基于DPCA的故障诊断方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.1.1DPCA的算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.1.2基于DPCA的故障诊断⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯122.2基于DICA的故障诊断方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯132.2.1DICA的基本原理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..132.2.2DICA的算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..172.2.3基于DICA的故障诊断⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯212.3DICA和DPCA方法的比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯222.4本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯23第3章基于SI—DICA的故障诊断方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯25.V. 万方数据东北大学硕士学位论文目录3.1动态性判别及影响分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯253.2子空间辨识⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯323.2.1状态空间模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯323.2.2典型变量分析方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯343.3基于SI.DICA的故障诊断方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..403.3.1SI.DICA的算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.403.3.2基于SI.DICA的故障诊断⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯413.4本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯42第4章仿真结果及分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.454.1多元动态过程的仿真结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯454.2田纳西-伊斯曼过程(TE)的故障诊断仿真结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一474.2.1田纳西一伊斯曼过程(TE)实例介绍⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯484.2.2基于DPCA和DICA的故障诊断仿真结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯524.2.3基于SI.DICA的故障诊断仿真结果分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯564.3本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯62第5章总结与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.635.1总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯635.2展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯64参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.65致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.71.VI— 万方数据东北大学硕士学位论文第1章绪论1.1引言第1章绪论随着现代化工业的不断发展,自动化水平的不断提高,工业生产正朝着大型化、高速化、连续化和自动化的方向发展。工业生产过程,如钢铁冶金、石油炼制、化工、电力、热能等行业,它们的生产环境恶劣通常处于高温、高压或低温真空等[1】,生产过程中同时包含复杂的物理化学等过程,同时各种突变干扰和不确定因素的存在,使得工业过程往往非常复杂。如果疏于检测或者操作不当,一个微小的故障都有可能经过传播和放大而导致生产无法;iron进行甚至整个系统的瘫痪。工业过程中故障的发生不仅会影响产品质量、增加设备维修费用、增加生产成本;严重时,甚至会发生火灾、爆炸等灾难性事件,在给社会生产带来巨大经济损失的同时,也严重威胁到了人们的生命安全,甚至对环境也产生了一定的污梨20】。为了切实保障复杂工业生产过程的可靠性、有效性和安全性,迫切需要建立一个监控系统来监督整个工业过程控制系统的运行状态,能够实时检测系统的变化,以防止重大事故的发生【2】。因此,故障检测与诊断技术受到了人们越来越多的关注,成为了国际自动控制界的热点研究方向之一。故障检测与诊断的任务就是寻找有效的方法发现工业过程中的异常,寻找根源,进而指导工作人员排除可能故障,保证工业过程的正常运行。故障诊断的研究和应用已经取得了显著的经济与社会效益【4J。下面从故障诊断的基本问题和动态工业过程的故障诊断方法研究两方面分别进行介绍。1.2故障诊断的基本问题故障检测与诊断的目的就是识别不正常状态,保证工业过程按照计划顺利运行。有效地故障诊断通过不断地对过程进行定量或定性分析,在发现异常时能够及时报警,帮助现场工作人员调整操作,消除异常,防止灾难性事故的发生。下面对故障诊断的基本过程及对故障诊断方法的性能评价指标两方面分别进行介绍。1.2.1故障诊断的过程故障诊断方法主要分为信号采集与处理、模型建立与故障检测、故障识别及诊断、故障隔离与过程恢复四大步【1-3,5】。其中模型建立与故障检测、故障识别与诊断是故障诊断方法的核心。下面分别对其进行介绍。 万方数据东北大学硕士学位论文第1章绪论(1)信号采集与处理信号采集与处理的基本任务是获取有用的信息。先进检测技术及智能仪表等的应用,使得大量的过程数据被采集。但是由于各种测量噪声、及传感器发生故障或者通讯网络发生问题等原因,导致采集的数据往往具有缺失、均值偏移等不可靠现象的出现。并且通常采集过程数据的维数很大,所以对数据进行适当的预处理对故障诊断的效果起到了重要作用。(2)模型建立与故障检测对设备进行状态监测的目的就是运用诸如基于过程知识、历史数据或者机理模型的方法建立合适的监控模型,将实时采集数据所计算的特征参数与规定参数进行比较、分析,实现对系统运行状态的实时监控,确定是否运行在正常工况下,故障是否发生。(3)故障识别及诊断故障识别及诊断是辨识出与当前可能故障最相关的过程变量,可以指导现场操作人员的故障排查范围。通过进一步对不同故障进行区分,确定当前故障的性质、类别、部位和原因等,为消除故障做好准备。(4)故障隔离与过程恢复为防止故障的放大给生产造成更大的损失,尽快使过程恢复正常,首先对故障子系统进行隔离,然后判断设备状态的运行状态,决定应该采取的对策和补救措施,对过程进行恢复。较典型的故障处理方法有顺应处理、故障修复与容错处理三大类。1.2.2故障诊断的性能评价指标故障系统的性能评价【4,6】不仅可以对不同的故障诊断方法做出比较,而且还能指导设计过程,帮助设计出性能更好的故障诊断系统。评价一个故障诊断方法的指标主要有:早期故障检测的敏感性、故障检测的误报率和漏报率、故障检测与诊断的及时性、故障检测与诊断的鲁棒性、故障识别分离能力、故障辨识的准确性、新故障和多/组合故障诊断能力,还有故障诊断的自适应能力【4】。下面对评价故障诊断方法的四个主要指标,鲁棒性、灵敏性、快速性和识别能力【6】进行介绍。(1)故障诊断方法的鲁棒性鲁棒性是指利用故障诊断方法建立模型对训练数据的独立性,利用误警率来表示。误警率是统计学中假设检验犯第一类错误的概率,即假设风为真,而拒绝风判断的概率。误警率即指利用正常工况下的数据建模,然后通过正常工况下测试数据的故障检测率来表示。误警率越小,鲁棒性越好。在实际工业过程中,鲁棒性是一个很重要的考虑方面,但是在很多故障诊断方法的研究和应用文章中经常被忽略。在TE过程.2. 万方数据东北大学硕士学位论文第1章绪论中,误警率即指正常工况下测试数据的故障检测率来表示。(2)故障诊断方法的灵敏性灵敏性是指故障诊断方法对工业过程可能故障的敏感性,利用故障检测率或者漏报率来表示。故障检测率越大,漏报率越小,灵敏性越高。灵敏性越好,是指当过程发生微小变化时,故障诊断方法就能够检测出故障的可能性越大,从而避免大事故的发生。故障检测率即为利用故障诊断方法检测出来的采样点数与实际发生故障的采样点数之比。漏检率即为一与故障检测率之差。(3)故障诊断方法的快速性快速性是指故障诊断方法检测到工业过程故障的起始点,通常利用故障延迟来表示。故障延迟越小,故障诊断方法的快速性越好。快速性越好,表示能够越早检测出过程可能存在的故障,及时的做出调整。故障延迟即为检测出故障的起始采样点与实际引入故障的采样点之差。(4)故障诊断方法的识别能力识别能力是指故障诊断方法对与当前故障的最相关过程变量的识别。故障识别是诊断方法的一个重要指标,故障诊断方法快速、正确、有效地识别能够给予操作人员快速的指导,进而为故障源的寻找和排除提供了条件。故障识别的方法有:贡献图、故障重构预测误差(FRSPE)、距离和角度矩阵等,其中贡献图应用最广。因为故障诊断方法的误警是不可避免的,所以检测出来的异常采样点表明工业过程可能存在故障,也可能是误警。为了降低误警率,我们利用Evan[6]在2000年提出的窗口概念来计算故障诊断方法检测出故障的起始点。窗口的定义:即利用故障诊断方法检测出超过窗口宽度的连续几个采样点都检测出异常时,才认为是有故障发生。假设诊断方法的误警率为口,窗口宽度为n,则相应的实际误警率将减小到口”。并将故障的起始点定义为连续n个采样点检测出故障的时的起始采样点。1.3动态工业过程故障诊断的基本问题故障诊断技术是一门涉及信号采集与处理、统计学、自动控制原理、计算机科学、人工智能等学科的综合性技术‘21。故障诊断方法主要分为三大类【3l:基于解析模型的方法,基于定性/知识的方法和基于数据驱动的方法。随着集散控制系统(Des)、智能仪表及现场总线技术在工业过程中的广泛应用,工业过程中大量的数据被采集;另一方面,计算机、数据库技术的快速发展,廉价的计算资源和可靠地存储技术也为存储和分析大规模数据提供了物质基础。但是这些包含过程运行状态信息的数据确并没有被有效的利用,以至出现了所谓“数据丰富,信息缺乏”的现象【5】。在这样的背景下,一3一 万方数据东北大学硕士学位论文第1章绪论利用过程数据建立监控模型的一类基于数据驱动的故障诊断方法自上世纪90年代开始兴起,受到越来越多的关注,并成为了故障检测与诊断技术领域中的一个研究热点。1.3.1数据的动态性由于实际工业过程中不确定因素多,过程复杂,过程干扰的存在,以及数据测量和存储过程中受到测量噪声等外部环境的影响,所以采集到的工业过程数据往往会具有时变性、共线性、多尺度性、非线性、以及动态性等特点【5,丌,同时过程操作和噪声的存在还会引起数据的非正态。本文主要是针对数据动态性进行故障诊断方法研究。本文所研究的“动态”,其含义不同于传统意义上过程均值、方差的变动或者工业过程所要求动态轨迹的那种情形,而是在训练和测量数据均来源于均值和方差都不发生变化的平稳过程。而且过程数据本身并不严格满足正态分布这一特性也在本文考虑之内。工业过程数据的动态特性是指过程变量的采样数据与时间相关的特性。主要表现在实际工业过程中的采样过程变量与时间相关的自相关性(Auto.correlation)和变量之间的互相关性(Cross—correlation)。这种时间相关性主要由以下几个方面所引起。(1)工业过程的内在机制【8】:工业过程中各种反应、检测、输送等设备,存在着一定的能量平衡、物料平衡等,各个操作单元内的观测变量往往相互关联。(2)工业过程采用的控制策略【9】:复杂的工业过程一般都运行在各种闭环控制系统下,并且往往复杂的工业过程包含很多小的反馈控制系统,而闭环内的变量具有时间上的自相关和变量间的互相关。(3)·工业过程中各种储能环节【4J:储能环节的存在使得在较高采样速率下采集的数据具有明显的动态特性。(4)测量噪声和过程干扰【lo】:测量噪声和过程干扰使得测量变量具有强自相关性。(5)采样频率【4】:采样频率越大,采样间隔越短,其变量在时间上的相关性越大。虽然减小采样频率可以在一定程度上减弱数据的动态性,但是不能满足实时监控的要求。为了更好的监测工业过程中各变量的变化和设备的工作状态,往往采样速率较高,采样间隔短,有的甚至达到了毫秒级,增加了变量在时间上的相关性。在多变量的情况下,若不考虑数据动态性将难以准确描述数据的真实变动,揭示数据变量之间的真正关系。当数据存在较强的动态特性时,使用基本的多元统计方法进行监控,会造成漏报或误报的问题,导致实际监控的误警率会偏离建模时设定的理论值,尤其是在小规模的扰动存在的情况下造成较高的误警率,出现连续误警现象。.4. 万方数据东北大学硕士学位论文第1章绪论1.3.2动态工业过程故障诊断方法的发展基于数据驱动的故障诊断方法主要有以下几类【l】:(1)统计过程控制(SPC):单变量统计监控和多变量统计监控;(2)机器学习类:主要包括神经网路、支持向量基等机器学习方法;(3)信息融合类:主要有数据层融合、特征层融合和决策层融合三个层次;(4)信号处理:主要有小波变换和谱分析;(5)粗糙集方法。其中多元统计过程控制方法(MSPC)方法应用广泛,故本文研究的动态工业过程的故障诊断方法是基于数据驱动的方法,属于多变量统计过程控带IJ(MSPC)领域。多元统计过程控锘lJ(MultivariateStatisticalProcessControl,MSPC)的基本思想是:利用历史数据进行训练,按照一定的方式将高维过程变量投影到表征主要过程状态的低维空间进行分析,构造监控统计量。主要包括主元分析方法【11'12l(PrincipalComponentAnalysis,PCA)、独立成分分析方法[5,13-14](IndependentComponentAnalysis,ICA)、偏最小二乘方法(PartialLeastsSquares,PLS)、Fisher[”】判据分析方法(FisherDiscriminantAnalysis,FDA)等。传统的MSPC方法中,需要满足数据独立或者不相关的前提条件,是静态方法;当过程变量存在动态特性时,使用原来的静态方法将会造成很大的误差。因此,一些研究学者提出将动态系统的描述方法引入到传统的MSPC方法中,主要包括时间序列分析‘16。191、状态空间模型、神经网络和时频变换(傅立叶变换和小波变换)等,实现对故障诊断方法的动态改进。动态工业过程故障诊断方法的发展概括如下。Ku[20】等人最先在1995年提出将时间序列AR模型引入到静态PCA中,提出了动态主元分析(DPCA)方法,该方法得到了广泛的关注和应用【21,22】。基于相同的思想Lee[23】等人在03年提出了偏最小二乘方法(PLS)的动态改进DPLS,浙大博士【24J在13年提出了基于DPLS的预测器控制的设计。Lee[25】等人在03年提出了独立元分析的动态改进算法(DICA)故障诊断方法,后来台湾的Hsu[26】等人利用控制图的修正对DICA进一步改进,提出利用新的AO统计量进行过程监控。Kruger[27]等人在04年进一步提出了ARMA模型与PCA的结合的ARMA—PCA方法,利用ARMA滤波器对PCA得到的潜隐变量进行去自相关。时间序列分析对MSPC方法的动态改进在一定程度上提高了故障诊断的效果。后来,子空间辨识(sI)概念的提出并开始应用到多元统计过程监控领域【28,2们,其中子空间辨识方法中典型变量分析方法(CVA)应用于动态数据的故障诊断显示出在处理动态数据上的有效性和优越性‘303i,32]。基于子空间辨识思想,浙江大学谢磊【33】在其博士论文中提出了SI.PCA,能够同时处理PCA潜隐变量的自相关和互相关,相比于DPCA和ARMA.PCA,其在提高故障灵敏性和快速性的情况下,降低了一5. 万方数据东北大学硕士学位论文第1章绪论误警率,并且避免了连续误警。在1O年Odiowei[34】等人提出了典型变量分析方法和独立元分析方法的结合,利用CVA代替PCA对数据实现白化处理。小波概念的引入,提出了DPCA和小波相结合[35】的方法,小波分析主要实现了对原始数据的消噪处理。东北大学石怀测36J在12年对DPCA进行了改进,针对DPCA方法主元个数较多和计算效率低的问题,提出了HDPCA。后来Chen等人提出了动态神经元与PCA的结合,利用动态神经元网络消除过程的动态特性,再对满足独立分布的残差采用PCA进行性能监视,相比其他PCA改进方法,能够处理具有非线性动态的数据。近年来,同时考虑数据的某几个特性的故障诊断方法成为了研究热点,处理动态性和非线性的KDICA[37J和KDPCA等方法的提出。综上所述,对动态数据的故障方法改进ls】主要有以下几个方面:(1)控制图修正;(2)动态系统建模;(3)时频变换。1.4本文的主要工作本文在研究基于数据驱动的动态故障诊断方法出发,针对工业过程采集数据的动态性,首先,介绍了应用广泛的动态主元分析(DynamicPrincipalComponentAnalysis,DPCA);然后,针对DPCA需要变量满足同正态分布的条件,不能很好地处理事实上存在非高斯特性的数据的特点,详细介绍了动态独立元分析(DynamicIndependentComponentAnalysis,DICA)方法;虽然DICA能够很好的处理动态非高斯数据,但是浙江大学博士刘育吲8】在其博士论文中曾指出DICA算法会人为地引入动态性,使得到的潜隐变量仍然具有一定的动态性,从而造成较高的误警率,并且会出现连续误警的现象;最后,本文提出了子空间辨识(SubspaceIdetification,SI)方法和动态独立元分析方法相结合的基于子空间辨识的动态独立元分析(SI.DICA)的故障诊断方法。具体章节内容安排如下:第1章给出了故障诊断的一些基本问题,包括故障诊断的过程及评价指标,和工业过程采集数据动态性的原因以及针对数据动态性的基于数据驱动的故障诊断方法的发展过程和基本思想。第2章主要从方法的理论和工业过程进行性能监控的应用两方面介绍两种基本的基于动态数据的故障诊断方法:动态主元分析方法(DPCA)和动态独立元分析方法(DICA),在异同点上对两种故障诊断方法进行了比较;并指出在处理动态数据时,考虑到变量的非高斯性,DICA方法较DPCA故障诊断方法的优越性。第3章深入研究DICA故障诊断方法存在的问题即得到潜隐变量仍然具有动态性及对性能监控的影响:详细介绍了能够同时有效地表示变量自相关和互相关性的状态一6. 万方数据东北大学硕士学位论文第1章绪论空间建模方法,子空间辨识方法中的典型变量分析方法(CanonicalVariateanalysis.CVA);提出了DICA的改进故障诊断方法,基于子空间辨识的动态独立元分析(SI—DICA)的故障诊断方法。该方法引入了子空间辨识的基本思想,即对DICA得到的潜隐变量利用典型变量分析(CVA)方法建立状态空间模型,从而进一步提高了动态工业过程故障诊断的灵敏性和快速性,并减小了连续误警。第4章主要从两个动态过程简单的多元过程和实际的田纳西.伊斯曼(TE)过程为例分别对动态故障诊断方法进行了仿真结果分析和比较。首先利用简单的多元动态过程验证DPCA和DICA两种方法具有较高的误警率,可能造成连续误警,并且本文提出的SI.DPCA则可以避免连续误警现象的发生。然后,利用TE过程己知故障的仿真验证DICA在检Nd,故障方面比DPCA的有效性,以及两种方法会造成连续误警的缺点;通过对DICA、CVA和SI—DICA方法的对比仿真研究,验证了本文提出的改进故障诊断方法SI—DICA在降低误警率,避免连续误警现象出现的同时,提高了故障诊断灵敏性和快速性。第5章为结论和展望。对本文的研究内容进行了系统的总结和概括,并对下一步深入研究的方向和内容进行了讨论和展望。1.5本章小结本章主要讲述了三个内容:(1)故障诊断的背景和意义。在复杂的工业过程中,发生故障不仅会造成严重的经济损失,还有可能引起灾难性的事件,严重威胁生命安全,污染环境。故障检测和诊断在此背景下提出。合适的故障检测和诊断方法能够实时有效的监控工业过程的运行状态,减少重大事件的发生,有着巨大的经济和社会效益。(2)故障诊断的过程和评价指标。故障诊断过程中故障检测和识别是核心环节,能够有效地指导工作人员寻找过程的故障源,排除可能故障。并对故障诊断方法的几个重要评价指标:鲁棒性、快速性、灵敏性和故障识别能力做了详细介绍。(3)过程采样数据动态性的原因和基于数据的动态故障诊断方法的发展过程。故障诊断方法中基于数据驱动的方法研究和应用越来越多,但是由于工业过程内部的反应机理、反应过程等、过程干扰以及采样过程中测量噪声等原因,采样数据变现出强动态性,传统的MSPC方法不能有效的监控动态过程。主要介绍了基于数据的故障诊断方法在动态性上的改进。一7一 万方数据东北大学硕士学位论文第1章绪论.8一 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法在动态工业过程中,当前时刻的过程变量值与过去时刻的数据是相关的,也就是说工业过程中采集的变量数据之间是存在自相关和互相关性的。传统的MSPC方法是静态方法,需要满足数据独立或者不相关的前提条件;当过程变量存在动态特性时,使用原来的静态方法将会造成很大的误差。针对过程变量的动态性,Ku[20l于1995年提出了主元分析方法在动态特性上的改进方法,动态主元分析方法。但是DPCA需要变量满足同正态分布的条件,不能很好地处理事实上存在非高斯特性的数据,所以本文对Leea[251在2004年基于相同的思想提出的动态独立元分析方法进行了深入研究。下面对上述两种动态改进方法分别进行介绍。2.1基于DPCA的故障诊断方法2.1.1DPCA的算法动态主元分析【20,211方法的基本思想是:按照时间序列分析的AR(白回归:AutoRegressive)模型的形式对数据进行重新排列,用以表示不同采样时刻数据间的动态关系,具体过程为将前d个时刻的采样数据扩展到当前时刻的采样数据构造增广矩阵为新的数据矩阵。故动态主元分析方法主要包括三步:(1)构建滞后时间常数为d的增广矩阵x+∈R‘Ⅳ。协删“’;(2)对增广矩阵建立主元分析模型;(3)利用得分变量计算统计量。下面分别对其进行介绍。(1)构造增广矩阵假设x∈R”为已经标准化处理的由m个过程分量构成的数据(均值为0,方差为单位阵)。过程变量x的采样样本组成的数据阵为:X=【x(1)x(2)⋯x(Ⅳ)】7∈R肌”(2.1)式中,x(尼)(尼=1,2,⋯,N)为k时刻的采样数据;N为样本数目。对过程变量x利用前d个时刻的采样数据进行扩展:x‘=『《‘⋯岛]2(2.2)式中,ti为对应x的采样平移f时刻后的变量。由扩展的过程变量X+的采样样本组成的数据阵为:X4=[x+(1)x‘(2)⋯x+(Ⅳ一d)]7(2.3)=[xo丝。⋯置d】一9一 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法L三【£掌蠹£._i∽+N卅-Ⅺd1)x(i+Nr仁Q=【《f+1)z(i+2)⋯】。故,扩展矩阵X+∈R(Ⅳ一d)。”(州’为:X+=xT(1)XT(2)⋯XT(d+1)xr(2)x,(3)⋯xr(d+2);’.;,(Ⅳ一d)xV(N—d+1)⋯xr(Ⅳ)(2.5)(2)对增广矩阵建立主元分析模型主元分析算法[38,391是最基本的多元统计过程控制算法。PCA的基本思想是:利用过程变量的共线性对由原始过程变量所张成的高维空间进行降维。PCA的前提条件是:观测变量满足独立同分布;潜隐变量服从高斯分布。对上述建立的增广矩阵x+建立PCA模型:X’:X’ppr+X’p≯:矿+E(2.6)式中,T∈R(Ⅳ一)”为主得分矩阵;P∈R”(“1)”为主负荷矩阵;户∈R“(n1)。(”(n1)⋯’为残差负荷矩阵;r五>⋯>九m。1);U为特征列向量卯i组成的负荷矩阵;其中鸦为负荷向量,是对应特征值丑的特征列向量。2、l降阶求取主元个数负荷矩阵所构成的空间中与较大特征值对应的负荷向量部分描述了过程中系统内部的主要变化,与较小特征值对应的空间部分描述了随机噪声所引起过程的变化。所以,可以通过适当的选择主负荷变量的数目厂,将系统变化映射到两个子空间(主得分空间和剩余空间)中分别进行监控。利用下式计算主负荷变量的个数:.10. 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法∑五CPV(r)=者x100%>CL∑以i=1(2.8)式中,r是选择主负荷变量的数据;CP矿(r)是指前r个特征值的和占特征值的总和的比例;CL是指比例阈值的设定值。3)计算主得分变量取u负荷矩阵的前r个特征值对应的负荷向量组成主负荷矩阵P,剩余m(cl+1)一,.个负荷向量构成残差负荷矩阵户。即:P=U(:,l:,.);屉U(:,r+l:聊(d+1))(2.9)将k时刻采样值的扩展变量∥(尼)映射到低维的主得分空间:t(k)=Ux’(尼)(2.10)式中,t(k)∈R’即是k时刻的得分向量。(3)计算统计量及其控制限将得分向量的方差单位化,即得分向量除以相应特征值的平方根。因此k时刻的主得分向量y(k)为:y(七)=A,2t(k)=人,2P7’X+(尼)(2.11)式中,人,为由前r个主特征值组成的对角阵;由于经过上述变换后主得分变量的协方差为单位阵,故k时刻的,2统计量计算如下:丁2‘庀’三x。。尼;#三支:;擞+。尼,c2.,2,=x+r尼)。卧二1P1≯(尼)、。即:丁2统计量定义为得分向量的平方和,反映的是过程数据的主要变化。由式(2.11)的逆运算可以得到利用主得分向量y(k)重新构造的过程变量1c*(尼):曼+(七)=PA;y(k)(2.13)Q统计量反映的是采样值映射到PCA模型的修正值,与测量噪声直接相关。k时刻的Q统计量定义为采样值与估计值的残差平方和,即:烈Dy@X!焉馁p。/;器X∥亿㈣=+(尼)1(,一)+(尼)。综上所述,丁2和Q为DPCA方法的两个监控统计量。丁2和Q统计量的控制限表示工业过程正常运行情况下的临界点,当k时刻的统计 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法量值T2(后)和Q(后)的值超过相应控制限磋。或者‰。时,表明有故障发生。丁2和Q统计量的控制限【24,26J利用近似分布的方法求取。其中,r2统计量[1l】的控制限可以通过近似为如下的F分布求解:磁=警糌m(d‰州胛卅吲州),(2’15)1u既一fⅣ一d)一+1)18(”(。+1),(Ⅳ一。)一”(d“))、‘“。’式中,磁为T2统计量的控制限;口为置信度;m(d+1)为过程增广变量的维数;N-d为增广矩阵的采样数;E‘。(州),(|Ⅳ一d)一。(州))是自由度为聊(d+1)和(Ⅳ一d)一m(d+1)的F分布对应上限为100a%的临界点。Q统计量【柏l的控制限利用下式近似求解:‰:可华m半1石仁,◇式中,鲛脱为Q统计量置信度为口控制限;g:”羔¨衫(歹:1,2,3);%:1一警;q是i=r+1j%正态分布的上限100(1一口)%的临界点。2.1.2基于DPCA的故障诊断基于DPCA的动态工业过程故障诊断主要包括以下两部分:离线训练DPCA模型;在线监控。基于DPCA的故障诊断流程图如图2.1所示,具体过程如下。(1)离线训练DPCA模型1)获得训练数据x+:标准化处理;确定滞后时间常数d,根据式(2.1)构造增广矩阵X+;2)PCA算法:对增广矩阵X+的协方差矩阵进行特征值分解得到负荷矩阵U;根据特征值的百分比确定主元分数,.;根据式(2.9)得到主负荷矩阵P和残差负荷矩阵户,即:U=[尸角;3)求解控制限:利用近似分布的方法求取丁2和Q统计量的控制限,利用式(2.15)署11(2.16)i,t-算得到磁,‰£。(2)在线监控1)获取测量变量%。(后)并处理得到气,。(足):在线获取尼时刻的测量变量吒。(后);构造滞后时间常数为d的增广向量Xnew‘(七);对其进行和训练数据相同的预处理;2)计算足时刻统计量T2(足)和Q(足):利用式(2.11)矛11(2.13)计算得分变量‰(良)和.12— 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法过程变量估计值X”new(尼);由式(2.12)、(2.14)计算统计量丁2(尼)和Q(尼);3)计算F(七)=(丁2(尼)>丁2眦)o(Q(尼)>Qc。),其中“o’’是或运算;当F(尼)=1时,故障发生。数据标准化处理+离滞后常数d,获得正常工线况数据的扩展矩阵x·建’模PCA算法,求得Q,人过士程选取主元数,.,求取P,户+近似分布法计算控制限7如2,,鲰。l●在线数据扩展,并进行标准化处理艺。(露)0在计算,2(后),Q(尼)统计量Z.扛|||冷审发生故障图2.1DPCA的动态过程性能监控框图Fig.2.1ThedynamicprocessmonitoringschemeoftheDPCAmethod2.2基于DICA的故障诊断方法针对动态工业过程变量的非高斯特性,Lee8[251在2004年基于相同的思想提出了动态独立元分析方法。DICA是对独立元分析方法在数据具有动态特性时的改进。DICA与DPCA是基于相同的思想来表示过程变量的动态性。动态独立元分析方法【411主要分为两步:按照时间序列分析AR模型的形式对测量数据进行重新排列,构造出可以表示数据间动态关系的增广矩阵;然后在对增广矩阵建立DICA模型。2.2.1DICA的基本原理(1)构造增广矩阵DICA增广矩阵的构造过程和DPCA类似。假设X∈R”为已经标准化处理的由m个一13. 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法过程分量构成的数据。过程变量X的采样样本组成的数据阵为:x=【工(1)x(2)⋯x(忉】∈R⋯Ⅳ(2.17)然后对过程变量X利用式(2.2)进行扩展得到x’;由扩展的过程变量x‘组成的数据阵x+如下式所示,式中置,利用式(2.4)计算得到:x+=lz+(1)x‘(2)⋯x’(Ⅳ一d)l。一。(2.18)=【Xo且,⋯五d】1故,DICA利用的扩展矩阵X‘∈R”‘n1)x(N-a’为:X+=x(1)x(2)x(d+1)x(2)缸3)x(d+2)x(Ⅳ一d)x(Ⅳ一d+1)x(忉(2.19)然后对DICA构造的增广矩阵X’∈R”(n1)×(N-d’建立DICA模型。(2)DICA的基本模型动态独立元分析算法的基本模型41】:X‘=AS+E(2.20)式中,彳‘∈R”‘“1)בⅣ。d’是由m(d+1)个变量构成的增广矩阵,是实际采样过程变量的扩展;s=【s。s:⋯&】1∈R”州一’为由刀个相互独立源信号组成的矩阵,独立分量是隐藏变量,即不可测量变量;A∈R”‘n1’”为混合矩阵(Mixingmatrix);E∈R“‘州’。‘。Ⅳ一d’为残差矩阵;Ⅳ为采样点个数;d为滞后时间常数。i(庀)卜\jl(尼)参混合蔓(七)(s2(k):矩阵∥解混矩阵.AW●‰∞’》‘(州l(七)卜\毛(尼)/图2.2动态独立兀分析方法原理框图Fig.2.2ThefunctionalblockdiagramofDynamicIndependentComponentAnalysis动态独立元分析方法的原理框图如图2.2所示。DICA方法的目的【42,431是得到一个解混矩阵(De—mixingmatrix)W,将混合信号变换成统计上相互独立的源信号的估计值S,表达式为:S=≯讶+=WAS≈S(2.21)式中,§为s的估计值。从上式可知,当解混矩阵∥:么一-时,§为s的最佳估计。.14— 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法(3)DICA的约束条件应用动态独立元分析方法求解独立元时,需要满足以下几个约束条件【14】:1)源信号S1S:,..。,S。是相互统计独立的统计独立可以利用概率密度函数来定义。假设各个源信号一,s:⋯.,s。的概率密度函数分别为:A(而),P2(s2)⋯.,熊(s。),P(Sl,S2,...,Sn)为联合概率密度函数。当且仅当联合概率密度函数等于各个边缘概率密度函数的乘积,即:P(Sl,s:,⋯,J。)甬(J。)P2(s:)⋯Pd(S。)=nP知,)(2.22)i=1时,源信号置,是,...,&相互统计独立。值得注意的是:如果变量之间相互独立,那么它们一定不相关;相反,如果变量之间不相关,则并不意味着他们是统计独立洲431。源信号统计独立是DICA方法的基础。由于随机变量的概率密度函数很难获得,所以从概率密度的角度来度量独立性有一定的难度‘431。后来提出了利用随机变量k阶矩来判断独立性。然而在实际应用中【14】,各个源信号是由不同的实际物理系统发出的,它们之间没有必然的联系,所以在使用动态独立元分析方法时,不需要对源信号进行独立性证明。但是因为DICA计算得到的信号,有时存在伪独立源,需要进行相关性检验对其进行去除。2)各个源信号S1S:,...,Sn服从非高斯分布动态独立元分析方法要求各个源信号均服从非高斯分布,或者至多只有一个源信号服从高斯分布。因为动态独立元分析方法的实质就是通过对过程测量变量的高阶累积量来分解得到统计独立的源信号。而高斯分布的高阶累积量为零,如果源信号是服从高斯分布的,那么经过线性方式混合后得到的过程测量变量也是服从高斯分布的,也就是说,过程测量变量的高阶累积量为零,DICA也就无法从测量变量中分解得到独立源。A.Hyvarinen[441证明了如果存在两个及以上的高斯源信号时,就不能保证该方法分解的唯一性。3)动态过程变量的扩展变量x+的维数m(d+1)不少于源信号S的维数,z只有当过程测量变量的个数大于等于源信号的数目时,才能保证分解得到的独立元包括过程测量变量的全部信息,结果比较准确。在实际的工业监控过程中,测量的变量很多,所以该条件很容易实现。(4)DICA的估计依据动态独立元分析方法的估计依据和独立元分析方法的一样。独立元分析方法就是.15— 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法为了求取解混矩阵∥,使获得的独立元尽可能的满足统计上的相互独立。所以独立元分析可以描述为:通过一个目标函数来度量获取潜隐变量的独立性,然后利用某种优化算法进行优化。即:动态独立主元分析=目标函数+优化算法衡量变量独立性的方法主要有:非高斯的最大化法、互信息的最小化法和极大似然估计法。这三种方法根据不同的估计准则来衡量潜隐变量的独立性。其中,极大似然估计和互信息最小本质上是相同的,要求对源信号估计的概率密度函数必须准确,否则将会给出错误的结果。非高斯的最大化理论完善,应用最多。所以,本文用非高斯的最大化作为目标函数。非高斯利用统计学一个重要结论中心极限定理,可知:独立随机变量的和比原任何一个变量更接近于高斯分布。文‘38峙旨出变量的非高斯·蚪Vr厶匕Ill",够反应出变量的独立性。在独立元分析中,一个独立成分的估计j;,实际上是过程测量变量的一个线性组合童=w,x=∑%_,Wi是解混矩阵形的第i行。上一节中,指出当∥为A的逆时,童为岛的最优j估=J计。令B=黝,则有金=WiX=w彳s=his=∑6:c『s,,每是源信号s的线性组合,所以比任何一个源信号更接近于高斯分布。通过最大化估计向量w:x的非高斯性,得到独立元。非高斯性有两种常用的测量准则‘43】:四阶累积量(Kurtosis)和负熵(Negentropy)。前者对野值敏感,而负熵是基于微分熵的信息理论,所以本文选用负熵作为非高斯性的测量准则。离散随机变量Y的熵H(y)定义为:H(y)=一∑Py(Y=yi)logpy(y=只)f式中,咒是变量Y的取值;Py(Y=咒)是Y取值为乃时的概率。扩展到连续随机变量,Y的熵胃(),)定义为:日(y)=一IPy(r/)logP,(77)d77熵是用来测量变量的不确定性,变量越随机,它的熵就越大。在所有具有相同方差的随机变量中,高斯变量具有最大的熵。为了度量变量Y的非高斯性,用负熵来度量。变量y的负熵定义为:,(y)=日(y删。)一Ⅳ(少)式中,Yga。。是与变量y具有相同方差的高斯变量。由于实际的概率密度函数岛(y)并不知道,所以使用上式计算负熵来度量非高斯性非常困难【441。所以,提出利用下式来.16. 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法近似估计负熵【45】:,(J,)~[E{G(y))一E{G(y)>】2(2.23)式中,变量Y的均值为0,方差为1;v为均值为0,方差为l的高斯变量;函数G为一些非二次函数,JCY)为负熵。有上式可知,JCY)≥0,当变量Y为高斯分布时,J(y)=0;变量Y的非高斯性越强,负熵J(Y)越大。通过合理的选择函数G,可以使负熵具有更好的估计值。HyvarinenandOjat461提出了非二次函数G的几种形式:1Gl(“)=--1log(cosh(al“))(2.24)以1一生G2(“)=e2(2.25)G3(“)=≥(2.26)式中,1≤a,≤2,a:≈1。上述三个非二次函数中,GI是最常用的一种形式,并应用于本文。非二次函数G的具体描述见文【471。2.2.2DICA的算法动态独立元分析的算法主要包括四个部分:(1)过程观测数据的预处理和增广矩阵的构造;(2)白化处理;(3)FAST-ICA算法求解独立元;(4)计算统计量。下面分别进行介绍。(1)过程数据的预处理过程数据的预处理主要包括两步:标准化和构造增广矩阵。增广矩阵利用式(2.19)构造。标准化包括中心化和归一化两步。中心化是使每个观测变量的均值为零,由观测变量的测量值减去响应观测变量的均值得到。归一化是将中心化后的数据除以相应变量的标准差,其目的是为了使过程测量的每一个变量具有相同的权重,防止某一些变量的值过大,在运算中占主导地位,而忽略其他变量的变化。也可以根据实际工业过程的情况,对不同的变量分别赋予不同的权重,来更好地达到监控的效果。(2)白化处理对经过预处理的过程数据进行白化处L里(Whiteningorsphering),其目的是消除过程变量之间的交叉相关性(Cross—Correlation),降低解混矩求解阵的复杂度,使得算法的收敛性更好。白化处理通常是利用主元分析方法实现。设变量x有聊个过程变量组成x=【五x2⋯Xm]GR“1,变量x在采样时刻尼的值为x(尼)=【五(尼)蔓(尼)⋯‰(尼)】,且已术-⋯"匪⋯~b理。变量x的协方差矩阵R为:.17. 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法Rx=E(x(k)xr(足))(2.27)类似地,扩展的过程变量工+的协方差矩阵为:R。。=E(x+(露)x+r(足))(2.28)式中,E表示数学期望。故由N—d个采样值组成的增广矩阵x+=[z‘(1)x+(2)⋯x’(Ⅳ一d)]∈R⋯‘“1M肛d’的协方差矩阵髟为:R一.=X+X盯(2.29)对扩展变量X+的协方差矩阵R。进行特征值分解:毽.=UAU7(2.30)令白化变换矩阵Q=人一{Ur,得到白化处理后的观测矩阵Z∈R州+11州叫’为:Z=姒+(2.31)式中,z(k)=Qx4(后)为k时刻的采样值白化后的变量值。由下面的转换公式我们可以很容易的证明变量z的协方差矩阵为单位阵,即:E{ZZr)2节∥MQ一2。urx*x*ruA2(2.32):人~2UrUAUrUA—j:,由X‘=AS,可得:Z=QX+=幽S=BS(2.33)由于假设源信号相互独立,有源信号的协方差矩阵为单位阵,即:E{SS7)=I;由式(2.32)矢Hz的协方差矩阵为单位阵,即E{ZZ,)=I;故有E{ZZ丁)=BE{SS丁)曰7’=BB丁=I(2.34)由式(2.34),可知B为正交矩阵,即:曰7’B=I。综上所述,动态独立元分析方法从求解全阶的混合矩阵彳,简化为求解正交矩阵曰。因为B是正交矩阵,只需要估计m(d+1){胧(d+1))/2个参数,而求解A,需要估计(m(d+1))2个参数。所以,白化处理使DICA方法得到了简化,将未知的数据减少了将近一半,从而大大减小了问题的复杂度,尤其是对于维数较高时,白化过程的作用尤为突出。然后从式(2.33),可以得到源信号的估计值S:^甲mS=B。Z=B1似+(2.35)一18. 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法由式(2.21)和(2.35)可得,解混矩阵∥利用矩阵B求得:W=BrQ(2.36)(3)FAST-ICA算法目前,文献中已经提出了多种ICA算法。其中基于负熵的估计算法中,Hyvarinen[48】提出的快速ICA算法(FAST-ICA)简单高效。该算法不需要选择步长,并且收敛速度是三次的(或至少是两次的)。针对快速ICA算法得到的独立成分分量无序的缺点,本文提出计算出每个独立成分分量的负熵值,将其按照非高斯性大小进行排序,该算法[49,50]的具体步骤如下。1)设估计的独立元数目为n=m(a+1),令独立元数为变量z,令i卜1,f≤n;2)设迭代次数为M,令迭代次数,卜l,J≤M;第i个向量包赋予初始值并单位化;3)计算第i个向量6:『的迭代公式:bi卜E{Zg(b,丁z))一E{g’(岛rz))魏,式中g函数是非二次函数G的一阶导数,函数g’是非二次函数G的二阶导数,非二次函数G的形式见式(2.24),(2.25),(2.26);4)利用施密特正交化方法对向量岛正交化:岛=岛一∑(包r%)q;5)对向且婵位化:6:『2南;6)如果向量岛没有收敛且J≤M;令迭代次数,卜j+l,返回步骤3;7)如果向量岛收敛,输出岛;令独立元数i卜f+1,f≤n;返回步骤2。通过上述算法,计算得到的最终向量岛(扛1,2,⋯,d)是矩阵B的列向量,通过式(2.35)*11(2.36)计算得到源信号的估计值s(独立元或主潜隐变量)和解混矩阵∥。按照式(2.23)计算求取各个独立分量的负熵值并进行排序,选取相应的独立元。(4)计算统计量利用动态独立元分析算法求得解混矩阵后,需要对求得的潜隐变量进行降维处理,从而可以在一定程度上提高故障诊断的鲁棒性,降低分析的复杂性。降维即选择主要的潜隐变量用于故障诊断,主要包括两步:按照某种准则对所获得的潜隐变量进行排序;选择能够反映过程主要变化的前几个潜隐变量作为主潜隐变量。对动态独立元分析算法所获得潜隐变量进行排序没有标准的准则,目前主要有Hyvarinen[491提出的非高斯性,Back提出的无穷范数(匕范数),Cardoso提出的欧几里德距离(即厶范数)。因为非高斯性计算简单并且监控效果较好,本文利用非高斯性作一19. 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法为潜隐变量的排序准则。将解混矩阵W的行向量按照潜隐矩阵雪的行向量进行重新排列,取前a个行向量组成主解混矩阵%,∥的剩余部分记为形。通过选择矩阵B中与%和形的行向量相对应的列向量重新构造矩阵饬和吃。矩阵吃也可以根据式(2.36)i.-t-算,即:饬=(%Q。1)r。设忌时刻采样值的增广向量为x+(尼),则k时刻的主潜隐变量龛@)和剩余潜隐变量值se(k)为:舅(足)=%x+(露)(2.37)se(k)=W/(k)(2.38)根据DPCA中统计量丁2和SPE的定义,我们定义DICA算法的监控统计量72和SPE。其中,,2统计量表示过程变化表现在系统内部的主要部分,定义为动态独立元分析算法得到的主潜隐变量的平方和。定义k时刻的』2(龙)为:,2(尼)=岛(尼)r;d(尼)(2.39)SPE统计量表示过程变化表现在系统外部的部分,k时刻的SPE统计量定义为实际测量过程变量的扩展向量工’(七)与用DICA得到的主潜隐变量南(后)估计的扩展过程变量曼’(尼)的误差e(k)的平方和。定义k时刻的SPE(k)为:跚D飘护崭蒜H砸))(2.4。)=(x‘(尼)一曼+(尼))7(x+(尼)一曼+(尼))、7式中,用DICA得到的主潜隐变量良(尼)估计的过程变量曼(后)值为:娴三篡B裟毛仁4,,=p~。形x’(尼)、7Leea[51]等人在2003年提出了/e2统计量,利用剩余的d—a个潜隐变量乏计算得到。t2统计量提供了另外一个可以反映系统外部变化的故障检测工具,可以检测系统中一些特殊的故障。并且,t2统计量在一定程度上弥补了由于主潜隐变量选择错误所带来的错误。,2和L2为由潜隐变量所构造的两个统计量,两者相互补充。定义k时刻的t2(后)为:C(七)=Se(七)rt(尼)(2.42)由于DICA算法得到的潜隐变量不服从高斯分布,所以,2,t2,和SPE统计量.20— 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法无法用近似服从某个分布的方法求取控制限。本文采用核密度估计(KernelDensityEstimation,KDE)【52】方法来计算,2,le2,和肼珂统计量的控制限,详见第三章。2.23基于DICA的故障诊断数据标准化处理★滞后常数d,获得正常工况数据的扩展矩阵x+☆+呙线白化处理,求得Q,z建士模快速ICA算法,求得B,W、I过●程非高斯性,求取%,奶,彤,毋●计算,2,,e2,SPE统计量计算J2UCL,,e2UCL,‰控制限I士在线数据x(七),计算,2(t),L2(t),SPE(k)统计量凳审叫登卜审图2.3DICA的动态过程性能监控框图Fig.2.3ThedynamicprocessmonitoringschemeoftheDICAmethod基于DICA方法的动态工业过程故障诊断流程图如图2.3所示,主要包括以下两部分:对正常工况下的测量数据进行离线训练;对实时获得的工业过程测量变量在线分析并检测故障情况。(1)离线训练DICA的模型1)获得训练数据X+:确定滞后时间常数d,根据公式(2.19)构造增广矩阵x+;标准化处理为x4;2)白化处理:利用公式(2.30)计算得到白化转换矩阵Q,白化矩阵Z;3)快速ICA算法:得到矩阵曰,根据公式(2.36)和(2.35)得到解混矩阵∥和潜隐矩阵S:根据非高斯性将矩阵形和B,分解为:.21. 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法肚阱肚【岛Be];4)求解控制限:计算,2,乞2SPE统计量;利用公式(3.47)核密度分析方法求取控越限12UCL,I?UCL,SPEUcLo(2)在线监控1)获取测量变量Z。。(后):在线获取k时刻的测量变量‘。(尼),构造滞后时间常数为d的增广向量毛。’(尼);和训练数据进行相同的预处理;2)计算七时刻统计量,2(七),乞2(居),SPE(k):利用公式(2.37)和(2.38)-k1-算ga(k),se(k);由式(2.39)、(2.42)、(2.40)计算统计量;3)计算,(七)=(』2(足)>12眦)o(t2(尼)>L2ucL)o(SPE(k)>田强赢),当F(尼)=1时,故障发生。2.3DICA和DPCA方法的比较DPCA和DICA是针对数据的动态性所提出的两种动态工业过程故障诊断方法,下面分别从相同点和不同点两方面对两种方法进行比较。(1)相同点1)处理的数据:DPCA和DICA都是先对过程采样数据进行扩展获得增广矩阵,然后再对其进行建模。2)基本思想:都是将扩展的过程变量进行建模,将高维变量投影到低维的空间。3)统计量的计算:两种方法都是利用得到的潜隐变量所购成的空间重新分配为主潜隐变量和剩余潜隐变量两个子空问,分别计算统计量进行监控(DPCA:T2统计量;DICA:12和t2统计量);再利用主潜隐变量重新估计过程变量值,利用残差平方和构造统计量进行监控(DPCA:Q统计量;DICA:SPE统计量1。(2)不同点1)前提条件:DPCA的潜隐变量满足独立同分布;DICA的潜隐变量满足相互独立。2)处理数据的特点:DPCA的潜隐变量满足高斯分布;DICA的潜隐变量满足非高斯分布或者至多只有一个满足高斯分布。3)估计原理:DPCA依赖的是变量的二阶统计信息,其投影后的得分变量时垂直正交的;DICA利用的是变量的高阶统计特性。4)监控统计量控制限的确定:DPCA利用近似分布的方法求取丁2和Q的统计量;DICA利用概率密度估计的方法求取,2,L2和SPE统计量的控制限。 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法2.4本章小结本章主要讲述了三个内容:(1)DPCA算法及在工业过程性能监控的应用。主要包括DPCA算法、DPCA应用于性能监控时统计量和相应控制限的计算方法以及DPCA应用于动态工业过程性能监控的离线建模和在线监控的具体过程。(2)DICA算法及在工业过程性能监控的应用。主要包括DICA的基本原理、算法过程及应用于性能监控时统计量的计算以及DICA应用于动态工业过程性能监控的具体过程。(3)DPCA和DICA算法的比较。主要从相同点和不同点两方面进行了比较。综上所述,只考虑数据的动态性,基于DPCA的故障诊断方法已得到了广泛应用;但是考虑到实际动态工业过程中采样数据的非高斯性,基于DICA的故障诊断方法效果更好,故本文主要对DICA进行研究。一23. 万方数据东北大学硕士学位论文第2章基于DPCA和DICA的故障诊断方法.24. 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法由上章可知,考虑到动态工业过程数据的非高斯性,本文主要对DICA方法进行研究。但是,浙江大学博士刘育明【8】在其博士论文动态过程数据的多变量统计监控方法研究中进一步指出基于动态隐变量的方法所提取的潜隐变量是对扩展变量的线性组合,以DPCA或DICA为例,获得的主元或独立元实质上就是包含时滞变量的各个变量的线性组合,但是得到的潜隐变量只能保证在零滞后的相关系数矩阵为对角阵,并不能保证在非零时滞时相关系数矩阵为零,即得到的潜隐变量不是相互独立的,在非零时滞上仍然存在一定程度的动态性(自相关性和互相关性)。DICA算法人为地引入动态性,使得到的潜隐变量仍然具有一定的动态性,从而造成较高的误警率,并且会出现连续误警的现象。由于状态空问模型能够同时有效地表示过程变量的自相关和互相关性,故本章提出了状态空间建模方法和动态独立元分析方法相结合的基于子空间辨识的动态独立元分析(SI.DICA)的故障诊断方法。3.1动态性判别及影响分析KutZO]在1995年最早提出动态隐变量法进行动态故障诊断,当时文中就指出动态主元分析方法存在如下问题:通过对矩阵进行扩展来表示变量的动态性,然后再对其进行主元分析方法得到的潜隐变量仍然存在一定的自相关性,并且可能存在一定程度的互相关性。后来Kruger[27]等人在2004年对动态主元分析方法得到的潜隐变量的动态性(自相关性和互相关性)进行了进一步的证明,指出即使在原过程变量相互独立的情况下,动态主元分析方法得到的潜隐变量(得分向量)确实存在自相关性,却没有证明互相关性。浙江大学博士谢磊f33】在05年指出并再次证明了动态主元分析方法不但无法有效地消除数据的动态性外,而且在数据本身满足不相关的条件时,还会人为地引入动态性。根据上述文献中DPCA潜隐变量相关性的证明,下面我们对DICA方法潜隐变量的动态性(从自相关和互相关性两方面)进行详细的证明。证明之前,首先介绍几个定义和定理。定义3.1设m维均值为零的变量x=【XIx2⋯xo]。∈R”,当滞后时问为f时,变量分量xi,xi(1≤i,J≤m)的相关系数组成的矩阵定义为p(r),其中第i行,第/列的元素为:.25. 万方数据东北大学硕士学位论文第3章基于SI.DICA的故障诊断方法房,,(f)=:7i蚕吾ii亏C露。贾v(夏x天i(萄t)亏,乏xj亏(it‘-亏ri)丽),1≤z,,≤聊(3.1)房,∥’2再雨雨丽蒜丽菰而’K2,J鲕‘孓1’式中,Cov(xi(t),_(f))为变量蕾,xj(1≤f,/≤聊)的互相关函数,定义如下,⋯叭啪叫,={蓊1N篓翥。B2,式中,N为变量x的采样数目。定义3.2变量x的分m—x,(1≤i≤m)的自相关函数定义为:ACF{x,,r)=辟,,(f)变量x的分量薯,xj(1≤i,/≤聊;f≠/)的互相关函数定义为:CCF{xi,o,f}=辟,』(f)(3.3)(3.4)并且满足:CCF{xi,_,f)=CCF{xj,誓,丁)。定理3.3当变量蕾(1≤f≤脚)的均值为零时,变量蕾,xj(1≤i,/≤垅)的相关函数与协方差的定义是一致的。证明:(1)因为变量鼍(1≤i,J≤垅)的均值为零,即:地)=i=专姜薯_o(H,2,⋯川(3.5)(2)变量蕾和x,(1≤f,J≤聊)的协方差的定义如下:Cov(xi(t),■(f))=E[(葺(f)一E(誓))。(■(f)一E(0))]2专善(碘)-地)).(啪M(删将式(3.5)代入式(3.2),-J失H:其相关函数与协方差的定义是一致的。定理3.4如果变量X时已经标准化处理的数据,则满足各个分量满足均值为0的条件的同时,还满足方差为1,则其相关系数矩阵的元素与互相关函数的定义是一致的。证明:因为变量xi(1≤i,J≤m)的均值为零,方差为1,即:烈薯):CD以葺o),‘o”2专善(薯一习)=10_1,2,⋯,聊)(3.6)将式(3.4)代入式(3.1)可得:.26. 万方数据东北大学硕士学位论文第3章基于SI.DICA的故障诊断方法辟√(r)=Cov(xi(t),xj(t—r)),1≤f,/≤m其相关系数与互相关函数的定义是一致的。(3.7)定理3.5设m维均值为零,方差为1的变量z=【五恐⋯‰】reR“满足相互独立性的条件,其必要性是相关系数矩阵p(r)满足:肿,=雕翥定理3.6无论原过程变量X是否满足不相关的条件,得到的扩展数据变量x+均不能满足不相关条件‘331。(3.8)利用AR模型按照公式(2.2)引理一:在原来过程变量x相互独立,即不存在自相关也不存在互相关时,满足当f≤d时,R(r)是非零的。引理二:在原来过程变量x存在自相关但不互相关时,满足当丁≤d+丁:时,R(r)是非零的。其中Ta+=max{《n,《孙,⋯,《砌),《D=max{rACF{x,,丁)≠0),丐是过程第f个变量。引理三:在原来过程变量X存在自相关也存在互相关时,满足当r≤d+C时,Rp)是非零的。其中《=maX{《’,《扪,⋯,屯⋯,乏1’n,⋯,乏‘D,⋯,《”1朋’),其中艺‘力=max{rICCF{xf,x,,f)≠0),薯,x,是过程第i,,(f≠,)个变量。证明:对过程变量x=【五恐⋯%】1∈R”进行标准化处理后,满足均值为0,协方差为单位阵,则x+∈R州“’的相关系数矩阵R(r)为:R(f)=p(f)=以【《xT_I⋯匕】,[五五一。⋯五一d】)姐(x’,X_+r)2j南丕,xmx玎(卜f)(39)E(xoXr,)E(疋。五)E(xd五)R,,RH,置,,墨H。局.,忆肘。E(xoX二一1)E(t。《H)E(xd五一。)⋯R。d⋯曩Hd⋯吃.r+d⋯E(%五一d)⋯E(t1XT_T—d)⋯E(xdx2一d)式中,R,,=R拈叫=p(1歹一iI)。由此可知,上式中正对角线上的相关系数矩阵相等,令R√=R,1∥l中f--IJ—iI,可得民,,的计算公式如下所示:一27. 万方数据东北大学硕士学位论文第3章基于SI-DICA的故障诊断方法Ro.f=E(圮)ACF(x1,f)CCF(x,,x2,f)⋯CCF(x,,z名,f)CCF(x2,五,f)ACF(xz,f)⋯CCF(xz,Xm,f)CCF(x.,,■,丁)CCF(‰,x2,f)⋯ACF(x。,f)(1)原过程变量X相互独立由定N(3.5)有:R√=pcf/一rf,={霉二:;三;当丁≤d时,相关系数矩阵尺(f)可以表示为:R(r)=R,。R”,墨,,墨”。Rr’fRr'r+lR+l’,足+1'州B,,心甜。(3.10)(3.11)(3.12)式中,矩阵的左下角存在非零矩阵元素:Rv=R+l,川=⋯=吃,d=∑。故有,当变量X相互独立时,存在f≤d(f≠0),R(r)=p(r)≠0,由定理3.5可知,扩展变量X+不满足不相关。引理一得证。(2)原过程变量x只存在自相关,不存在互相关首先,对于已经标准化的采样数据X,当r=0时,变量X的相关系数矩阵为单位阵,R(r)中矩阵元素R。,满足R,,≠O(当f=/);其次,假设原过程变量的各个分量誓(1≤f≤聊)存在相关性时的最大r值定义为f?’,即f?’=max{rIACF{xi,f)≠0)。由R.,的定义式(3.10)可知,当r≤Z"a+=ma)【{艺n,《21,⋯,艺州),R,,矩阵存在非零元素ACF{x,,f),所以民.,是非零矩阵,所以R(r)中矩阵元素民,。=兄p矗=墨,,(歹=z+f,i≤d)是非零。综上,当f≤d+《,由R(r)的定义式(3.o)可知中,存在非零项。其中,当f=d+《时,R(r)中只存在一个菲零矩阵元素吃,,=■小,:=‰,,:≠o。由定理3.5可知,扩展变量x+不满足不相关。当变量x只存在自相关,不存在互相关时,满足当r≤d+f:时,.28一d托d斗肿;斗蚺;H廊R风胁助心d村k村厨R:B跏:肋. 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法R(f)是非零的,引理二得证。(3)原过程变量x存在自相关,也存在互相关首先,从引理二的证明可知,月(f)中矩阵元素尽,,满足R,,≠O(当i=/);另外,当f≤e=maX{屯¨,T。。a(2),⋯,艺”’),尺(f)中矩阵元素R,,=兄Hd=R。,(/=i+彳)是非零的,R(r)是非零矩阵。其次,假设原过程变量的分量t,xj(1≤i,J≤m,f≠J)存在互相关性时的最大丁值定义为乏‘”,即乏‘7’=max{rCCF{x,,x,,f)≠o)。由式(3.10)Ro.,的定义有,当f≤《=max{乏1’扪,⋯,乏‘D,⋯,t一1’神),Ro,,矩阵存在非零元素CCF{xi,石,,r),故R,,是非零矩阵,所以R(r)中矩阵元素R,,=吃"d=R,,(,=i+r,f≤d)是非零的。综上,当f≤d+《时,rc+=maX{乇¨,乇孙,⋯,乏⋯,乏1’¨,⋯,v。(i,j),⋯,乏”1,m’}R,,存在非零的自相关系数ACF{x,,f),或者非零的互相关系数CCF{x,,x,,f),民,,是非零的;即R(r)中矩阵元素R,,=吃Hd=R,,(/=i+v,f≤d)是非零的;所以R(r)是非零的;由此可得,扩展变量x+是相关的。引理三得证。综上引理一,二,三,定理3.5得证。从定理3.5可知,即使在原变量不相关时,原过程变量的时滞变量也会人为的引入动态性,具有相关性。根据上述定义和定理,下面从自相关和互相关性两方面证明动态独立元分析方法得到的潜隐变量的动态性。首先,定义DICA方法潜隐变量的相关系数矩阵;然后,证明非零时滞时,潜隐变量的相关系数矩阵的特点。(1)DICA方法潜隐变量的相关系数矩阵的定义假设:利用动态独立元分析得到的解混矩阵为W∈R”(n1)“(n¨,潜隐变量矩阵为S=WX+∈R”‘“1k‘肛引,潜隐变量为s=ls1s2⋯s。(州)『∈R”‘“¨,潜隐变量尼时刻的值s(k)为:s(尼)=脓+(尼)=卜(尼)曼(尼)⋯s。(州)(尼)I。∈R以nD(3.13)定义滞后f后S一,为:%=lSl-rS2,-r⋯Sm(d+1),-r『∈R叫“D(3.14)则k时刻的值为:s一,(k)=Is,(k+r)s:(k+r)⋯s。(d+。)(k+r)I(3.15)由此定义潜隐变量S滞后时间为r的相关系数矩阵尺,(r)为:.29. 万方数据东北大学硕士学位论文第3章基于SI-DICA的故障诊断方法j≮(f)=E(s·s二)=E([s。s:⋯s。。d+。,]71·[s。,一,s:,一,⋯s。。。+。,,一,])ACF(sI,r)CCF(sl,sz,r)⋯CCF(s,,sm(d+。),f)CCF(s2,%r)ACF(s2,r)⋯CCF(s2,%(州),f);。.;CCF(sm(d+,),5。,丁)CCF(sm(d+。),s:,丁)⋯ACF(s(d+。),f)(3.16)由相关系数的定义(3.1)n-]矢H:潜隐变量的分量Si和Sj的相关系数肛,,(丁),即是R(r)的第i行第歹列对应的元素值:辟,,(f)一Cov(s,(k),s,(后一f))一再丽丽乖而菰丽丽一丽1奎N-d。删呜(七一r)(3.17)vhY-k时刻潜隐变量的分量值薯(k)=wfx‘(k),其中w∈Rlxm(d+1)为解混矩阵的第衍亍向量,将其带入上式得:啪卜亟1李N-d!竺竺!!:wiX‘·X+。wj。Nd——2j=而1木瓦1i当N-d。wlx协x+丁(h¨=一木一>1.f豇、.Y1,厶一7.11^,1上Ⅵx+.x+7'w,7’Ⅳ一f—d眚l~广。V¨“V。吖”’令砖,J=—T——二—一≠0,上式简化为:高wi×j×iw:肛,/(f)=砖,,丰w1N-d。x+(尼),x+7’(尼一f))吩r(3.18)=ki,』木wR(r)叶。式(3.18)中,尺(f)为扩展变量x+的相关系数矩阵。式(3.18)中,由定义(3.2)有:当j=i,1≤ism(d+1)时,p,,(f)是第i个潜隐变量薯的自相关系数(23】ACF{si,f):ACF{sf,f)2辟.i(f)=k¨木wsn(r)wf7(3.19).30一 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法当l≤i≠J≤m(d+1)时,肛,,(丁)是第f个和第/个潜隐变量薯,Sj的互相关系数CCF{sf,s,,r)定义为:CCF{sf,Sj,丁)2岛,,(f)_ki,_,木wiR(r)wjl(3.20)(2)非零时滞时,DICA潜隐变量相关性的证明下面分三种情况分别对DICA得到潜隐变量的相关性进行证明:1)原过程变量相互独立由定N(3.6)的引理一可知:当原过程变量相互独立时,当f≤d时,R(r)是非零的;由潜隐变量的自相关ACF{s,,丁)和互相关系数CCF{s,,S,,f)的定义式(3.19)和(3.20),可知:当f≤d时,ACF{si,丁)和CCF{sf,s-,,r)(1≤f,J≤m(d+1),f≠J)是非零的;由潜隐变量s的相关系数矩阵R(f)定义(3.13)n-]得:当f≤d时,R(丁)为非零的。2)原过程变量存在自相关不存在互相关由定理(3.6)的引理二可知:当原过程变量存在自相关不存在互相关时,当f≤d+《时,R(f)是非零的,其中2"a+=max{《’,tn,⋯,rt。im));当f≤d+《时,则ACF{si,丁),CCF{s,,s,,丁)是非零的;同理可得:当f≤d+《时,潜隐变量s的相关系数矩阵R(r)为非零的。3)原过程变量存在自相关也存在互相关由定理(3.6)的引理三可知:当原过程变量存在自相关和互相关时,当丁≤d+T+时,c尺(f)是非零的,其中;Tc+=max{丁■乏孙,⋯,屯⋯,t/-。0,2),⋯,乏‘D,⋯,乏”1’砌);INN.N潜隐变量的自相关和互相关系数:当丁≤d+《时,ACF{s,,r),CCF{s,,s,,f)是非零的;故有,当f≤d+《时,足(r)为非零的。综上所述,无论原过程变量X是否满足不相关的的条件,对其进行DICA分析得到的潜隐变量S的相关系数矩阵足(f),存在f≠0时,足(r)为非零的情况;由定理3.5可知,DICA得到的潜隐变量S不满足不相关。可以得到以下定理3.7。定理3.7无论原过程变量X是否满足不相关的的条件,对其进行DICA分析得到的潜隐变量S均不能满足不相关条件。引理一:在原来过程变量即不白相关也不互相关时,当f≤d时,R,(r)是非零的。引理二:在原来过程变量自相关而不互相关时,当r≤d+《时,R(f)是非零的。其中ra+=max{《’,《孙,⋯,己⋯’),乏D=max{rIACF{xi,r)≠0),誓是过程第f个变量。引理三:在原来过程变量自相关而不互相关时,当f≤d+《时,R(r)是非零的。其中《=max{《n,屯孙,⋯,t⋯,Z-。(I,2),⋯,乏t力,⋯,蠢一1’砌),式中《‘力的定义为:一31— 万方数据东北大学硕士学位论文第3章基于SI.DICA的故障诊断方法乏‘7’=max{rICCV{xf,x,,f)≠0),薯,x,是过程第i,J个变量且f≠J。由定理3.7可知,DICA得到的潜隐变量仍具有动态性。同理,我们可证得DPCA得到的潜隐变量也具有动态性。3.2子空间辨识针对DICA得到的潜隐变量具有白相关和互相关的特点,我们想到对潜隐变量进行建模,同时描述潜隐变量之间的自相关和互相关。对多变量进行建模,能够同时描述变量之间的自相关和互相关116,53],主要有以下两种方法。(1)时间序列分析方法:通常对于单变量用时间序列分析方法就行建模。当将其用于多变量进行建模时,需要首先将时间序列分析方法推广到多变量,建立多变量时问序列分析模型如多变量AR或ARMA模型。缺点:将时间序列分析方法推广到多变量的同时,需要估计的模型参数也由向量扩展到矩阵的形式,使模型的复杂度迅速增加【541,增大了估计的难度。(2)状态空间建模方法:状态空间模型是动态时域模型,以隐含着的时间为自变量。Ljung[55,s61指出,状态空间建模方法更容易处理复杂的模型,所以对多变量进行动态建模时一般采用状态空间建模方法。优点:1)状态空间模型将多个变量的时间序列处理为向量时间序列,这种从多变量多向量的转变更适合解决多输入多输出情况下的建模问题;2)不仅能够反映系统内部状态,而且能够揭示系统内部状态与外部的输入和输出变量的联系;3)能够用现在和过去的最小信息形事描述系统的状态;因此,需要大量的历史资料,省时省力。所以,在动态工业过程故障诊断领域,状态空间建模方法在近二十几年得到了迅速发展。3.2.1状态空间模型多维时问序列的状态空间模型描述如下:x(尼+1)=彳x(尼)+口“(后)+尺匆(尼)y(k)=Cz(k)+Du(k)+e(k)式中,矩阵么,B,C,D为状态空间模型的状态矩阵;K是Kalman滤波器增益;x(k)∈R”为状态向量;y(k)是多维输出时间序列;u(k)是多维输入时间序列;e(k)是对应的状态估计模型的误差。在将多变量状态空间建模应用到动态工业过程进行故障诊断时,是对过程变量工(”∈R”作为输出建立如下状态空间模型:.32. 万方数据东北大学硕士学位论文第3章基于SI-DICA的故障诊断方法z(尼+1)2么z(庀)+缸(尼)眦1)x(足)=Cz(k)+e(克)。和上述所建立的状态空间模型不同的是,本文应用时建立的模型没有输入【33】。式中,x(k)∈R”是采样得到的m维过程变量;当过程变量x(尼)∈R“服从非高斯分布时,有估计的状态向量z(尼)也是服从非高斯分布,集中体现了x(k)的动态特性;e(k)∈R”是m维的估计误差。状态空间模型辨识方法主要有两种:传统辨识方法和子空间辨识方法。子空间辨识方法【57,58,”](SubspaceIdentification,SI)是20世纪末提出的一种新的状态空间模型辨识方法。由于子空间辨识方法有如下特点:(1)对模型结构先验知识需求较少;(2)适用于多变量系统;(3)对数值计算具有一定的鲁棒性【28】;所以予空间辨识方法在通过输入一输出数据来辨识过程的状态空间模型领域得到了广泛应用‘60,61,62]。子空间辨识方法【2坩是以系统理论、线性代数和统计学三个方面作为理论基础,相比于传统的辨识方法具有如下优点:(1)不需要参数化;(2)不需要进行迭代优化;(3)基于采样得到的历史数据,算法简单,容易实现;计算过程只依赖于一些简单可靠的线性代数工具,如QR分解、SVD(奇异值)分解等;(4)直接估计状态空问模型,适用于多变量的系统辨识。所以本文选用子空间辨识进行状态空间模型辨识。子空间辨识方法的关键【29】是利用时间序列数据x(尼)估计出广义可观测矩阵或者状态序列z(k),然后利用上述信息求解系统状态空间模型的矩阵彳,EC’D。子空间辨识主要分为两步:第一步:将采样数据构成的特定空间分解成两个相互正交的子空间,信号部分和噪声部分;然后利用信号子空间估计广义可观测矩阵或者状态序列。第二步:利用估计的广义观测矩阵或者z(尼),计算系统矩阵。图3.1分别给出了传统辨识方法和子空间辨识方法的处理过程,并进行了比较。l输入/输出数据U,Y子空问—————T_——一传统辨识辨识方法[———————————————]方法l麓瓣;I阵矩呦,c,D观澳4矩阵I’l“、⋯“、。’“1’”’。’“厂———L—]厂———上—]I系统矩阵A,B,C,D状态序列z图3.1子空间辨识的基本步骤Fig.3.1Themainstepsofsubspaceidentification子空问辨识方法的求解算法主要有典型变量分析(cVA)【61-65],N4SID[6翻,MOESP,Basic.4SID,IV-4SID等。根据辨识第一步是估计状态序列还是广义能观矩阵将上述算一33. 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法法分为两类‘29】:第一类是得到状态序列的估计值z(尼),然后利用z(k)求解状态空间模型的系统矩阵,有CVA和N4SID等;第二类是估计广义能观测矩阵,计算模型参数,有MOESP,Basic.4SID,IV-4SID等。本文选用第一类子空间辨识方法,其具体步骤如下。(1)通过时间序列数据z(七)估计出典型变量z(k)。子空间辨识方法通过过去g个时刻s(k)的线性组合来表示z(k):z(尼)=厩。(露)(3.22)因此,子空间辨识的关键是通过某种方法确定状态转换矩阵,,通过上式计算得到状态矩阵Z的估计值。(2)利用最小二乘方法估计状态空间模型的系统矩阵:l耋I=cbVc[z芝等’],zc后,,·(bVczc尼,,zc尼,,c3.22,在第一类子空间辨识方法中,根据状态转换矩阵/选取的不同进行区分,有典型变量分析方法(CanonicalVariateanalysis,CVA),N4SID(Numericalalgorithmsforstatespacesubspacesystemidentification)等等。Overschee[65]将各种状态转换矩阵,的算法进行了统一的讨论,并指出区别只是各种算法在奇异值分解过程中采用的加权矩阵不同。3.2.2典型变量分析方法典型变量分析方法能够有效地处理具有自相关和互相关的动态数据,并利用状态变量对其进行降维。所以,典型变量分析在动态过程故障诊断领域得到了有效的利用,得到了越来越多研究人员的注意‘64’66】。本文采用典型变量分析方法来计算状态转换矩阵J。典型变量分析方法将数据划分为“过去”和“未来”两部分。利用“过去”线性组合实现对“未来”的最优估计,所以状态转换矩阵J的求取也就转化为:“未来”条件输出与“过去"输出之间的正则载荷矩阵。(1)几个重要概念1)k时刻过去输出变量工。(庀)和未来输出变量x,(后)利用过去和未来g个时刻输出变量x(k)的值进行扩展,得到k时刻的过去输出变量x,(尼)和未来输出变量x,(七)为:..34.. 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法xp(k)=x,(后)=Ix(k—1)llx(尼一2)I|.lx(露一q)Jx(后)x(k+1)x(k+q-1)∈R哪,‘(庀)=xp(k)一i(3.23)∈R”,i(尼)=吩(尼)一弓(3.24)式中,弓和i分别是过去输出变量‘(尼)和未来输出变量_(尼)的均值向量;mq是过去输出变量和未来输出变量的维数;g是扩展常数。2)输出变量的汉克尔矩阵(Hankel矩阵)Xp和X,由M个过去输出变量曼p(尼)和未来输出变量王,(尼)组成的过去输出矩阵xp和未来输出矩阵■:巧=[弓(g+1)2p(q+2)⋯Ycp(q+M)]eR邺删(3.25)xr=[舅r(g+1)量,(g+2)⋯曼厂(g+必)】∈R”9。朋(3.26)将式(3.23)gl式(3.24)分别带入式(3.25)和式(3.26)67,得到汉克尔矩阵xp和X,:Xp=xf=I曼(g)f曼(g一1)l;l冤(1)舅(g+1)曼(g+2)2(q+g)舅(g+1)⋯舅(g+M一1)觉(g)⋯i(g+M一2)2(2)⋯曼(M)夏(g+2)⋯孟(g+3)⋯2(2q+1)⋯文g+必)贾(g+M+1)2(2q+M一1、设x∈R”采样数为N,由上式汉克尔矩阵x,和x,的形式可知:过去输出变量Xp(g+1)的最后一个元素为j(1),未来扩展变量j,(g+拟)的最后一个元素为变量2(N)。因此,由上式Xp和X,汉克尔矩阵的扩展形式可知最大列数M为:M=Ⅳ一29+1(3.27)3)过去输出变量和未来输出变量的协方差∑朋,∑∥和交叉协方差∑扫利用采样数据来估计过去输出变量和未来输出变量的协方差∑即,∑疗.和交叉协方差∑彦,根据Hankel矩阵xP和X,计算Ou-F:.35. 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法∑广嘉静㈣杈驴丽1XpX2(3.28)V=嘉善。孙啪=而1XfX歹(3.29)%=击蓦驰啪=击纠T(3.3。)(2)状态转换矩阵J的求取典型变量分析的目的是找到未来输出变量i(尼)和过去输出变量趸p(七)最好的线性组合aT(移(后))和6,(5cp(k)),从而使aT(影(后))和6丁(砖(意))之间的相关性%(口,b)最大,线性组合aT(i(尼))和67’(‘(尼))相关性的计算公式如下:%(啪):—j生(口r∑∥口)j(6r∑即6)j令“=∑多以,1,=∑二6,上述问题可以转化为如下优化问题:呱一rI1‰∑;]Vs.t.UrU=1yrl,=1令日=∑;∑彦∑多。.由线性代数可知,上述优化问题“和v的解是汉克尔矩阵H的左奇异矩阵和右奇异矩阵对应的列向量;最大相关性的取值仃。。=maX口,6%(以,6)是对应汉克尔矩阵日的最大奇异值;此时,向量甜和1,为最大奇异值对应的左、右奇异矩阵的相应列向量。假设汉克尔矩阵H的秩为r,则H有r个非零奇异值,Orii=1,2,⋯,r并以降序排列,相应的有厂对左奇异向量“i和右奇异向量_,i=1,2,⋯,,.。汉克尔矩阵H的奇异值SVD分解如下:H=∑名∑扫∑歹=UDV2(3.31)由上述分析可知,U和y矩阵的列向量对应的即为向量“,和V。D矩阵的对角元素第f个奇异值q,。并且D矩吁的奇异值按降序排列;则相应的有U=11i和V2V时对应的向量为ai=∑≥甜,和6f一--厶乙2v时,线性组合以-(影(尼))和矽(《(尼))的相关系数%(口,,6::)=O"i,并且也是降序排列,即有如下表达式:.36— 万方数据东北大学硕士学位论文第3章基于SI.DICA的故障诊断方法D=0-100"2:●0⋯O⋯O’.:●⋯o,U=[“1“2⋯咋】∈R啪”y=【Hv2⋯Vr】∈R啷”Pip(al,岛)Opfp(a2,吃)0⋯Pip(a,,6r)∈R⋯利用过去输出变量‘(尼)估计的典型变量,即上述求取的过去输出变量‘,。的线性组合Zf(七)=矽(xp(尼)),按照相关系数%(口,,岛)=q降序排列向量岛,从而得到典型变量z(后)=[乙(尼)Z2(尼)⋯乙(尼)】,∈Rr×l表达式为:z(后)=豉蟹:●毽砖(尼)=l∑二砖(尼)=y71∑名露(尼)(3.32)由z(七)=厩。(庀)可得,状态转换矩阵,为:一!,=矿1∑名∈R“嘲(3.33)状态转换矩阵,将mq维的过去输出变量曼。(七)转换为r维的典型变量z(尼)。并且得到的状态变量是单位化向量,其协方差矩阵R为单位阵,证明如下:疋2高。萎。z(尼)zr(后)’∥∑文击善,孙崩尼)眵=矿r∑i∑即∑jy=Vry=,(3)统计量的计算根据系统的阶次,将上述状态变量构成的空间分为主状态子空间和剩余状态子空间。设系统的阶次为%<,.,则根据奇异值的大小将状态变量进行排列,其中前‰个主奇异值对应的状态变量构成主状态子空间,剩余的,.一mo状态变量构成剩余状态子空间。如下式所示:z(尼)=[东(足)《(尼)]7式中,‰(后)∈Rm0为k时刻的主状态变量,构成主状态子空间;乃(庀)∈R’⋯。为k时刻的剩余状态变量,构成剩余子空间。Zm(),乃(尼)均为状态变量z。的子序列:ok.37.00;● 万方数据东北大学硕士学位论文第3章基于SI-DICA的故障诊断方法z%(足)=Jmo‘(足)(3.34)乃(尼)=以ip(尼)(3.35)式中,主状态变量转换矩阵‘和剩余状态变量转换矩阵以为:一!厶。=%∑二一!Jd=vj∑三(3.36)(3.37)‰是由式(3.22)得到的右奇异矩阵y的前聊。列组成的矩阵,圪是由y的后r—mo列组成的矩阵。并且主状态变量‰和剩余状态变量za的协方差矩阵也均为单位阵,∈R彬“。然后根据状态变量z(k),利用最小二乘法求取系统矩阵么,C。利用典型变量分析方法进行动态工业过程进行性能监控时,根据主元分析方法中统计量丁2,Q的定义,在CVA算法㈣中我们定义统计量T,2,SPE。利用主状态变量定义k时刻的乎(尼)为:乎(尼)=z。。(尼)7Zm0(尼)(3.38)式中,‰(尼)为利用式(3.01)求得的主状态变量。利用主状态变量估计得到尼时刻的误差变量e(k)为:lg(尼)2I一圪。y‰T)∑PP2舅p(后)(3.39)定义e(忌)吐歹础,则转换矩阵以为:以2I一‰馁)∑二(3.40)k时刻的SPE(k)定义为:SPE(k)=e(k)re(k)(3.41)根据DICA中t2统计量的定义,在CVA应用于过程监控时我们利用剩余的r—mo个状态变量乃(后)定义乏2统计量。t2统计量同样作为另外一个可以反映系统外部变化的故障检测工具,能够检测到系统中一些特殊的故障。并且,Z2统计量在一定程度上弥*bT由于主状态变量选择错误所带来的误判。在CVA中,砰和re2为由状态变量所构造的两个统计量,两者相互补充。定义k时刻的Z2(尼)为:形(足)=Zd(.|})。Zd(k)(3.42)式中,乃(尼)为利用式(3.02)求得的剩余状态变量。一38— 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法(4)统计量控制限的计算因为我们研究的是非高斯动态数据,所以利用典型变量分析建立状态空间模型时,得到状态变量z(k)也是非高斯的,所以不能利用近似分布的方法求取统计量乎,t2和SPE的控制限碍眦,玩血和斟%以。我们利用直接估计概率密度函数(Probabilitydensityfunction,PDF)的非参数方法求解。核密度估计方法【69-71](Kerneldensityestimation:KDE)最早Martin和Morris在1996年提出的另一种非参数求取置信限的方法,尤其对于单变量随机过程其概率密度函数估计效果更好。由于KDE对变量分布没有要求并且效果较好,所以在工业过程监控领域【70,711得到了广泛的应用。因为巧,t2和SPE统计量的值均大于零,所以我们需要首先对变量进行转换再求取其控制上限。下面介绍利用核密度估计方法求取正变量值置信限为口的控制限。假设随机变量Y>0,首先将有界随机变量Y转换为无界的随机变量x,x=ln(y)。利用KDE算法估计变量x的概率密度函数厂(x),得到随机变量Y概率密度分布函数f(1n(y))/y,计算出变量y的分布函数P(y臻脱)o(雩(尼)>臻舰)e(SPE(k)>%)当F(尼)=l时,故障发生。数据标准化处理+滞后常数d,获得正常工DICA况数据的扩展矩阵x’讨挥+白化处理,求得Q,z0离l快速lcA算法,求得8,∥,sIl线建定义过去和未来输出变量墨(七),弓(七)模⋯.●过LV^程建模标准化处理,得到汉克尔矩阵讳,量i寸稗●对矩阵日奇异值分别,得右奇异矩阵y‘I求取转换矩阵‰,以,以l计算乎,Te2sPE统计量计算乎眦,彳眦,sP‰控制限l在线数据《☆),计算彳(七),弩(七),卵E(七)统计量萋审叫垒}.审图3.2基于子空I司辨识的DICA算法的动态过程性能监控框图Fig.3.2ThedynamicprocessmonitoringschemeoftheSI—DICAmethod3.4本章小结本章主要对DICA算法潜隐变量的动态性进行了证明,然后提出了基于子空间辨识的动态独立元分析(SI—DICA)算法。具体可分为如下三个部分:(1)DICA潜隐变量动态性的证明。主要包括变量自相关性和互相关性的定义和两个重要定理。定理分别为即使在原过程变量相互独立的情况下,扩展得到的过程变量一42. 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法和DICA得到的潜隐变量总是具有相关性,并对其进行了证明。(2)子空间辨识方法典型变量分析的介绍。主要包括同时处理自相关和互相关的动态数据的两种方法时间序列分析方法和状态空间建模方法的介绍;并对状态空间建模的子空间辨识方法中典型变量分析方法进行了详细地介绍及在动态工业过程故障诊断中的应用。(3)本文提出的基于子空间辨识的动态独立元分析方法。主要包括该方法提出的过程及在动态工业过程故障诊断中的实施。..43.. 万方数据东北大学硕士学位论文第3章基于SI—DICA的故障诊断方法一44— 万方数据东北大学硕士学位论文第4章仿真结果及分析4.1多元动态过程的仿真结果分析本文采用Ku[201在95年首次提出后被广泛用于评价动态故障诊断方法[25,27,33均一个简单的多元AR动态过程来验证DPCA和DICA方法潜隐变量动态性对故障诊断的影响。过程描述如下:∽嚣笛翟卜驴[㈡嗽川Iy(后)=z(后)+V(尼)10.8l1—0.226l0.1930.689“(后)。I..I“(k-1)+l—o..1w(k-1)04770415320-0749~I..l一0..1(4.1)(4.2)式中,W是均值为0,方差为1的噪声输入;输出Y为状态变量z加随机噪声v;v的均值为0,方差为0.1;U和Y作为过程变量测量,z和W不测量;k时刻的采样值为x(k)=IY,(后)UT(尼)『∈R4:基于MATLAB构建上述对象,并产生2000个甜和Y的采样数据。其中前1000个采样Y=【Yl,赐,⋯M。。。]。和U=【甜。,“:,⋯U1000】1用于故障诊断方法的训练数据。后1000个采样作为测试数据分析动态故障诊断方法的误警率。利用上述多元动态过程的数据分析DPCA、DICA的动态性对故障诊断的影响。利用Ku文中提到的此动态过程的阶次选为l,即时间滞后时间常数d=l,则用于DPCA和DICAk时刻的采样值为x+(尼)=lY,(尼)blT(尼)Y丁(尼一1)UT(尼一1)『∈R8,主元个数选为5,则扩展的训练数据矩阵为:X+=『roUoZ。n,1。∈R99鲈8。下图4.1为利用Matlab获得的2000组输出Y和输入数据U。下面分别为利用DPCA、DICA和SI—DICA方法表征系统内部主要变化的统计量r2、,2和贮对检测数据的诊断效果图。下图4.2为DPCA的丁2统计量监控图,图4.3为DICA的,2监控图,图中红色横线均表示相应统计量的控制限,置信系数均取ct=0.01。从图4.2可以看出,DPCA的丁2统计量多处存在连续误警,其中有三处出现了连续六点的误警(采样点48—53;149—154;195.201);DICA的,2统计量监控图4.3中也出现了多处连续误警,其中三处出现了连续三点的误警(采样点196—198,201.203,292—294);这正是DPCA和DICA引入的动态性所引起的。下图4.4为利用改进的SI.DICA方法对训练数据进行建模后,r统计量对后1000组采样数据的监控结果,..45.. 万方数据东北大学硕士学位论文第4章仿真结果及分析10;0—1050譬0—500与0一oog0一o020D嫩如仅Ⅺ8[如1疆)0120D140016[淞1ⅨⅪ2Ⅸ习02∞4∞60DⅨ泊1Ⅸ粥120D140016∞{Ⅸ)02[)0015譬10502。D4006【淞8∞10DD1美妁140016∞18∞毯)0002。。嫩泊∞DⅨ淞1∞012∞1∞016∞18∞烈粥00图4.1输入和输出信号Fig.4.1SignalsoftheinputandoutputvariablesDPGAtI1一j:^fIt‘:。fl㈧甄‰§章戥斛离01∞200300400500600713080090010013采样点图4.2DPCA的监控图丁2统计量Fig.4.2MonitoringchartsbasedonDPCAT2statistic图4.3DICA的监控图J『2统计量Fig.4.3MonitoringchartsbasedonDICA,2statistic46 万方数据东北大学硕士学位论文第4章仿真结果及分析5OSl—DlCAJ』:||,.:-:儿-●-].t.●-::_}套翊掣iI陵鼬《_箩瞳一J’-J;r鳓鳢●‘1.,·r●::l1·l。_-..霸鼢‘j铹錾..:。】:●’1鱼II磺.!,i醒洲I骤照明“Ij.}1醋9—11.11{J-马乎ZsPE1.21.91.04.2田纳西一伊斯曼过程(TE)的故障诊断仿真结果分析针对在某些明确已知的故障发生期间从实际的工业过程中采集的数据来验证故障诊断方法的可行性是最为理想的。但对于任何大型工业过程,这类数据是不能公开得..47.. 万方数据东北大学硕士学位论文第4章仿真结果及分析到的。取而代之,许多从事故障诊断研究的学者利用计算机仿真工业过程获得的采集数据进行研究,验证理论方法的可行性。田纳西.伊斯曼(Tennessee—Eastman,TE)过程由Downs和Vogelt721根据Eastman化学公司的实际流程做少许修改在1993年提出,被广泛作为Benchmark来验证所提出的过程故障诊断方法。4.2.1田纳西一伊斯曼过程(TE)实例介绍TE过程是由伊斯曼化学品公司创建的,其目的是为评价过程控制和故障诊断方法提供的一个现实工业过程‘73,74】。它的测试工程是基于一个真实的工业过程的仿真,其中的成分、动力学、运行条件等因为专利的问题都作了修改。TE数据作为比较各种方法的数据源,已在控制、优化、过程监控和故障诊断等研究上己得到了广泛的应用。整个TE过程有四种反应物(A、C、D、E)和两种产物(G和H),还有一种惰性成分B和副产物F。系统中存在的主要化学反应如下:彳(g)+C(g)+D(g)jG(幻)么(g)+C(g)+E(g)---->H(1iq)么(g)+E(g)一F(1iq)3D(g)专2F(幻)式中,g代表气体,,幻代表液体。所有的反应均为是不可逆、放热反应,反应速度取决于温度及反应物的气相浓度。TE过程主要包括五个单元:反应器、冷凝器、压缩机、分离器、汽提塔;包含八种成份:A、B、C、D、E、F、G、H。TE过程主要包括以下几步:气体成分A、C、D、E及惰性成分B(流6)被送入反应器,液态产物G、H在反应器中形成,反应放出的热量通过反应器内的热交换器与冷却水换热而移去,产物和未反应的反应物以气体形式(流7)离开反应器,并在冷凝器中冷却,生成气液两相混合流;进入汽/液分离器进行分离,分离出来的蒸汽通过压缩机重新进入反应器进行反应,为了防止过程中惰性组分和反应副产品的积聚,必须排放一部分(流9);分离器的冷凝成分(流10)主要包括G、H及D、E、F,进入汽提塔,流4用于汽提流10中剩余反应物,这些剩余反应物通过流5与再循环流结合,产物G和H从汽提塔底部流出。根据产物G和H的质量比例,TE过程有六种操作模式,本文中只考虑G/H为50%:50%的基本工况。TE过程的工艺流程图如图4.5所示。一48— 万方数据东北大学硕士学位论文第4章仿真结果及分析I;⋯⋯⋯⋯1⋯1⋯⋯囝图4.5田纳西一伊斯曼过程流程图Fig.4.5AprocessflowsheetoftheTEprocessTE过程包括12个操纵变量(表4.2)和41个测量变量(其中包括22个连续变量和19个成分变量)(表4.3,4.4)。表4.3描述了22个连续变量从XMEAS(1)-XMEAS(22),表4.4中描述了19个成分测量值,从XMEAS(23)-XMEAS(41),成分测量值是从流6、9、11中测量出来的。所有的过程测量值都包含噪声。表4.2过程操纵变量Table4.2Processmanipulatedvariables..49.. 万方数据东北大学硕士学位论文第4章仿真结果及分析XMEAS(23—28)XMEAS(29—36)XMEAS(37-41)成分A.F成分A—H成分D—HTE过程仿真包括21个预设定的故障见表4.5。TE过程仿真程序(可从http://brahms.scs.uiuc.edu一下载)产生用于测试的数据,共有22组训练集和测试集数据,其中包括1组正常运行情况和21组相对应的故障数据。22组数据中的训练集包括480个采样点;测试集包括960个采样点;21个故障数据组相对应的测试集开始运行在正常工况下,在160个点开始引入相应故障。过程变量由41个测量变量和11个操作变量(不包含搅动速度,因为没有对它进行控制)组成m=52个观测变量。在某一特定的时刻观测向量表示为:.50— 万方数据东北大学硕士学位论文第4章仿真结果及分析1234{驾’厂—丌31l‘Ⅲ‘},【—.。。——...——...。....。.。。J,402口D2040491厂—r]3卜叫圈I三如∞02口40101厂—广]D■_—h_一,l——.——J加固02。加18:圃瑚锄020加26加-2002040加锄02040如-200204011—∞.200204012’厂—n。卜“k叫1............................................一∞锄0204013’厂—广]口k___』_w一,l——.——一书-2002040埘-200204015}驾量j苎丑丑{弯{玛:忑,L———.—————j如锄D20加1厂■:广]ok,__鼬-一1【.,...——,......—.........。一如20020∞29如.∞020加371厂]广]o-·_-·业-_·4,l———。——J瑚∞020∞45。厂—r]o-·___-_一,l———.——一铷-20020琊加_加D20d口瑚-200204047。厂—{_]ol--_曲-_一,L———.———。———J-a3-200加4D图4.6TE过程变量自相关系数Fig.4.6Auto—correlationfunctionsplotsofTEprocessvariables书_加D204D三一奎一驾一三一王一匹}‘101tlD,<1D1J1D1J1D,垮胃101z享玛三一三一奎一銮j√1]1√1]11丕一圈一三一§一i}√1]1√13,√1]11,圈一翌一匪一匿]1‘101<1D1J1D1翌一圈一E一匡●i}√}√} 万方数据东北大学硕士学位论文第4章仿真结果及分析TE过程的动态性由5个操作单元的动态模型所组成,每个单元都存在物料平衡、能量平衡和汽.液平衡相对应的微分方程组。由于整个系统各个部分之间耦合严重,高度非线性,且开环不稳定,测量噪声和过程干扰的存在,以及过程的非线性等使得TE过程在稳态动作点时的过程变量不再严格满足正态分布,并存在一定程度的动态性。TE过程的52个测量变量的自相关系数如图4.6所示。4.2.2基于DPCA和DICA的故障诊断仿真结果分析针对数据不再严格满足正态分布,有两种思路:将过程变量按照近似正态分布来处理,应用最多的就是PCA;利用非高斯数据处理方法ICA。针对数据的动态性,有上述两种方法的动态改进DPCA和DICA。下面我们对ICA、DPCA和DICA从故障检测的快速性和灵敏性两方面进行比较。置信度取a=0.01(即误警率为0.01),其中ICA方法的主元个数取9,DPCA和DICA的滞后时间常数d=2,主元个数取22[751。表4.6TE过程监控方法的故障检测率Table4.6DetectionratesofeachmonitoringmethodintheTEprocessTE过程故障检测的灵敏性是用故障检测率表示,即故障检测数据中超出统计量控.52— 万方数据东北大学硕士学位论文第4章仿真结果及分析制限的采样点数与实际引入故障后采样总点数之比。DPCA、ICA、和DICA方法的统计量对21种故障的故障检测率分别计算并列于表4.6中,其中粗体数字分别表示三种方法故障检测率最高的统计量,下划线数字则表示所有统计量中对相应故障的检测率最高的统计量,由于故障3,9,15对整个过程的影响几乎没有影响,所以所有方法对其的故障检测率都很低,下述比较时不予考虑。从表4.6故障检测率数据值可以得出以下几个结论:(1)甚至对于故障1,2,4,5,10,12,16,19,20,21,ICA的故障检测率均高于DPCA;尤其对于故障5,lO,16,19,20,ICA的故障检测率几乎达到了DPCA的两倍,由此可得ICA能够检测一些DPCA很难检测的小故障;(2)对TE过程21中故障的所有仿真结果比较可以看出,DICA的统计量均具有最高的故障检测率。因为DICA不但能够提取出表示过程重要信息的变量,而且考虑了过程的动态性。下面以故障5为例,上述三种方法的故障诊断结果分别如图4.7,4.8和4.9所示。DPCA方法的故障诊断结果如图4.7,图中分别为丁2和SPE统计量的故障诊断图,ICA和DICA方法的故障诊断结果如图4.8和4.9,图中分别为统计量,2、r和SPE的监控图。故障5对整个工况的具体影响过程描述如下。冷凝器冷却水入口温度发生阶跃变化,从冷凝器到分离器的输出流速增加,导致分离器内的温度和分离器冷却水的输出口温度增加。因此,控制环将调整压缩机,使分离器的温度回到它的设置点。将整个过程重新调整到稳态值大约花费200点采样At73](OlJ360采样点左右系统再次回到稳态值)。实际上,尽管经过一定的内部调整后,大部分的过程变量回到了他们的稳态值,但是冷凝器冷却水的入口温度和流速仍然高于正常工况的稳态值,即在360个采样点后仍然存在故障。从监控图4.7可以得到,DPCA能够在大约160个采样点检测到故障,但是在引入故障大约200个点即大部分过程变量回到稳态值之后,基于DPCA的故障诊断方法的统计量也回到了控制限以下,不再能检测出故障。然而,图4.8和4.9所示的ICA和DICA方法的故障诊断图可知,在大约160个采样点检测出故障之后,其统计量一直在控制限以上,即能检测出工业过程中一直存在故障。因为ICA利用数据高阶统计量的信息,能够提取隐藏在过程数据中的重要信息,从而一直检测到冷却水温度对过程的影响。持续超限的统计量将提醒工业过程一直运行在菲正常工况下。因此,对于过程中一些利用DPCA方法比较难检测的小故障,ICA和DICA方法的故障诊断效果更好。.53— 万方数据东北大学硕士学位论文第4章仿真结果及分析-3002502∞拦150∞1∞500山皿∞SampleTime满‰‰聊悔幅晰嘛慨勰;01∞41305006[船7{[)D8D0Ⅸ玎1Ⅸ玎SampteNumbet图4.7DPCA对故障5的监控图Fig.4.7MonitoringchartsbasedonDPCAoffault5SampieNumbetSa丌lpieNumbet图4.8ICA对故障5的监控图Fig.4.8MonitoringchartsbasedonICAoffault554 万方数据东北大学硕士学位论文第4章仿真结果及分析图4.9DICA对故障5的监控图Fig.4.9MonitoringchartsbasedonDICAoffault5因为误警率是不可避免的,超限的统计量表明可能存在故障或者是误警。为了降低误警率,我们定义一个窗口,当超过窗口宽度的连续几个统计量的值都超出控制限时,认为是有故障发生mJ。本文中,我们定义窗口宽度为8,检测出故障的起始点定义为第一个有连续8个统计量超出控制限的点。假设a=0.01,则相应的实际误警率将减小为0.018=1×10J6。三种故障诊断方法对21种故障的起始检测点列于表4.7中,其中粗体数字分别表示四种方法起始检测点最小的统计量,即最早检测出故障的统计量;下划线数字则表示所有统计量中最早检测出故障的统计量;“.”表示相应统计量在窗口宽度为8时,未能检测出相应故障。由于故障3,9,15对整个过程几乎没有影响,当定义窗口宽度后,下述方法基本上都不能检测到这三种故障的起始点位置,所以下述不予考虑。从表4.7数据可以得出以下几个结论:(1)除了故障1l,14,ICA较DPCA能够更早的检测出故障;(2)所有方法比较中,DICA方法的统计量均能够较早检测出故障。综上,从故障检测的快速性方面,基于DICA的故障诊断方法统计量起始检测点最小,即检测延迟最小,当系统发生故障后,能够最早的检测出故障发生。.55. 万方数据东北大学硕士学位论文第4章仿真结果及分析综上所述,对具有动态特性非严格正态数据,基于DICA的故障诊断方法比基于DPCA的故障诊断方法的灵敏性和快速性更好,尤其对于一些过程比较难检测的小故障。4.2.3基于SI—DICA的故障诊断仿真结果分析从上一节可知,TE过程可以用于检测数据具有动态非高斯性时故障诊断方法的工业过程故障诊断效果。针对DICA中存在的问题以及子空间辨识方法中典型变量分析方法在动态数据处理上的优点,本文提出了基于子空间辨识的动态独立元分析(SI.DICA)的故障诊断方法。下面分别从故障检测的鲁棒性、灵敏性及快速性方面,对DICA和SI—DICA两种故障诊断方法对TE过程21个故障的检测效果进行分析。(1)鲁棒性鲁棒性利用误警率来表示。在TE过程中,误警率是通过正常工况下测试数据的故障检测率来表示。在实际工业过程中,鲁棒性是一个很重要的考虑方面,尽管在很多评价故障检测方法的文章中经常被忽略。并且通过误警率的计算和比较,来确定求取统计量控制限时所基于的置信度a=0.01。一56. 万方数据东北大学硕士学位论文第4章仿真结果及分析其中,DICA的滞后时间常数d=3,SI.DICA中q=3,两种方法的主元个数均取26[6|,取置信度a=0.01(即假设误警率为0.01时,求取统计量的控制限)。下面分别利用DICA和SI—DICA方法表征系统内部主要变化的统计量,2和Z对fault0检测数据的诊断效果图。图4.10为DICA的,2统计量故障诊断图,图4.11为SI—DICA的乎统计量故障诊断图,图中红色横线均表示相应统计量的控制限。从图中可以看出,DICA的J2统计量诊断图存在多处存在连续误警,其误警点数多,误警率高;而SI—DICA贮统计量诊断图避免了连续误警的出现,超限的采样点数少,其误警率明显比DICA小。表4.8列出了DICA和SI.DICA各个统计量对TEfault0训练和检测数据的误警率。nlG盎图4.10DICA对故障0的监控图,2统计量Fig.4.10MonitoringchartsbasedonDICAoffault012statisticSl—DlCA采样点图4.11SI-DICA对故障0的监控图T。t.统计量Fig.4.11MonitoringchartsbasedonSI.DICAoffault0T,r2statistic.57— 万方数据东北大学硕士学位论文第4章仿真结果及分析从表4.8训练数据的误警率可知,表征系统内部主要变化的统计量SI.DICA方法的砰统计量的误警率明显比DICA方法,2统计量的误警率小,表明状态空间模型能够有效地表示DICA潜隐变量的动态性,降低误警率。另外由于DICA的SPE统计量和SI-DICA的P、s船统计量的误警率在0.01左右,DICA的J2和J?统计量和SI-DICA的Z统计量的误警率均远远大于0.01,相差很大。为保证下面公平的评价各个方法统计量的故障诊断效果,我们利用上一节提出的方法对故障诊断方法统计量的控制限进行调整,调整后的误警率如上表所示,从而保证每个监控统计量的误警率在0.01左右。(2)灵敏性故障诊断方法统计量的灵敏性是反应统计量对过程可能故障的敏感性,是检测故障方法的一个重要指标。TE过程21个故障的检测数据都是在160个采样点引入故障,共960个采样点,故实际故障采样点数为800。设采样点160之后统计量超出控制限的点数为胛向。打,则该统计量的故障检测率为以删,/800。DICA和SI—DICA故障诊断方法的统计量对21种故障的故障检测率分别计算列于表4.9中,其中粗体数字分别表示两种方法故障检测率最高的统计量,下划线数字则表示所有统计量中对相应故障的检测率最高的统计量。从表4.9故障检测率数据可以得出以下几个结论:(1)DICA和SI—DICA两种故障诊断方法的故障检测率较表4.9中DPCA、ICA都很高;(2)两种故障诊断方法,都是表示系统内部剩余主变量所构成剩余空间的统计量的故障检测率最高;DICA的,?统计量;SI.DICA的牙统计量;(3)对TE过程21中故障的所有仿真结果比较可以看出,SI.DICA的故障检测率均高于或等于DICA。利用表示DICA潜隐变量的动态性,进行建模能够在避免连续误警,减小误警率,增强鲁棒性的条件下,在一定程度上提高故障检测率,增强对异常工况的敏感度。.58. 万方数据东北大学硕士学位论文第4章仿真结果及分析(3)快速性统计量的另一个重要指标就是检测出工业过程可能故障的快速性。利用故障延迟来表示,即统计量检测出故障的起始采样点与实际引入故障的采样点之差。本文利用起始检测点来表示。同样为了降低统计量的误警率,采用窗口宽度为8即当连续8个统计量的值超过控制限的首个采样点作为检测出故障的起始点,则相应的实际误警率将减小为0.018=1X10。16。21种故障统计量的起始检测点列于表4.10中,其中粗体数字分别表示两种方法起始检测点最小的统计量,即最早检测出故障的统计量;下划线数字则表示所有统计量中最早检测出故障的统计量;“一”表示相应统计量在窗口宽度为8时,未能检测出相应故障。从表4.10中可以看出,两种方法均能较早的检测出故障,对于大部分故障,SI.DICA比DICA的起始检测点小,即检测延迟最小,当系统发生故障后,能够最早的检测出故障发生。.59. 万方数据东北大学硕士学位论文第4章仿真结果及分析表4.10TE过程监控方法的起始检测点Table4.10TheinitialtestingpointofmonitoringmethodintheTEprocess(4_)故障19的监控结果为了更直观的比较DICA和SI.DICA的故障诊断效果,下面以故障19为例。故障19的故障诊断结果如图4.12和4.13所示。图中蓝色横线均为相应统计量的控制限。从图4.12可以看出:尽管DICA的,2、r和SPE统计量均能够在大约160采样点检测出故障,但是在检测出故障之后,DICA的SPE统计量的值大部分在控制限以下,给出错误的诊断结果。相比较而言,从图4.13可以看出,SI.DICA的乎,牙和SPE统计量在160个采样点左右检测出未知故障发生以后,其统计量的值一直保持在控制限以上,三个统计量均检测出工况发生异常,在一定程度上比仅仅某一个或者两个统计量检测出故障更具有可信度。为保证较小误警率本文选择窗口宽度为8来计算各个统计量的起始检测点的情况下,SI—DICA故障诊断方法各个统计量的起始检测点分别为:r在161采样点,贮和SPE在171个采样点检测出故障;DICA的起始检测点分别为:r在161采样点,,2在172个采样点和SPE在228个采样点检测出故障。由此我们可以得出,利用SI.DICA方法的三个统计量进行故障诊断可以更早、更确定工况在171个采样点发生了故障,并且其故障检测率较DICA更高。一60— 万方数据东北大学硕士学位论文第4章仿真结果及分析Cq∞山皿∞c、Lt--N∞:1--SampleNumher图4.12DICA对故障19的监控图Fig.4.12MonitoringchartsbasedOilDICAoffault19Sl—D}CASampieNurober山m£0SarflpieNUtBber图4.13SI—DICA对故障19的监控图Fig.4.13MonitoringchartsbasedonSI—DICAoffault19综上所述,对于DICA潜隐变量进行子空间辨识建模所提出的改进方法SI—DICA对于正常工况中存在的某些异常点具有较好的鲁棒性,并且在保证具有较小的误警率一61. 万方数据东北大学硕士学位论文第4章仿真结果及分析的情况下,对工业过程的异常工况更敏感,更够快速地检测出异常工况的起始点。通过TE过程的故障诊断方法的仿真分析,从鲁棒性、灵敏性和快速性三方面验证了本文提出的SI'DICA故障诊断方法具有较好的故障诊断效果。4.3本章小结本章主要从对两个多元动态过程的故障诊断监控效果来分析比较DICA和SI.DICA两种故障诊断方法的有效性,主要内容概括如下。(1)一个简单的多元动态过程的仿真研究。介绍了多元动态过程的构造过程;并利用DPCA和DICA方法分别对该过程进行监控,计算其误警率情况,验证了DICA和DPCA方法会造成连续误警;并且本文提出的SI.DICA方法避免了连续误警现象,并且减小了误警率。(2)TE过程的介绍和典型故障的仿真研究。TE过程工艺和典型故障进行了介绍;首先对DPCA、DICA、ICA三种方法对TE过程21个故障的故障检测率和检测延迟两方面进行了比较,并对故障5的诊断图进行了详细分析,说明了动态改进方法相对于传统多元统计过程控制方法的优越性,及DICA相比于DPCA在检Nd,故障方面的优越性;然后对CVA、DICA、SI—DICA三种方法的TE过程故障诊断效果进行了比较并对故障19的诊断图进行了详细的分析比较,从鲁棒性、灵敏性和快速性三方面说明了SI.DICA故障诊断方法的有效性,及相比于DICA、CVA的优越性。一62— 万方数据东北大学硕士学位论文第5章总结与展望5.1总结工业过程一般都具有规模较大、复杂度高,且不确定因素多,所以很难建立精确的过程模型及故障模型。本文研究是基于数据驱动的动态故障诊断方法方法,属于多变量统计过程控SJJ(MSPC)领域。MSPC方法是一类先对历史数据进行离线建模分析然后对在线数据进行实时监控的故障诊断方法,能够切实有效的评估工业过程的运行状态并进行故障检测和识别。但是工业过程本身惯性环节、储能环节的存在、反馈控制的应用、过程干扰、以及采样间隔较短和测量噪声的存在等特点,使得过程变量的采样数据往往具有与时间相关的动态性。本文从多元统计方法动态改进故障诊断方法中理论完善、应用较广的DPCA、DICA入手,针对动态数据的非高斯性,DICA方法诊断效果较好,但是针对DICA得到潜隐变量的动态性,使得出现了连续误警的现象,故本文提出了子空间辨识和DICA相结合的SI—DICA算法,通过简单的多元过程和实际TE工业过程研究了该方法的故障诊断效果,这也是本文研究过程的主体思路。本文的研究内容和主要贡献如下:(1)总结了动态故障诊断的研究现状:详细介绍了工业过程采样数据动态性的产生原因和影响;并从传统MSPC方法应用于动态数据时故障诊断方法改进的发展过程进行了介绍,总结了其动态改进的几个主要方面。(2)对动态改进故障诊断方法DPCA和DICA做了详细介绍,从异同点分别进行了比较;并理论证明两种方法潜隐变量的相关性和仿真验证了两种方法会造成连续误警的现象。并且利用田纳西.伊斯曼过程(TE)的典型故障证明了与DPCA相比,DICA在检测动态工业过程小故障方面的有效性。(3)提出了子空间辨识和DICA相结合的SI—DICA故障诊断方法。该方法利用对DICA得到的港隐变量进一步利用子空间辨识方法典型变量分析(CVA)辨识状态空间模型,不仅提高了故障检测率,降低了故障延迟,而且降低了误警率,不会出现连续误警的情况。通过对TE典型故障的仿真研究,验证了改进方法的有效性。但是,本文由于DICA求取潜隐变量的时间复杂度较大,所以SI.DICA的时间复杂度也比较大。由于子空间辨识方法CVA的时间复杂度很小,所以SI.DICA和DICA的时间复杂度相当。另外由于时间原因,本文只是实现了该方法对故障的检测,所以可以进一步实现该方法对故障的识别。另外针对由于机器老化等原因,使得模型会缓.63. 万方数据东北大学硕士学位论文第5章总结与展望慢变化,所以对该方法实现在线自适应,完成模型的实时更新,能够更精确的检测工业过程的故障,降低误警率。5.2展望本文是从数据的动态性对工业过程故障诊断方法进行了研究。但是实际的工业过程一般还包括非线性、变量耦合、多模态、多时段、大规模和间歇性等复杂的特性,虽然现在的文献对各个方面均分别进行了比较深入的研究,但是同时考虑到多个数据特性的故障诊断方法的文献比较少,为了更准确、高效、快速的对工业过程进行性能监控,同时考虑数据的多个特性的故障诊断方法的研究是故障诊断领域一个重要的研究方向。另外,在线模型更新的自适应故障诊断也是故障诊断领域的一个发展方向,因为该技术能有效的适应实际工业过程的时变过程,降低所建立的模型随工业过程状态改变而引起的偏差所造成的误警率,能够进一步提高故障诊断的精度,满足实际工业过程应用的需求。针对本文仅考虑数据动态性的情况下,将模型的在线实时更新考虑进去,提出自适应的动态工业过程故障诊断方法是一个重要的发展方向。综上所述,从复杂工业过程故障诊断的有效性方面,能够同时考虑模型的在线更新和过程数据的多个特点的故障诊断方法的研究是应用于实际工业过程进行性能监控的迫切需要。在以预测技术为核心的故障诊断方法研究逐渐完善的过程中,预测与健康管理(PrognosticsandHealthManagement,PHM)技术被提出,在美英等军事强国得到了越来越多的重视和应用【7引。PHM技术代表了一种方法的转变,即从传统的基于传感器的诊断转向基于智能系统的预测,从被动的通信转向主动性的3Rs(NJ在准确的时间对准确的部位采取正确的维修活动)【76】,将传统的定期维修过渡到视情维修【77I。下面分别就国内外的发展做简要概述。PHM技术已经在航空航天、飞机、船舰、核反应堆、军事领域获得应用,在电子、汽车、船舶等领域应用开始不断增加。目前,国外航天器PHM技术已经形成了基本完善的理论方法体系,并实现了部分工程应用‘78,791。各国各军均在进行针对具体应用的与PHM类似的技术开发项目,如美国B.2轰炸机和全球鹰无人机和NASA第2代可重复使用运载器的飞行器综合健康管理系统;英国国防部为未来山猫直升机开发和史密斯航宇公司所达成的协议掣801。而我国主要是以研究所和高校为主体,对PHM的研究目前仍处于起步和探索阶段,在理论研究方面较多,工程应用较岁7引。..64.. 万方数据东北大学硕士学位论文参考文献1.马贺贺.基于数据驱动的复杂工业过程故障检测方法研究[D],华东理工大学,2013.2.吴洪艳,高国宏.基于数据驱动的工业过程故障诊断综述[J],科技广场,2010,6:67—69.3.陆雪梅,尚群立.动态控制系统的故障诊断方法综述[J],机电工程,2008,25(6):103.107.4.李龙.基于动态主元分析的自适应故障诊断方法研究【D】,沈阳:东北大学,2012.5.郭明.基于数据驱动的流程工业性能监控与故障诊断研究[D】,博士论文,杭州:浙江大学,2004.6.RussellEL,ChiangLH,BraatzRD.Faultdetectioninindustrialprocessesusingcanonicalvariateanalysisanddynamicprincipalcomponentanalysis[J],ChemometricsandIntelligentLaboratorySystems,2000,51(1):81-93.7.刘强,柴天佑,赵立杰.基于数据和知识的工业过程监视及故障诊断综述[J],控制与决策,2010,25(6):801.807.8.刘育明.动态过程数据的多变量统计监控方法研究【D】,浙江大学,2006.9.TreasureRJ,KrugerU,CooperJE.Dynamicmultivariatestatisticalprocesscontrolusingsubspaceidentification[J】,JournalofProcessControl,2004,14(3):279—292.10.OdioweiPEP.CaoYNonlineardynamicprocessmonitoringusingcanonicalvariateanalysisandkerneldensityestimations[J】,IndustrialInformatics,IEEETransactionson,2010,6(1):36—45.11.JacksonJE.Principalcomponentsandfactoranalysis:partI-principalcomponents[J],JournalofQualityTechnology,1980,12(4):201—213.12.PearsonK.LIII.Onlinesandplanesofclosestfittosystemsofpointsinspace[J],TheLondon,Edinburgh,andDublinPhilosophicalMagazineandJournalofScience,1901,2(111:559—572.13.赵永健.独立分量分析算法及其在信号处理中的应用研究[D],山东大学,2012.14.郭辉.基于ICA的工业过程监控研究[D】,北京化工大学,2006.15.ChiangLH,RussellEL,BraatzRD.FaultdiagnosisinchemicalprocessesusingFisherdiscriminantanalysis,discriminantpartialleastsquares,andprincipalcomponentanalysis[J】,Chemometricsandintelligentlaboratorysystems,2000,50(2):.6S一 万方数据东北大学硕士学位论文参考文献243-252.16.黄贤源.基于现代时间序列分析的动态数据处理方法研究[D】,解放军信息工程大学,2008.17.安鸿志.现代数学手册第四册第13篇一时问序列分析[D],武汉:华中科技大学出版社,1998.18.田铮.动态数据处理的理论与方法一时间序列分析[D],西安:西北工业大学出版社,1995.19.汪荣鑫.随机过程[D】,诬安:西安交通大学出版社,1987.20.KuWjStorerRH,GeorgakisC.Disturbancedetectionandisolationbydynamicprincipalcomponentanalysis【J],Chemometricsandintelligentlaboratorysystems,1995,30(1):179-196.21.TsungEStatisticalmonitoringanddiagnosisofautomaticcontrolledprocessesusingdynamicPCA【J】,IntemationalJournalofProductionResearch,2000,38(3):625-637.22.何慧娟,陈健,邹宇华.基于DPCA方法的传感器故障检测与诊断[J】,传感器与微系统,2009,28(12):35.38.23.LeeGYoonES.Multiple—faultdiagnosisusingdynamicPLSbuiltonqualitativerelations[J],ComputerAidedChemicalEngineering,2003,14:443-448.24.吕燕.基于动态PLS方法的建模及预测控制器设计[D】,浙江大学,2013.25.LeeJM,YooCK,LeeIB.StatisticalmonitoringofdynamicprocessesbasedondynamiCindependentcomponentanalysis[J】,Chemicalengineeringscience,2004,59(14):2995—3006.26.HsuCC,ChenMC,ChenLS.Anovelprocessmomtofingapproachwithdynamicindependentcomponentanalysis[J】,ControlEngineeringPractice,2010,18(3):242.253.27.KrugerU,ZhouFIrwinG彤Improvedprincipalcomponentmonitoringoflarge—scaleprocesses[J】,JournalofProcessControl,2004,14(8):879-888.28.TreasureRJ,KrugerU,CooperJE.Dynamicmultivariatestatisticalprocesscontrolusingsubspaceidentification【J],JournalofProcessControl,2004,14(3):279—292.29.杨华.基于子空间方法的系统辨识及预测控制设计[D】,上海:上海交通大学,2007.30.RussellEL,ChiangLH,BraatzRD.Faultdetectioninindustrialprocessesusingcanonicalvariateanalysisanddynamicprincipalcomponentanalysis[J】,ChemometricsandIntelligentLaboratorySystems,2000,51(1):81—93.一66— 万方数据东北大学硕士学位论文参考文献31.LarimoreWE.Systemidentification,reduced-orderfilteringandmodelingviacanonicalvariateanalysis[C】,AmericanControlConference,1983.IEEE,1983:445.451.32.WidodoA,YangBS,HanT.Combinationofindependentcomponentanalysisandsupportvectormachinesforintelligentfaultsdiagnosisofinductionmotors[J】,ExpertSystemswithApplications,2007,32(2):299-312.33.谢磊.间歇过程统计性能监控研究[D],浙江大学,2005.34.OdioweiPP.CaoYState-spaceindependentcomponentanalysisfornonlineardynamicprocessmonitoring[J],ChemometricsandIntelligentlaboratorysystems,2010,103(1):59.65.35.张利萍,张姬,杨青.小波动态PCA在过程监控中的应用[J],沈阳农业大学学报,2012,43(1):120-122.36.石怀涛,刘建昌,丁晓迪.基于混合动态主元分析的故障检测方法[J】,控制工程,2012,19(001):148—151.37.FanJ.WangYFaultdetectionanddiagnosisofnon—linearnon-Gaussiandynamicprocessesusingkerneldynamicindependentcomponentanalysis[J】,InformationSciences,2014,259:369—379.38.JolliffeI.Principalcomponentanalysis[M】,JohnWiley&SonsLtd,2005.39。MooreB.Principalcomponentanalysisinlinearsysterns:Controllability,observability,andmodelreduction[J】,AutomaticControl,IEEETransactionson,1981,26(1):17-32.40.JacksonJE,MudholkarGS.Controlproceduresforresidualsassociatedwithprincipalcomponentanalysis[J】,Technometrics,1979,2l(3):341—349.41.StefatosGBenHamzaA.Dynamicindependentcomponentanalysisapproachforfaultdetectionanddiagnosis【J】,ExpertSystemswithApplications,2010,37(12):8606.8617.42.ComonEIndependentcomponentanalysis,anewconcept[J】,Signalprocessing,1994,36(3):287-314.43.何宁.基于ICA.PCA方法的流程工业过程监控与故障诊断研究【D】,浙江大学,2004.44.HyvSxinenA,KarhunenJ,OjaE.Independentcomponentanalysis【M】,JohnWiley&Sons,2004.一67. 万方数据东北大学硕士学位论文参考文献45.HastieT,TibshiraniR,FriedmanJ,eta1.Theelementsofstatisticallearning[M】,NewYork:Springer,2009.46.Hyv£irinenA,OjaE.Independentcomponentanalysis:algorithmsandapplications[JJ,Neuralnetworks,2000,13(4):411-430.47.EspositoF,FormisanoE,SeifritzE,eta1.SpatiNindependentcomponentanalysisoffunctionalMRItime—series:Towhatextentdoresultsdependonthealgorithmused[J】,Humanbrainmapping,2002,16(3):146—157.48.HyvarinenA.Fastandrobustfixed—pointalgorithmsforindependentcomponentanalysis【J】,NeuralNetworks,IEEETransactionson,1999,1O(3):626-634.49.HyvarinenA.Surveyonindependentcomponentanalysis[J],Neuralcomputingsurveys,1999,2(4):94—128.50.LiRF.WangXZ.Dimensionreductionofprocessdynamictrendsusingindependentcomponentanalysis[J】,Computers&chemicalengineering,2002,26(3):467-473.51.LeeJM,YooCK,LeeIB.Statisticalprocessmonitoringwithindependentcomponentanalysis[J】,JoumalofProcessControl,2004,14(5):467.485.52.ChenQ,WyrmeRJ,GouldingP,eta1.Theapplicationofprincipalcomponentanalysisandkemeldensityestimationtoenhanceprocessmonitoring[J],ControlEngineeringPractice,2000,8(5):531-543.53.董言治,刘松涛,尉志苹.基于Matlab的时间序列分析和动态数据建模[J],计算机工程,2003,29(12):170.172.54.BoxGEP,JenkinsGM,ReinselGC.Timeseriesanalysis:forecastingandcontrol[M】,JohnWiley&Sons.2013.55.LjungL.SystemIdentification:Theoryfortheuser,PTRprenticehallinformationandsystemsciencesseries[J】,1999.56.LjungL.SystemidentificationtoolboxforusewithMATLAB【J】,2007.57.SimoglouA,MartinEB,MorrisAJ.Statisticalperformancemonitoringofdynamicmultivariateprocessesusingstatespacemodelling【J】,Computers&chemicalengineering,2002,26(6):909-920.58.NegizA,GlinarA.Statisticalmonitoringofmultivariabledynamicprocesseswithstate‘spacemodels[J】,AIChEJournal,1997,43(8):2002—2020.59.VanOverscheeP,DeMoorB.Subspaceidentificationforlinearsystems:theory,一68— 万方数据东北大学硕士学位论文参考文献implementation,applications[J],Status:published,1996.60.何熠.基于支持向量机的非线性系统辨识建模与控制[D】,天津大学,2007.61.曾九孙.高炉冶炼过程的子空间辨识、预测及控制[D],浙江大学,2009.62.孙传伟.直升机飞行动力学模型与飞行品质评估[D],南京航空航天大学,2002.63.LarimoreW.E.Systemidentificationreducedorderfilteringandmodelingviacanonicalcorrelationanalysis【J],ProceedingsoftheAmericanControlConference,1983,445.64.NegizA,CinarA,P1.Balancedandcanonicalvariaterealizationtechniquesforidentifyingvarmamodelsinstatespace[J】,ChemometricsandIntelligentLaboratorySystems,1997,38:209-221.65.NegizA,CinarA.Monitoringofmultivariabledynamicprocessesandsensorauditing[J】,JournalofProcessControl,1998,8(56):357—380.66.ChiangL.H,RussellE.L,BraatzR.D.FaultdetectionanddiagnosiSinindustrialsystems[J],Springer,London,2001.67.A.Simouglou,E.B.Martin,A.J.Morris,Statisticalperformancemonitoringofdynamicmultivariateprocessesusingstatespacemodelling[J】,ComputersandChemicalEngineering,2002,26:909-920.68.VanOverscheeE,DeMoorB.N4SID:subspacealgorithmsfortheidentificationofcombineddeterministic-stochasticsystems【J],Automation,1994,30(1):75—93.69.MartinEB,MorrisAJ.Non—parametricconfidenceboundsforprocessperformancemonitoringcharts[J],JournalofProcessControl,1996,6(6):349-358.70.ChenQ,GouldingP,SandozD,eta1.Theapplicationofkerneldensityestimatestoconditionmonitoringforprocessindustries[C】,IEEEAmericanControlConference1998.6:3312—3316.71.ShenX,AgrawalS.KernelDensityEstimationforAnAnomalyBasedIntrusionDetectionSystem[C】,MLMTA.2006:161—167.72.DownsJJ,VogelEF.Aplant—wideindustrialprocesscontrolproblem[J】,Computers&ChemicalEngineering,1993,l7(3):245—255。73.ChiangLH,BraatzRD,RussellEL.Faultdetectionanddiagnosisinindustrialsystems[M],Springer,2001.74.PearsonK.LIII.Onlinesandplanesofclosestfittosystemsofpointsinspace【J】,TheLondon,Edinburgh,andDublinPhilosophicalMagazineandJournalofScience,1901,.69— 万方数据东北大学硕士学位论文参考文献2(111:559。572.75.StefatosGBenHamzaA.Dynamicindependentcomponentanalysisapproachforfaultdetectionanddiagnosis[J】,ExpertSystemswithApplications,2010,37(12):8606.8617.76.朱辉.航天器故障诊断、预测与健康管理探讨[J],质量与可靠性,2013,2:15.19.77.王绪智,张宝珍.国外PHM技术的发展动态及经验教gJIl[cJ,航空试验测试技术学术交流会论文集,2010.78.罗荣蒸,孙波,张雷.航天器预测与健康管理技术研究[J】,航天器工程,2013,22(4):95-102.79.BrownER,McCollomNN.Prognosticsandhealthman—agementadata.drivenapproachtosupportingtheF-35lightningII[C],IEEEAerospaceConferenceProceeding,2007.80.尉询楷,冯悦,刘芳.航空发动机健康管理系统架构研究[C】,探索.创新.交流——第五届中国航空学会青年科技论坛文集(第5集),2012..70. 万方数据东北大学硕士学位论文致谢两年的研究生生活即将结束,至此二十几年的学生生涯也即将画上句号。两年前,仅仅是为了证明自己的能力这个理由,经过努力终于如愿以偿的考上了双控专业遥遥领先的东北大学,荣幸地成为了谭老师的学生;现在,终于经过多番努力,完成了自己硕士期间的课题,等待各位老师的检阅。虽然是短短的两年,但是想到不久就要离开这个已经熟悉的城市,已经爱上的校园,已经习惯的宿舍、实验室、食堂三点一线的生活,涌上心头的是不舍和感激。感激两年成长道路上,迷茫时,导师细心的指导;无助时,朋友伸出的双手;低谷时,父母鼓励的话语;孤单时,行人投来的微笑。在此,真心的感谢你们,感谢所有在我人生重要时间点给予支持和鼓励的你们。衷心感谢我的指导教师谭树彬副教授。我的课题研究从选题、开题、论证研究、仿真分析到论文指导,无不渗透着您的智慧、知识和心血。实验室不仅给我们提供了较好的学习环境,还给我们提供了宝贵的985学习平台。从研一开始,每周一次的口头或者PPT汇报,在老师了解我们研究进度的同时,也时刻提醒和鞭策着我们学术研究要有严谨认真的学习态度,持之以恒的探索精神;并且锻炼了我们做PPT,讲PPT的语言表达能力、临场发挥能力等。谭老师不仅在学术研究上给予我指导和帮助,在生活上也给予我们关心和爱护。在此,我向谭老师表示衷心的感谢和崇高的敬意。另外,谭老师严谨求实的治学态度、任劳任怨的工作热情、诲人不倦的师者风范、高瞻远瞩的洞察能力,深深地影响着我、鞭策着我、激励着我在人生中不断进取,为我以后走上工作岗位奠定了一定的基础。在这里,我衷心祝愿谭老师工作顺利,身心健康,家庭幸福!衷心感谢和我一起奋斗在实验室的兄弟姐妹们。感谢王扉、邢军华、董佳、陈楠、杨扬师兄师姐们在我刚入实验室时,给予我们耐心的指导和生活上的照顾。仍记得初入实验室时,邢哥忙前忙后的身影;仍记得初见佳姐时,给我找了个靠里面的座位,在寒冷的冬天让我感受到了实验室的温暖;他们对我关心的点点滴滴让我初次感受到了熟悉。感谢张长平、王战东、严彪、金阳、刘鑫、魏晓辉、杨博宇、聂新雨、焦玺晓、何永建、杨永宽、鲁旺、聂晓音、赵庆虎、刘洋、于晓飞等在科研和生活上给予我的所有鼓励和帮助。感谢常在我迷茫时给我指明方向的长平、东哥和彪哥,感谢在我无助时给予我宽慰的阳哥、雨哥和晓辉,感谢在我学习过程中给予我帮助的鑫姐、博宇、晓哥等等,感谢在这里无法意义提及的那些点点滴滴⋯⋯我们之间有太多太多的回忆在这里真的无法一一列举,感谢你们两年的陪伴,是你们点亮了我硕士期间的生活,促使我前行。在这里,衷心希望你们能够在以后的人生道路上越走越远,完成自己的梦想!诚心感谢这两年中与我朝夕相处的寝室同学王莲花、王楠和王虹菲。感谢这两年来.71— 万方数据东北大学硕士学位论文致谢你们在生活上对我的照顾;在我情绪低谷时,促膝到深夜对我的开导;在我生病时,陪我去医院。一起笑过、一起哭过、一起经历的点点滴滴给我留下了太多的回忆。无论今后我们身处何方,我都会遥祝三位一直美美的,幸福美满,前程锦绣!在此,必须要感谢的就是在我的学习生涯中,一直陪伴我的父母。从小在你们无微不至的关爱下长大,为了给我和弟弟更好的生活条件,你们任劳任怨的忙碌;为了给我们交学费,你们起早贪黑的劳作。每次提到你们,我心里都会一阵酸楚。我们不在家时都不舍得炒一个菜;买东西时为了几毛钱在讨价还价;你们在家省吃俭用就是为了能在我们回学校时多给我们噻几百块钱。还记得高中的一个下雪天,爸爸骑着自行车在结冰的路上滑倒很多次来给我送棉鞋,在爸爸眼里,路人的嘲笑等等都比上自己女儿不被冻到,爸爸像往常一样嘱咐我“想吃啥吃啥,别不舍得花钱,爸妈挣钱就是给你们花的”。不善言辞的爸妈,每次的叮咛都是这几句话,爸爸的爱无声,却时常响彻在耳边;妈妈的爱无形,却时常温暖在心间。请父母放心,女儿一定会继续努力,不辜负你们对我们的期望。希望我们不在身边时,你们一定要照顾好自己的身体,祝你们安康。还有,对参加评阅和答辩的各位老师致以诚挚的谢意。需要感谢的人还有太多太多,我无法一一去表达。最后感谢东北大学在我人生最重要的时刻给了我最灿烂的回忆,感谢每一寸热土留下我忙碌的足迹。一72—

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
大家都在看
近期热门
关闭