基于数据挖掘技术的财务风险分析与预警研究 (1)

基于数据挖掘技术的财务风险分析与预警研究 (1)

ID:32391262

大小:16.48 MB

页数:128页

时间:2019-02-04

上传者:U-22505
基于数据挖掘技术的财务风险分析与预警研究 (1)_第1页
基于数据挖掘技术的财务风险分析与预警研究 (1)_第2页
基于数据挖掘技术的财务风险分析与预警研究 (1)_第3页
基于数据挖掘技术的财务风险分析与预警研究 (1)_第4页
基于数据挖掘技术的财务风险分析与预警研究 (1)_第5页
资源描述:

《基于数据挖掘技术的财务风险分析与预警研究 (1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

北京聋匕工大学博士研究生学位论文日期:二。一二年六月五El 北京化工大学位论文原创性声明一攀嬲本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。作者签名:—赵L日期:.≯口}≥、s?/关于论文使用授权的说明学位论文作者完全了解北京化工大学有关保留和使用学位论文的规定,基S:研究生在校攻读学位期间论文工作的知识产权单位属北京化工大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。保密论文注释:本学位论文属于保密范围,在上年解密后适用本授权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。作者签名:导师签名:苏殇聋学日期:≯?二0/日瓤■■一t? 学位论文数据集中图分类号TP39学科分类号520.60论文编号1001020128106密级无学位授予单位代码10010学位授予单位名称北京化工大学作者姓名赵春学号200608106获学位专业名称控制理论与控制工程获学位专业代码081101课题来源自选课题研究方向数据挖掘论文题目基于数据挖掘技术的财务风险分析与预警研究数据挖掘,关联规则,交互挖掘,增量挖掘,关键词动态维护,风险分析,危机预警论文答辩日期2012-05—30章论文类型2学位论文评阅及答辩委员会情况姓名职称工作单位学科专长指导教师朱群雄教授北京化工大学评阅人1黄德先教授清华大学评阅人2戴亚平教授北京理工大学评阅人3评阅人4评阅人5撇员蝴黄德先教授清华大学答辩委员1戴亚平教授北京理工大学答辩委员2张朝晖教授北京科技大学答辩委员3黄克谨教授北京化工大学答辩委员4王建林教授北京化工大学答辩委员5注:一.论文类型:1.基础研究2.应用研究3.开发研究4.其它二.中图分类号在《中国图书资料分类法》查询。三.学科分类号在中华人民共和国国家标准(GB/T13745-9)《学科分类与代码》中查询。四.论文编号由单位代码和年份及学号的后四位组成。 摘要基于数据挖掘技术的财务风险分析与预警研究随着信息技术的快速发展和管理理论研究取得重大进展,信息技术在企业管理决策领域中的应用受到越来越多的关注。面对残酷的市场竞争环境,企业对风险管理的要求日益提高,如何客观评价企业管理过程中存在的财务风险,并对其进行及时预警是企业管理层始终追求的目标。传统的企业财务风险分析与预警研究方法主要包括统计分析和人工智能模型。随着企业规模的扩大和信息披露越来越频繁,统计分析模型已经不能适应海量数据分析的要求,人工智能模型没有考虑到财务数据的时间延续性。另外,企业财务风险分析与预警研究受企业内外部多种因素影响,不确定性非常高,而数据挖掘技术在不确定性理论研究中的优秀表现让两者紧密联系起来。因此,针对传统方法无法解决的问题,本文深入研究关联规则数据挖掘方法,提出了三种新的关联规则改进型算法,极大提高了数据挖掘的效率;同时,将这些算法应用于企业财务风险分析与危机预警的研究,提出了企业财务风险概念层次树模型和时间序列动态维护的财务危机预警模型。主要研究内容如下:1.基于Hash结构的关联规则交互挖掘算法HIUA现有的关联规则挖掘算法主要基于支持度.置信度框架,同一数据库在不同的支持度和置信度阈值下,算法产生的频繁项集和关联规则的数目是不同的。由于用户事先无法确定合适的支持度和置信度阈值,需要不断尝试不同的阂值才能得到理想的频繁项集和关联规则。本文针对支持度阈T 北京化工大学博士学位论文值变化时的关联规则维护问题,即当用户调整阈值时存在多次遍历数据库和重复计算问题,提出了基于Hash结构的关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构快速存取算法执行过程中得到的支持度计数,提高算法运行效率。2.基于部分支持度树的关联规则增量式更新算法IUPSMiner关联规则的挖掘算法通常假定数据库是静态的,在阈值固定的情况下,如果数据库发生变化,算法需要通过重新进行数据库扫描和计算来得到新的规则。本文针对阂值不变而数据库发生变化时的关联规则维护问题,提出了基于部分支持度树PSTree结构的关联规则增量式更新算法IUPSMiner,该算法只需对新增数据库进行挖掘,通过合并已有的和新增的部分支持度树生成新的部分支持度树,来减少对原数据库的扫描和重复计算,有效地维护了已挖掘的关联规则,提高算法的效率。3.关联规则的动态维护算法ARDM关联规则的动态维护是指当数据库和支持度阈值同时发生变化的情况下,关联规则的维护与更新问题。现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题。本文针对数据库与支持度阈值同时发生变化的情况,提出一种基于关联规则交互挖掘和增量挖掘的动态维护算法ARDM,该算法利用已有的挖掘结果进行交互挖掘和增量挖掘,即在原来的数据库中使用新的支持度阈值进行交互挖掘;然后在新增加的数据库中使用新的支持度阈值进行增量挖掘,并通过Hash结构与模式增长方法进行优化,进一步提高算法的效率。4.关联规则交互挖掘算法在企业财务风险分析中的应用 摘要企业财务风险分析的研究是通过建立财务风险指标体系,寻找指标体系中具有信任度高的规则,为企业的管理决策提供帮助。传统的财务风险分析方法通常采用统计分析模型,存在的缺点是假设条件多,无法处理海量数据。本文针对上述问题,提出了关联规则交互挖掘的方法,更加广泛的选择多个方面的财务指标,通过挖掘所有财务指标之间的规则,最终确定选择更具有代表性的财务风险指标。首先,构建财务风险分析指标体系,通过变量相关性分析进行指标筛选;然后,提出企业财务风险概念层次树模型,并采用递减支持度阈值的交互挖掘策略,寻找财务风险指标之间的’规则;最后,选择国内上市企业中的ST公司进行企业财务风险分析的实证研究,提出了影响企业财务风险的十个关键指标和防范财务风险的建议。5.时间序列动态维护挖掘算法在企业财务危机预警中的应用企业财务危机预警的研究主要是跟踪财务指标波动和变化趋势,当指标波动超出一定的范围,系统就应该发出危机预警。现有的企业财务危机预警的方法主要是基于人工智能数据挖掘模型,存在的缺点是没有考虑到财务指标数据的时间延续性。本文针对财务指标数据具有时间序列特征,●提出了基于时间序列动态维护的企业财务危机预警模型。首先,构建时间序列财务数据挖掘模型;然后,采用时间序列增量挖掘和交互挖掘策略,进行关联规则的动态维护挖掘,寻找财务指标之间的规则和预测危机企业的发展趋势;最后,选择国内上市企业中的ST公司进行财务危机预警的实证研究,提出了定性和定量进行财务危机预警的方法,并给出了危机企业不同阶段的关键指标。III 北京化工大学博士学位论文关键词:数据挖掘,关联规则,交互挖掘,增量挖掘,动态维护,时间序列、风险分析,危机预警IV 脚MTheFinancialRiskAnalysisandForewarningResearchBasedonDataMiningTechnologyABSTRACTWiththerapiddevelopmentofInformationTechnologyandsignificantimprovementofmanagementtheoryresearch,InformationTechnologyhasbeenpaidmoreandmoreattentionintheareaofenterprisemanagementdecision.Confrontingthefiercecompetitioninthemarket,theenterprisemakesincreasingrequirementsforriskmanagement,thereforehowtoevaluatetheexistingfinancialrisksobjectivelyandtimelyforewarningintheenterprisemanagementprocessbecomesthegoaltheenterpriseisalwaysseekingfor.Thetraditionalmethodsforfinancialriskanalysisandforewarningincludestatisticalanalysismethodandneuralnetworkmodel,howeverwiththeenlargementoftheenterpriseinscaleandmorefrequentinformationdisclosure,thetraditionalstatisticalanalysismethodshavebeenunabletomeettherequirementofmassivedataanalysis;alsotheneuralnetworkmodeldoesn’tconsiderthetimecontinuityoffinancialdata.Inaddition,theenterprisefinancialriskanalysisandforewarningresearchisinfluencedbyavarietyofinternalandextemalfactorswithhighuncertainty,however,theexcellentperformanceofdataminingtechnologyinuncertaintytheoreticalstudymakesthemcloselylinked.In.ordertosolvetheaboveV problemsexistedinthetraditionalmethods,afterfurtherresearchontheassociationruleminingmethods,wepresent3improvedalgorithmsbasedonnewassociationrules,whichimprovedtheminingefficiencygreatly.Inthemeanwhile,weappliedthemtotheenterprisefinancialriskanalysisandcrisisforewarningresearchandproposedbothconceptionhierarchicaltreemodelforenterprisefinancialrisksandfinancialcrisisforecastingmodelbasedontimeseries.Thepaperisorganizedasfollows.1.Hashbasedassociationruleinteractiveminingalgorithm(HIUA)Thepresentassociationrulesminingalgorithmsaremainlybasedonthesupportandconfidenceframework.Forthesamedatabase,differentsupportandconfidencethresholdwillgeneratedifferentfrequentitemsetsanddifferentnumbersofassociationrulewiththesamealgorithm.Sincetheuserscannotinadvanceknowwhichsupport—confidencethresholdisappropriate,theyneedtoconstantlytestdifferentthresholdstogettheidealfrequentitemsetsandassociationrule.Thenewalgorithmisaimedtoimprovetheassociationrulemaintenanceissueswhenthesupportthresholdischanged.Inotherwords,thepreviousalgorithminvolvesscanningthedatabasemultipletimesandrepeatedcalculationissueswhiletheusersadjustedthethreshold,SOHashbasedassociationruleinteractiveminingalgorithmHIUAisproposed,whichimprovesthepruningprocessoftheoriginalIUAalgorithmanduseHashstructuretoquicklyaccesstothesupportcountingduringtheexecution.Bythisway,thealgorithmefficiencyisimproved.VI ABSTRACT2.AssociationruleincrementalupdatingalgorithmbasedonPS—Tree(ItⅢSMiner)Ingeneral,associationruleminingalgorithmassumesthatthedatabaseisstatic,intheconditionofspecifyingfixedthreshold;itneedsre—scanthedatabasetocomputenewassociationrulesoncethedatabasehasbeenupdated.Towardstheabove-mentionedassociationrulemaintenanceissues,wepresentanefficientassociationruleincrementalupdatingalgorithmbasedonPS.——Tree(IUPS_Miner)thatonlyneedsminingthenewdatabase.BymergingtheretainedPS.——TreewiththenewPS.——Treetoreducettiecostofscanningtheoriginaldatabaseandrepeatedcalculationofassociations,itefficientlymaintainedthepreviouslydiscoveredassociationrulesandimprovedthealgorithmefficiency.3.Associationruledynamicmaintenancealgorithm(ARDM)Thedynamicmaintenanceofassociationrulesreferstothemaintenanceandupdateissuesofassociationruleswhenboththedatabaseandsupport●thresholdarechangedatthesametime.Thepresentminingmethodsusuallyhavetheproblemsthatinvolvemultiplescanningofdatabaseorrepeatedlytraversingthecomplexstructure.Inthispaper,forthesituationsthedatabaseandsupportthresholdarechangedsimultaneously,wepresentanassociationruledynamicmaintenancealgorithmbasedoninteractiveminingandincrementalmining,whichusesthealreadygeneratedassociationsforincrementalminingandinteractivemining.BasicallythealgorithmappliesVII 北京化工大学博士学位论文interactiveminingtotheoriginaldatabasesandthenappliesincrementalminingtothenewaddeddatabasesusingthenewsupportthreshold;furthermore,theefficiencyisoptimizedandimprovedwithHashstructureandpatterngrowthmethods.4TheapplicationofassociationruleinteractiveminingalgorithmsinenterprisefinancialriskanalysisTheobjectiveoftheenterprisefinancialriskresearchistoconstructingfinancialriskindexsystem,andthendeterminesthehighsupportpattemsintheindexsystemtohelpfortheenterprisemanagementdecision.Thetraditionalmethodforenterprisefinancialriskisusuallybasedonstatisticalanalysismodel,whichdrawbackismanyassumptionsSOthatitcannotprocessmassdata.Aimattheabove—mentionedproblems,associationruleinteractiveminingisproposedinthispaper,whichchoosemultiplewiderrangesoffinancialindexesfirst,andthenultimatelydeterminethemostrepresentativefinancialriskindicatorbyminingtherulesbetweenallfinancialindexes.Thedetailedstepscanrefertothefollowing:firstlyestablishfinancialriskindexsysteminwhichtheselectionoffinancialindexisbasedonvariablecorrelationanalysis;thenbuildariskconceptionhierarchicaltreetofindtherulesbetweenthefinanceriskindicatorswithinteractiveminingstrategiesofdecreasingsupportthreshold;finally,selecttheSTcompaniesinthedomesticlistedcompaniesfortheempiricalresearchofenterprisefinancialriskanalysis,andpropose10keyindicatorsthatinfluencetheenterprisefinancialriskandVIlI ABSTRACTsuggestionsforavoidingfinancialrisks.5.TheApplicationofassociationruledynamicmaintenanceminingalgorithminfinancialcrisisforecasting.Theresearchoffinancialcrisisforecastingmainlyfocusesontrackingthefinancialindexfluctuationsandtrends,andthesystemissupposedtoprovidewarningalertoncethefinancialindexfluctuatesbeyondacertainrange.Theexistingmethodsforfinancialcrisisforecastingaremainlybasedonartificialintelligencedataminingmodels,whichownthedrawbackthatdoesn’ttakethetimecontinuityofthefinancialindexdataintoaccount.Inthispaper,consideringthetimeseriescharacteristicforthefinancialindex,wepresentadynamic—maintainedenterprisefinancialcrisisforecastingmodelbasedontimeseries.Theconcretestepsrefertothefollowing:firstlyconstructthefinancialdataminingmodelbasedontimeseries;thenbasedontimeseriesincrementalminingandinteractiveminingmechanism,findtherulesbetweenthefinancialindexandpredictthe.developmenttrendforthecrisisenterprisewithassociationruledynamicmaintenancemining;finally,weselecttheSTcompaniesinthedomesticlistedcompaniesfortheempiricalresearchofenterprisefinancialcrisisforecasting,anddeterminethekeyindicatortodefinedifferentphaseofcrisisenterprise.KEYWORDS:DataMining,AssociationRules,Interactivemining,IncrementalMining,DynamicMaintenance,RiskAnalysis,CrisisForecastingIX jC京化工大学博士学位论文 目录第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.1研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2企业财务风险分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.21.2.1企业财务风险分析的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31.2.2企业财务风险分析方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.2.3存在的问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯51.3企业财务危机预警⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.61.3.1财务危机预警的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯61.3.2财务危机预警的方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯71.3.3存在的问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯91.4本文的主要内容和结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.91.4.1本文的主要研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯91.4.2本文的结构安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.1l第二章数据挖掘技术研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯132.1数据挖掘技术的研究现状...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯l32.1.1数据挖掘的方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.132.1.2数据挖掘技术的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.142.2关联规则挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..:⋯⋯⋯⋯⋯⋯142.2.1频繁项集的产生⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.142.2.2规则的兴趣度度量⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.162.2.3关联规则的数据挖掘方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.162.2.4关联规则的交互挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.172.2.5关联规则的增量挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.172.2.6关联规则数据挖掘的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.182.3时间序列数据挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯182.3.1时间序列预测的方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.192.3.2时间序列数据挖掘的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.202.4动态数据挖掘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯212.4.1动态数据挖掘的类型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.21 北京化工大学博士学位论文2.4.2动态数据挖掘的应用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.222.5小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.22第三章关联规则的动态维护算法研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯253.1关联规则的交互挖掘算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯253.1.1算法描述HIUA⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..263.1.2算法分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.283.1.3性能分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.293.2关联规则的增量挖掘算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯333.2.1利用部分支持度树挖掘关联规则⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.333.2.2基于PSTree的关联规则增量更新算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.353.2.3性能分析与算法比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.383.3关联规则的动态维护算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯403.3.1算法描述ARDM⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯403.3.2算法分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.423.3.3性能测试⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.433.4小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.46第四章基于关联规则交互挖掘的企业财务风险分析⋯⋯⋯⋯⋯⋯⋯⋯474.1企业财务风险分析理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯474.1.1企业风险管理理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.474.1.2企业风险分析的流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.484.1.3企业财务风险管理的理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.484.2基于关联规则交互挖掘的企业财务风险分析方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯49.4.2.1企业财务风险分析指标体系⋯_⋯⋯⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯504.2.2财务指标的相关性分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.534.2.3按照区间划分定义风险等级⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.544.2.4基于关联规则交互挖掘的企业财务风险分析模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.554.3企业财务风险分析实证研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯564.3.1样本企业的选取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.564.3.2财务风险指标的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.574.3.3基于离散化属性的财务指标数据库重构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.604.3.4基于关联规则交互挖掘策略的财务风险分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.614.3.5研究结论与防范财务风险建议⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.654.4/J、结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.66 目录第五章基于时间序列动态维护的企业财务危机预警⋯⋯⋯⋯⋯⋯⋯⋯675.1企业财务危机预警理论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯675.1.1财务危机预警的界定⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.685.1.2财务危机形成的路线图⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.685.1.3企业财务危机预警的理论分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.695.1.4财务危机预警的流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.725.2基于时间序列动态维护的企业财务危机预警方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯745.2.1财务危机预警指标体系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.745.2.2财务危机预警指标的等面积划分方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.765.2.3基于时间序列动态维护的企业财务危机预警模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.765.3企业财务危机预警实证研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯77‘5.3.1样本企业的选取⋯⋯⋯⋯⋯⋯⋯一:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..775.3.2样本数据的清理与数据重构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..785.3.3企业财务危机预警指标的选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.805.3.4基于时间序列动态维护的企业财务危机预警⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.805.3.5研究结论与预测财务危机建议⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.855.4小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.89第六章结论与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯916.1结论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.916.2工作展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.-.⋯⋯⋯⋯⋯⋯⋯⋯93参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯95致谢‘⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一101研究成果及发表的学术论文⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯103作者和导师简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯105 原书空白页不缺内容 ContentsChapter1Introduction...................j............⋯.....⋯⋯...............⋯..·····.⋯········11.1Background⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2AnalysisofEnterpriseFinancialRisk⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21.2.1ResearchStatus⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯31.2.2AnalysisMethods⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯41.2.3Problems⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.51.3WarningofEnterpriseFinancialCrisis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.61.3.1ResearchStatus⋯⋯⋯⋯⋯⋯⋯⋯⋯.j⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.6.1.3.2^压ethods⋯⋯⋯⋯⋯⋯⋯⋯一:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯:⋯⋯⋯⋯..7’1.3.3Problems⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.91.4ResearchandThesisStructure⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..91.4.1ResearchContents⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..91.4.2ThesisStructure⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..12Chapter2DataMining⋯⋯.....⋯.......⋯..⋯⋯⋯...⋯⋯⋯....⋯........⋯........⋯⋯..132.1ResearchStateofDataMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..132.1.1Methods⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.132.1.2Applications⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.142.2AssociationRuleMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯142.2.1GenerationofFrequentItemSet⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..14‘2.2.2MeasureofRuleInterestingness⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..162.2.3Methods⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.162.2.4InteractiveMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..172.2.5IncrementalMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.172.2.6Applications⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯182.3TimeSeriesDataMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..182.3.1Method⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..192.3.2Applications⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯j⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯:!()2.4DynamicDataMining⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.212.4.1Classification⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..212.4.2Applications⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..22 北京化工大学博士学位论文2.5Summary........................................................................................................................22Chapter3AlgorithmforAssociationRuleMiningofDynamicMaintenance....⋯...........................................⋯......⋯⋯..................................25:;.1InteractiveMiningAlgorithmofAssociationRules⋯.⋯⋯⋯⋯.⋯...⋯⋯⋯⋯⋯.⋯....⋯.⋯.253.1.1AlgorithmDescription⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯263.1.2AlgorithmAnalysis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..283.1.3PerformanceAnalysis⋯⋯⋯...⋯..⋯⋯⋯⋯⋯⋯..⋯.⋯.⋯⋯⋯⋯.⋯..⋯.⋯⋯⋯⋯⋯.⋯⋯..293.2IncrementalMiningAlgorithmofAssociationRules⋯⋯⋯⋯.o⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯333.2.1MiningofAssociationRulesBasedonPS—Tree⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.333.2.2IncreamentalUpdatingAlgorithmofAssociationRulesBasedonPS—Tree⋯⋯.353.2.3PerformanceAnalysisandComparison⋯⋯...⋯.⋯.⋯⋯⋯......⋯.⋯⋯⋯⋯⋯....⋯⋯..383.3DynamicMaintenanceAlgorithmofAssociationRules⋯⋯....⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯403.3.1AlgorithmDescription⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.j⋯⋯.403.3.2AlgorithmAnalysis⋯⋯⋯⋯.⋯⋯..⋯⋯.⋯.⋯⋯.....⋯.⋯⋯⋯⋯.....⋯.⋯⋯⋯⋯⋯.⋯.⋯.⋯423.3.3PerformanceTest⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..433.4Summary.⋯⋯⋯⋯⋯..⋯.⋯⋯⋯⋯⋯⋯.....⋯.⋯⋯⋯⋯.....⋯.⋯⋯.⋯.⋯..⋯...⋯.⋯.⋯⋯⋯..⋯⋯⋯46Chapter4AnalysisofEnterpriseFinancialRiskbasedonInteractiveMiningofAssociationRules....⋯⋯.............⋯.....⋯⋯⋯....⋯⋯⋯....⋯....⋯.......474.1TheoryofEnterpriseFinancialRiskAnalysis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.474.1.1TheoryofEnterpriseRiskManagement⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..474.1.2ProceduresofEnterpriseRiskAnalysis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯484.1.3TheoryofEnte'rpriseFinancialRiskManagement⋯⋯⋯:⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.;.484.2AnalysisMethodofEnterpriseFinancialRiskBasedonInteractiveMiningofAssociationRules⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..494.2.1IndexSystemofEnterpriseFinancialRiskAnalysis...........................................504.2.2CorrelationAnalysisofFinancialIndex⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..534.2.3DivisionofRiskGrade.........................................................................................544.2.4AnalysisModelofEnterpriseFinancialRiskBasedonInteractiveMiningofAssociationRules.....⋯.⋯⋯⋯.⋯.⋯.⋯.⋯..⋯⋯⋯....⋯.⋯.⋯.⋯.⋯....⋯⋯.⋯⋯.⋯..⋯.⋯.⋯554.3EmpiricalStudyonEnterpriseFinancialRiskAnalysis...........................⋯..................564.3.1SampleSelectionofEnterprise⋯..⋯.⋯⋯⋯...⋯..⋯⋯⋯⋯⋯⋯.⋯.⋯⋯⋯.⋯.⋯.⋯⋯⋯564.3.2IndexSelectionofEnterpriseFinancialRisk⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.57XVI Contents4.3.3ReconstructionofFinancialIndexDataBasedonDiscreteProperties⋯⋯⋯⋯⋯604.3.4FinancialRiskAnalysisBasedonInteractiveMiningStrategyofAssociationRules⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯614.3.5SuggestionsforFinancialCrisisPrevention⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一644.4Summary⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯65Chapter5EnterpriseFinancialCrisisWarningBasedonDynamicMaintenanceofTimeSeries.....⋯......................⋯..⋯⋯..............⋯................675.1TheoryofEnterpriseFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..675.1.1DefinitionofFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.685.1.2RoadmapofFinancialCrisisFormation⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..685.1.3TheoreticalAnalysisofEnterpriseFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯695.1.4ProceduresofFinancial.CrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯725.2MethodofEnterpriseFinancialCrisisWarningBasedonDynamicMaintenanceofTimeSeries⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.745.2.1IndexSystemofFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..745.2.2EqualAreaDivisionMethodofFinancialCrisisWarningIndex⋯⋯⋯⋯⋯⋯⋯⋯765.2.3ModelofEnterpriseFinancialCrisisWarningbasedonDynamicMaintenanceofTimeSeries⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..765.3EmpiricalStudyonEnterpriseFinancialRiskAnalysis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯775.3.1SampleSelectionofEnterprise⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..775.3.2CleaningandReconstructionofSampleData⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..785.3.3IndexSelectionofEnterpriseFinancialCrisisWarning⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..805.3.4EnterpriseFinancialCrisisWarningBasedonDynamicMaintenanceofTimeSeries⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..805.3.5SuggestionsforPredictionofFinancialCrisis⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯··855.4Summary⋯...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯89Chapter6ConclusionsandOutlook⋯.....⋯.....⋯......⋯...⋯..⋯.⋯.....⋯.⋯⋯..916.1Conclusions⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..916.2Outlook⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯93References..........⋯.....⋯⋯.⋯⋯....⋯......................⋯....⋯..⋯⋯....⋯..⋯⋯..⋯⋯..95Acknowledgements............⋯⋯⋯⋯..⋯⋯....⋯.....⋯............⋯...................··⋯101Publications⋯⋯。⋯⋯。⋯⋯⋯⋯。.⋯⋯..⋯⋯.。⋯....⋯。。..“。⋯⋯.。⋯⋯。⋯⋯⋯⋯.103XVII 北京化工大学博士学位论文AboutAuthorandAdvisor..........⋯....⋯....⋯.......................⋯.....................105XVIll 第一章绪论1.1研究背景2007年8月美国次贷危机(SubprimeCrisis)爆发,全球金融市场动荡,大量次级抵押贷款机构破产、投资基金被迫关闭【l,2】。成立了158年的雷曼兄弟公司因过度使用金融杠杆的投机行为,于2008年9月在次债危机中破产倒闭【31。2009年12月全球三大评级公司下调希腊主权评级,希腊的债务危机爆发,随即欧洲其它国家如:西班牙、葡萄牙、比利时等也陷入危机,2011年11月意大利主权债务评级被下调,欧洲债务危机开始向欧洲核心国家蔓延【4J。后危机时代我们应该反思并积极寻找对策,从美国次贷危机到目前的欧债危机,全球金融市场对国际三大评级机构未能事先做出预警感到失望,并对评级机构的评级程序、方法和模型提出了质疑,普遍认为应该对评级行业可能潜在的利益冲突和国际三大评级机构的垄断格局应进行改革。美国次贷危机和欧洲主权债务危机给予我们的启示是国际投行和国际评级机构是靠不住的,中国需要建立自己的金融风险危机预警体系。央行行长周4')11于2011年12月25日在中国经济前瞻论坛上指出,目前评级系统对宏观经济起到了顺周期作用,造成国际经济形势的巨大波动,应减少对外部信用评级的依赖。近期国务院已批准央行作为信用评级行业的主管部门,评级体系的建设问题被作为一个重点课题交由央行进行研究。信用评级是对某个主体进行财务风险分析和危机预警,这个主体可以是一个国家,也可以是一个企业岭J。本课题将针对企业的财务风险与危机预警展开分析与研究。面‘对残酷的市场竞争环境,企业对风险管理的要求日益提高,如何客观评价企业存在的财务风险,并对其进行及时预警,需要回答如下几个方面的问题:1、企业每天都要产生大量的财务数据,什么样的方法能够快速分析这些数据?2、企业发生财务风险表现为财务指标恶化,它们之间有什么规律?哪些指标起到了关键性因素?3、企业陷入财务危机是一个渐进过程,怎么识别和区分企业所处的不同危机阶段?基于传统统计模型的分析方法,通常都有很多假设条件,计算方面过于复杂,实际应用效果并不明显,另外,面对每天都在大量产生的企业财务数据,传统的统计模型就更显的力不从心。基于现代人工智能化的危机预警模型也存在结构不稳定,限制条件多的缺点,而且人工智能的危机预警模型没有考虑财务数据的时间延续性,对样本数据的时序处理不够重视。当前,在智能工业控制领域,智能控制系统负责监控工业流程中的每一个设备的 北京化工大学博士学位论文运行状态,如果其中一个或几个设备的运行状态出现不稳定的现象,智能控制系统就会发出预警,智能控制领域发现具有信任度高的规则是的一个研究热点。同样的原理,在财务风险分析与危机预警过程中,财务的风险或预警指标就相当于工业控制系统中的设备,当指标出现波动就相当于工业设备的运行姿态出现不稳定的情况。当指标波动超出一定的范围,系统就应该发出预警,而对企业财务危机风险与危机预警的研究也相当于一个智能管理控制系统。随着数据挖掘技术的快速发展,相关理论和应用日趋成熟,数据挖掘技术无须太复杂的数学理论推理,只要通过数据筛选,就能发现数据库中隐藏的特性;并且不需要设置假设条件,只需要通过调整阈值,就能自行寻找数据中的规则。因此,将数据挖掘方法应用于企业财务风险分析和危机预警当中,建立动态的企业财务风险分析和危机预警模型,寻找具有高信任度规则,对企业存在的财务风险和危机进行及时预警就成为本课题的主要研究方向。1.2企业财务风险分析企业财务风险的概念包括广义财务风险和狭义财务风险,狭义财务风险是因举债融资而导致企业在未来无法偿还到期债务给企业财务成果带来的不确定性【6】。广义财务风险是在企业的各项财务活动中,由于各种不确定因素的影响,在一定时期内使企业财务结果与预期收益发生偏离,因而造成企业蒙受损失的机会和可能【7】。狭义财务风险主要是指企业的筹资风险,广义财务风险由于人们对它的认识不完全相同,包括的内容也不尽相同,一般包括以下内容:筹资风险、投资风险、现金流量风险、存货风险、利率风险、汇率风险等【8J。随着我国社会主义市场经济体制的建立与完善,企业管理层对财务风险分析认识.逐渐加强,对企业进行风险评估已经成为企业进行风险管理和风险控制的重要手段,并被广泛应用于经济生活的许多领域。企业进行风险管理和风险分析的意义主要有以下几个方面:l、企业财务风险分析是国家经济决策的需要我国企业的经济活动是市场经济体制下进行的,但是,国家的宏观经济调控政策起到了引导企业发展方向的作用,国家出台的每一项经济政策都直接影响企业的经营活动和经济效益。如果不考虑企业经营的实际承受力和企业资金运动的规律,仅仅依据宏观经济数据做出宏观经济调控是非常危险的,将会引起经济的大幅波动,对企业的经营活动造成严重的伤害。2010年至今国家陆续出台对房地产的调控政策,在此期间,银行业进行了若干次的压力测试,就是对银行业进行风险分析与评估,假设房地产行业整体下将30%到50%,我国的银行能否承担这样的风险,会不会出现银行业大2 第一章绪论量倒闭的现象。2、企业财务风险分析是企业贷款融资的需要企业的发展离不开贷款融资,当企业向银行或债券持有人等债权人贷款融资时,债权人要对企业的财务状况进行分析,具体包括:(1)对企业的盈利能力、现金流动性和未来发展潜力等方面评估分析。(2)对企业的资金状况、经营风险和资金周转情况等方面进行分析。(3)对企业的财务状况、资产流动状况和按期偿还债务等方面进行分析。3、企业财务风险分析是企业进行风险管理的需要企业管理层在追求企业利益最大化或股东权益最大化的同时,要承担企业发展过程中的不确定性,也就是要面对的风险。管理层需要定期编制财务报表并进行财务分析,然后做出企业下一步的发展战略,是投资扩大再生产还是收缩战线以保持稳定发展。具体包括:(1)对企业运转情况进行分析,主要通过对企业的生产经营状况、产品销售情况、资金周转情况等方面进行分析。(2)对企业的发展潜力进行分析,主要通过对企业的新产品开发能力、新市场拓展能力和企业的管理决策能力等方面进行分析。(3)对企业的偿债融资能力进行分析,主要通过对企业的偿债能力、经营现金流量和融资能力等方面进行分析。4、企业财务风险分析也是进行个人投资的需要企业与投资者的关系是利益共享、风险共担,投资者在对企业首次投资或在追加投资时需要了解企业的盈利能力、增长速度、分红能力等方面的财务信息,并对企业的财务状况进行风险评估。具体包括:(1)投资者对企业首次投资时,需要对企业的内在价值、企业发展前景和投资回报等方面进行分析。(2)投资者对企业追加投资时,需要对企业的盈利能力、增长速度等方面进行分析。(3)投资者准备转让股权,获取投资回报时,需要对企业的资产状况、所有者权益等方面进行分析。1.2.1企业财务风险分析的研究现状20世纪初,由于欧洲和美国经常爆发经济危机,政府为了加强对宏观经济运行的监控和企业风险管理的需要,开始研究和定期发布“经济晴雨表”。其中:美国哈佛大学教授珀森所编制的“哈佛指数”、巩固经济研究所编制的反映英国经济景气状况的指示器——”英国商业循环指数”、德国的经济景气研究所定期发布”德国一般商情指数 北京化工大学博士学位论文”。“经济晴雨表”成为20世纪初政府进行经济发展环境综合监测和企业风险管理的重要手段。随着战后经济的复苏与发展,人们更加关注企业经营成果和对财务风险管理绩效评价,杜邦公司利用财务比率指标之间的联系,全面评价企业风险帮助企业决策[9】o1992年COSO委员会发布《内部控制——整体框架》专题报告,1994年COSO委员会又发布了增补报告。COSO报告是一部企业风险管理与控制的立体框架,提供了一套完整的内部控制评价标准,并将风险评估、信息与沟通作为基本构成要素引入内部控制领域。针对2001年前后美国安然公司、墨克公司、世通公司、施乐公司等频发的财务信息丑闻,COSO委员会于2004年发布了全新的《企业风险管理——整合框架》(EnterpriseRiskManagement—IntegratedFramework)报告【lo】。至此,美国等西方发达国家在企业风险管理的理念、技术、方法和手段等方面已经有了一套完整的体系。我国市场经济体制的建立和发展时间较短,市场经济环境发育还不健全,随着经济全球化的发展,国内企业在市场竞争中将面对各种各样的风险,如何辨识、评估、监测、控制风险,已成为我国企业发展道路上必须面对的问题。而在我国企业风险意识不强,风险管理工作薄弱,是企业发生重大风险事件的重要原因。2006年国资委发布的《中央企业全面风险管理指引》是借鉴了发达国家有关企业风险管理的法律法规、国外先进的大公司在风险管理方面的通行做法为我国央企制定的风险管理手册,对于央企建立健全风险管理机制,促进央企稳步发展,防止国有资产流失,保护投资者利益,具有积极的意义。企业财务风险分析方法目前,财务风险分析的方法有很多种,不同的研究人员出于不同的目的已经探索出很多种控制企业财务风险的方法,从风险分析的手段来分主要包括以下几种方法:财务报表分析法、财务指标分析法、德尔菲法(专家意见法)ll¨、A(动记分法等。一、财务报表分析法财务报表分析法是根据一定的标准,通过企业各类报表资料对其财务风险进行搜索、识别、分析、判断、决策的分析方法。财务报表分析的最基本功能是将大量的报表数据转换成对特定决策有用的信息,减少决策的不确定性。财务报表分析常用的方法有比率分析法、比较分析法、因素分析法、综合分析评价方法等。应用财务报表分析方法时应注意局限性、避免孤立性、考虑可比性,需进行综合分析【l21。报表分析法主要通过企业的资产负债表、损益表、现金流量表对企业的运营能力、发展能力、盈利能力、偿债能力、资本结构、现金流量等方面进行分析【l引。财务报表分析法具有操作简便、数据来源可靠,并且比较符合企业管理人员的工作习惯和思维方式,有利于提4 第一章绪论高企业风险控制的工作效率。但是,报表分析法只适用于数据量相对较小统计分析,而对于数据量较大的财务数据显得力不从心;另外,报表分析法基本局限于财务数据的事后分析,而对于事前预测、事中控制的作用较弱,不利于企业制定计划、控制风险和管理决策。二、财务指标分析法财务指标分析法是根据企业财务、统计、业务核算资料提供的数据,对企业财务风险的相关指标数据进行计算、分析和对比,并从分析结果中搜索、识别、判断企业财务风险的技术方法。指标分析法可与报表分析法一起使用,也可单独使用,指标分析法是对报表分析的一种更进一步的研究。指标分析法要预先设定一个临界值或风险警戒线,当某一个财务指标达到警戒线时就可认定企业的经营活动存在风斛14J。财务指标分析法选择的重要财务指标包括以下几类:偿债能力:流动比率、速动比率、现金比率、利息支付倍数、股东权益比率、资产负债比率等;营运能力:存货周转率、存货周转天数、应收帐款周转率、应收帐款周转天数、流动资产周转率、流动资产周转天数等;盈利能力:毛利率、净利润率、每股收益、净资产收益率等指标;成长能力:每股收益增长率、净利润增长率、主营业务收入增长率、净资产增长率、总资产增长率、股长权益增长率等指标;现金流量比率:现金流动负债比率、经营现金净流量对销售收入比率、资产的经营现金流量回报率、经营现金净流量与净利润的比率、经营现金净流量对负债比率、现金流量比率等。企业管理者在财务指标体系设计过程中,如果缺少某项重要的财务指标就不能准确反应企业的财务状况及财务风险情况,因此,财务指标体系的完备性及指标体系的临界值设置非常重要,如果设计不好就会影响财务风险分析的结果。三、德尔菲法(专家意见法)德尔菲法又名专家意见法是由美国兰德(RAND)公司的赫尔默(Helmer)和戈登(Gordon)于1946年正式提出,并将其应用于预测中,德尔菲法的本质是一种反馈匿名征询法。德尔菲法根据对所要预测的问题采用匿名征询专家的意见的方式,然后进行整理、归纳、统计、再匿名反馈给专家,所有参加匿名征询的专家相互之问不见面讨论,不得发生任何联系,只允许与调查人员发生联系,通过如此反复多轮次调查,听取专家所提问题的看法,最后经过归纳、修改,汇总成全部参加征询专家基本一致的看法,作为预测的结果。1.2.3存在的问题综上所述,传统的财务风险分析方法主要是利用统计分析的方法对企业的财务报表数据进行分析,存在假设条件多,计算方法过于复杂的缺点,而且面对企业每天都 北京化工大学博士学位论文要产生海量数据,处理起来就显得力不从心。另外,传统的财务指标分析方法在建立指标体系时过分依赖于研究人员的喜好和主观判断,并且没有考虑到系统性风险因素的影响。随着企业对风险管理要求的目益提高,必须寻找一种方法能够高效、全面、客观的评价企业存在的风险。关联规则的交互挖掘方法能够高效处理企业每天产生的海量数据,无须经过特别复杂的数学理论推理,只要通过数据筛选,就能发现数据库中隐藏的特性;并且无需设置任何假设条件,只要通过阈值调整,就能自行寻找数据中的规则;从而达到减少人为因素影响的目的,实现对企业风险的客观评价。1.3企业财务危机预警企业财务危机预警是充分利用现代企业风险管理理论的研究成果和现代信息技术,以财务数据为基础资料,对企业日常经营管理活动中存在的财务危机信息进行收集、分析、判断,最后根据危机程度进行预警的一种技术。1.3.1财务危机预警的研究现状企业财务危机预警的研究最早起源于上世纪30年代的美国经济大萧条时期,Fitzpatrick(1932)115J运用单变量分析(SingleVariableAnalysis)对企业财务危机进行预测,他是运用单个财务指标进行预测,开创了财务危机预警实证研究的先河。60年代的美国学者阿特曼运用多变量分析模型(MultipleVariableAnalysisModel)探讨公司财务危机预警,他运用Z.score模型建立多元线性函数公式预测财务危机【l引。70年代Meyer和Pifer(1970)¨“运用线性概率模型(LineProbabilityModel,LPM)分析银行业的财务危机预警,线性概率模型是多变量分析模型的一个特例,能估计企业破产的概率,后来Laitinen(1993)t18J等学者将LPM运用于企业财务危机。随着计算机技术和人工智能技术(ArtificiallyIntelligent,AI)的不断发展和企业市场竞争环境的变化,企业需要面对多变的市场竞争环境,财务危机预警模型必须随着企业的生产经营状况和财务状况作相应的调,从而保证预警模型的判别规则适合当前的市场环境,为此,一些学者开始使用AI方法构建财务危机预警模型。例如:朱怀意、高涌(2002)将人工神经系统引入了危机预警系统,设计了核心能力战略危机预警系统,用于及时发现和预见偏差以便实施控制,保证核心能力战略的可持续性和高效性【l圳。任华、徐绪松(2003)引用模糊优选和BP神经网络,对数据分析子系统和报警子系统进行了理论推导和设计,构建危机预警指标体系【2⋯。刘恒江和陈继祥(2003)依据企业经营方向、外部环境和内部实力三维向量与战略及其效果的关联分析,建立6 战略危机预警指标及预警系统【2¨。何杰和丁智慧(2005)以寻找危机发生前的先兆为切入点,在中小企业板块建立危机预警机制‘221。1.3.2财务危机预警的方法财务危机预警的方法是随着统计学理论和信息技术的发展而发展起来的,主要有两大类:传统统计模型预警方法和人工智能专家系统预警方法。一、传统统计模型预警方法(一)单变量分析单变量分析模型是通过比较不同危机程度企业之间财务指标的明显差异,然后通过指标筛选的方式,去除一些影响不大的财务指标,并对影响较大的财务指标按照影响因子进行排序,最终确定判别能力最高的财务指标。但是,由于不同的研究人员选取的研究样本不同,结果得出的结论不尽相同。例如:Smith和Winakor(1935)提出预测财务风险能力最强的指标为营运资本与总资产【23】。Merwin(1942)提出了三对预测财务风险能力最强的指标,分别为:流动资产与流动负债、营运资本与总资产、股东权益与负债这【24】。Beaver(1966)提出总债务与总资产、现金流与总负债、净收入与总资产这三对指标预测财务风险能力最高【25I。(二)多变量模型分析多变量模型分析是指使用多个变量组成的判别函数来预测企业财务危机的多元线性判定模型,美国学者阿特曼Altmen(1968)运用多变量分析模型进行财务失败的预测。并针对不同类型的企业建立了z分数模型系列,包括:Z.Score模型、Z’.Score模型、z”.Score模型等【16】。彭素欣(2008)【26】运用Z.Score进行了上市公司财务风险预警研究。Z.score模型的公式(1—1)如下:Z=I.2Xl+1.4X2+3.3X3+O.67-.4+1.0X5(1-1)其中:z为判别函数值,X1_(流动资产一流动负债)/(固定资产+流动资产+’投资)=营运资产/总资产,X2=累积储备金/(固定资产+流动资产+投资)=留存收益/总资产,X3=(销售收入一生产成本)/(固定资产+流动资产+投资)=税利前利润/总资产,X4=权益市场价值/债务账面总价值,X5=(销售量誊销售价格)/(固定资产+流动资产+投资)=销售收入/总资产。z值越低则企业越有可能破产,当Z>2.99时表明企业财务状况良好,当Z值<1.81时表明企业处于破产区。(三)罗吉斯(Lo西stie)回归模型多变量分析只能区分破产企业和非破产企业,而对于企业在未来几年中可能破产的概率无法进行判断,Logistic回归的方法可以比较好的在这方面进行研裂271。Martin(1977)【2引最早使用Logistic回归模型应用于银行系统进行财务危机的预测研究,影响范围最广的研究是Ohlson(1980)[29]的财务危机预测模型,研究样本区间为美国上市企业197旺1977年的财务数据,从中筛选出105家已经破产的企业和2058家正常 北京化工大学博士学位论文经营的企业,从所有财务比率中筛选出9个财务指标,建立了3年的预测模型,研究得出4个最有代表性的企业财务危机指标,分别为:财务结构、流动性、企业规模、经营绩效。在Logistic回归模型中,假设第i家公司的预测变量为Xi,a和B为待估计参数,通过模型预测第i家公司破产的概率可以用如下公式(1.2)表示:P(Xi,p)=F(0【+pXi)(1—2)其中:F(ot+J3Xi)是累积对数函数,且F(叶DXi)=1/(1+e-(时BXi))(1.3)或者ln(P/(1一P))=仅+pXi.(1-4)假设危机样本为x1¨’,X2‘1’,⋯Xm¨’,正常样本为Xl‘2’,X2‘2’,⋯Xm∽’,则似然函数为:m脚=啦矗丽域一高最大化对数似然函数ln[L(ot,p)]就可得到上式中的参数伐和p,该模型可以计算出公司进入财务危机的概率P(Xi,D)。国内学者宁静鞭(2008)t30J通过比较Logistic回归方法和K近邻方法的预测效果发现:Logistic回归短期内的预测精度高,而K近邻方法长期预测精确度高。二、人工智能专家系统预警方法(一)神经网络模型(NeuralNetwork,NN)神经网络模型是一种自然的非线性建模过程,具有模拟人的部分形象思维的能力【3l】。神经网络模型的结构由三层构成:输入层、隐藏层、输出层。.输入层用于接受外部环境输入的信息,隐藏层处在输入层与输出层中间,隐藏层负责学习和内部运算,输出层用于接受隐藏层的信息,并将数据传递给外部环境。国内部分学者利用神经网·络模型构建了危机预警模型,例如:吴应宇等人基于财务视角和非财务视角,利用主成分分析和神经网络技术相结合,建立的企业财务危机识别系统【321。李铭等人构建具有智能综合评价性质的BP神经网络危机预警模型,克服了人为确定权重的困难及模糊性和随机性的影响【3引。(二)遗传算法模型(GeneticAlgorithm,GA)遗传算法模型是通过模仿遗传进化规律,在大量复杂概念空问内随机搜索的技术【341。利用遗传算法模型对企业破产进行预测是基于多个方面约束的参数优化,可将财务指标的比率值和定性变量进行条件判别并提取规则,结构清楚容易理解【35I。李清(2010)t36】进行了基于适度财务指标和遗传算法的财务危机预测模型研究。(三)支持向量机模型(SupportVectorMachine,SVM)支持向量机是上世纪九十年代中期发展起来的新的机器学习技术,是以统计学习 第一章绪论理论SLT为基础的一种新的统计研究方法。许多专家应用支持向量机模型研究银行破产的预警问题,并将研究结果与统计方法模型和神经网络模型的预测结果进行比较,证明这种方法的预测效果较好。它克服传统神经网络的一些缺陷,采用结构风险最小化的原则,给出全局最优解和不会产生过度拟合的现象。国内也有学者使用支持向量机构建了企业破产预测模型,杨毓、蒙肖莲考察了取不同参数时支持向量机模型性能的变化‘371。(四)案例推理的财务危机预警方法案例推理的财务危机预警方法是一种基于案例推理的财务预警分析方法,它是运用K临近算法以存储案例进行分类,通过此方法对新增案例进行推理、判别和预测。孙伟等运用案例推理技术和平衡计分法构建一个完整的包括预警和排警的财务预警体系,提出应用平衡记分法来建立企业的财务预警指标,提高预警的精度【38】。案例推理的财务危机预警方法与人工智能专家预警系统其他方法比较研究结果表明,案例推理在数据不充分的条件下使用更好,它的优点是能在复杂变化的环境中解决问题和进行决策,缺点是可应用的样本少且要与其他预测方法结合使用。1.3.3存在的问题综上所述,现有企业财务危机预警模型都是静态的挖掘模型,存在的不足之处主要表现为三个方面的问题:一是运用人工智能的方法存在限制条件多,结构不固定的缺点;二是运用危机征兆分析方法,割裂了定性分析和定量分析,影响了预测结果的准确性;三是运用危机预警指标的方法,指标体系的建立要具有针对性和覆盖性,而且计算比较复杂和繁琐。面对激烈的市场竞争环境,传统的静态挖掘模型已经不能适应企业危机预警的要求,必须建立动态数据挖掘的企业财务危机预警系统,主要是因为企业财务的数据每天都在源源不断的产生,并且都带有时间特征。建立时间序列的动态维护财务预警模型就显得非常有必要,能及时分析企业财务危机程度,而且能够对企业未来发展方向做出预判,帮助管理者制定适当的企业发展战略。1.4本文的主要内容和结构安排1.4.1本文的主要研究内容随着我国资本市场的快速发展,企业对风险管理的要求日益提高,如何客观评价企业管理过程中存在的财务风险并进行及时预警,已经成为一个研究热点和难点。针 北京化工大学博士学位论文对传统统计分析方法存在的假设条件多,无法处理海量数据的问题;另外,人工智能的方法没有考虑财务指标的时间延续性无法跟踪财务指标的波动和变化趋势等问题。本文提出运用关联规则动态维护的方法进行企业财务风险分析与危机预警研究,首先提出了关联规则的三种改进型算法,极大的提高了算法的效率,为进一步的应用研究提供了技术保证。在应用研究中将关联规则交互挖掘算法应用于企业财务风险分析,并将关联规则的动态维护算法应用于企业财务危机预警。主要研究内容如下:1.关联规则的三种改进型挖掘算法本文提出了关联规则的三种改进型挖掘算法,第一,提出了基于Hash结构的关联规则交互挖掘算法HIUA,它是针对支持度阈值变化时的关联规则维护问题,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。第二,提出了基于部分支持度树的关联规则增量式更新算法IUPSMiner,该算法利用部分支持度树的结构提出了对关联规则的增量式更新算法,主要用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。第三,提出了关联规则的动态维护算法ARDM,它主要应用于数据库和阈值同时发生变化的情况。现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题,该算法是基于IUA与FUP算法,提出数据库与支持度阈值同时变化情况下的关联规则维护算法,并通过Hash结构与模式增长方法进行优化。2.关联规则交互挖掘算法在企业财务风险分析中的应用企业财务风险分析的方法包括定量分析和定性分析两个方面,定量分析方法的核心是建立风险分析指标体系和风险分析模型。以前学者在进行财务风险分析时通常采用传统的统计分析的方法,取得了一定的研究成果。本文采用关联规则交互挖掘的方法,更加广泛的选择多个方面的财务指标,通过挖掘所有财务指标之间的规则,最终确定选择更具有代表性的财务风险指标,与传统分析方法相比更加具有客观性和现实‘应用意义。首先,建立企业财务风险分析管理体系和风险分析流程,第二,建立企业财务风险分析指标体系,并运用变量相关系数分析方法,剔除其中部分相关度较高的风险指标。按照区间划分定义财务指标风险等级,将所有财务指标划分为五个等级,并对原有的数据集进行重构,转化为适合关联规则挖掘的离散型数据集。第三,提出了基于关联规则交互挖掘算法的企业财务风险分析模型,主要包括构建多层次的风险概念树,并采用递减支持阈值的交互挖掘策略,寻找财务风险指标之间的规则。最后,选择国内上市企业中的ST公司进行企业财务风险分析的实证研究,提出了影响企业财务风险的十个关键性指标,并通过实际数据分析和测试,关键指标的波动严重影响并决定企业的风险程度。3.动态维护挖掘算法在企业财务危机预警中的应用 第一章绪论企业财务危机预警的理论是一个包含多学科的综合性理论,它是一个涵盖企业风险管理、工业过程控制、动态信息技术、数理建模等多学科的知识。企业财务危机预警的研究与智能工业控制系统中挖掘具有信任度高的规则的研究非常相似,财务危机预警指标就相当于工业控制系统中的设备,当指标出现波动就相当于工业设备的运行姿态出现不稳定的情况,财务指标波动超出一定的范围,系统就应该发出预警。首先,建立企业财务危机预警理论体系,主要包括:企业财务危机的界定、财务危机形成的路线图、企业生命周期理论、财务危机的发展趋势分析和企业财务危机的预警程序。第二,建立企业财务危机预警指标体系,危机预警指标体系不仅包括财务风险分析指标,还增加了企业治理结构指标,并利用连续数据正态分布进行等面积划分,按照危机企业的发展步骤将原有财务数据划分为五个等级,然后进行财务指标数据重构得到适合数据挖掘的数据集。第三,提出了基于时间序列动态维护的企业财务危机预警模型,主要包括构建时间序列财务数据挖掘方法,采用时间序列增量挖掘和交互挖掘机制,进行关联规则的动态维护挖掘,寻找财务指标之间的规则和预测危机企业的发展趋势。最后,选择国内上市企业中的ST公司进行两种发展趋势危机预警的实证研究,通过规则筛选,提出了危机预警的两种方法,一种为定性分析的方法,根据规则的发展趋势判断企业的危机程度,另一种为综合因素定量分析的方法。1.4.2本文的结构安排本文总共分六个部分,整体结构如下:第一章绪论部分,介绍了本文的研究背景及意义,介绍了企业财务风险分析与危机预警的研究现状和方法,最后给出了本文的主要研究内容。第二章介绍了数据挖掘技术的研究现状,重点介绍了关联规则的数据挖掘现状与挖掘方法,另外,‘还介绍了基于时间序列的数据挖掘方法。第三章重点分析现有的四种关联规则经典算法,提出了三种新的关联规则改进算法:基于Hash结构的关联规则交互挖掘算法HIUA、基于部分支持度树的关联规则增量式更新算法IUPSMiner和关联规则的动态维护算法ARDM。第四章提出了基于关联规则交互挖掘的企业财务风险分析方法,将关联规则的数据挖掘技术应用于企业财务风险的分析。建立基于交互挖掘的企业财务风险分析模型,构建了多层次的企业财务风险概念树,采用递减支持阈值的交互挖掘策略,寻找财务指标之间的规则。第五章提出了基于时间序列动态维护的企业财务危机预警方法,将关联规则的动态维护挖掘技术应用于危机预警的研究。建立基于时间序列动态维护的危机预警模型,采用时间序列增量挖掘和交互挖掘策略,寻找财务指标之间的规则,并对危机企业的发展趋势进行预测。 jC京化工大学博士学位论文最后一章对论文工作做出总结并提出了进一步的研究设想。 一.第二章数据挖掘技术研究现状————————————————————————————————————————————一一第二章数据挖掘技术研究现状数据挖掘(DataMining)3L被称为知识发现,是从数据库中发现规则的过程【39421。数据挖掘的思想起源于统计学,是统计学、数据库技术和人工智能技术等理论和技术的综合,数据挖掘的发展得益于高性能(并行)计算技术和分布式技术在处理海量数据集方面的优秀表现【43,441。数据挖掘技术的进步与发展为本文研究提供了很好的技术支持,本章将重点介绍数据挖掘技术的最新研究现状。2.1数据挖掘技术的研究现状数据挖掘技术是一项比较年轻的技术,1989年8月在美国底特律召开的第十一届国际人工智能联合会议IJCAI中,举行了世界上第一次关于数据库中的知识发现专题讨论,1991年一1994年每年召开一次关于KDD(KnowledgeDiscoveryinDatabases)的讨论专题。第一届关于知识发现与数据挖掘国际学术会议于1995年在加拿大蒙特利尔召开。随后几年有关数据挖掘方面的会议和期刊逐渐增多,例如:JournalofDataMiningandKnowledgeDiscovery(1997)、1998ACMSIGKDD会议以及SIGKDDExplorations等。目前,数据挖掘逐渐成为许多知名国际学术会议和期刊关注的焦点,主要包括:PAKDD,PKDD,TKDD,SIAM.DataMining,(IEEE)ICDM,数据仓储与知识发现(DataW2urehousingandKnowledgeDiscovery),SPIE.DM等等。2.1.1数据挖掘的方法数据挖掘首先要对数据进行清理,去除其中的异常数据,然后对数据进行选择和集成,再通过数据变换将数据转变为适合数据挖掘的类型,最重要的一步是选择合适的数据挖掘方法寻找数据中的规则,最后通过模式评估和知识表示将数据中隐藏的模式和规律展示出来。数据挖掘的方法主要包括以下几种:1.分类和预测(ClassificationandPrediction):分类挖掘是将大量数据按照建立的模型进行区分的方法,可以将数据分成多个类别;预测是通过建立连续值函数模型,对未来的数据的发展趋势进行预测的一种方法。2.聚类(Clustering):聚类挖掘是根据一个待分析的数据对象集,按照实例属性值的相似程度自动汇聚成不同的类别。 北京化工大学博士学位论文3.关联规则(AssociationRules):关联规则挖掘是用于发现隐藏在事务数据集或关系数据集中对用户有用的或有意义的联系。4.时间序列(Time.Series):时间序列挖掘是对不同时间重复测量得到的值或事件的序列对象进行挖掘,期望对数据的趋势性变化进行分析的方法。5.其他方法:针对复杂数据类型如:图形图像,视频,Web等进行的挖掘。2.1.2数据挖掘技术的应用目前,国外有一些公司利用数据挖掘技术在相关产品基础上开发的特定的应用,如:IBMIntelligentMiner、SASEnterpriseMiner。数据挖掘技术在国内大部分处于科研阶段,例如各大学和科研机构从事数据挖掘算法的研究、数据挖掘讨论组(www.dmgroup.org.cn)等;国内关于数据挖掘方面的著作相对较少,主要是翻译国外的相关书籍;拥有自主知识产权的数据挖掘软件有复旦德门(Ⅵn^眦datamining.com.cn)等。经过二十几年的快速发展,数据挖掘已经从实验室研究走向实际的应用,在所有这些数据挖掘方法中关联规则的挖掘是最活跃和应用最广的方法。本文主要针对关联规则的数据挖掘方法展开进一步的研究,并将其应用于企业财务风险分析与危机预警当中,另外,还应用到时间序列数据挖掘和动态挖掘的一些方法。为此,将分别对这些方法的研究现状做简单介绍。2.2关联规则挖掘关联规则挖掘(AssociationRulesMining)是为了寻找同一事件中不同项之间相关性【45,461。采用的挖掘策略包括两个方面的内容:(1)频繁项集的产生:寻找满足最小支持度阈值的所有频繁项集(FrequentItemset)。(2)规则的产生:从频繁项集中提取具有高置信度的规则,这些规则称作强规则(StrongRules)。2.2.1频繁项集的产生格结构(LatticeStructure)常常被用来枚举所有可能的项集,一般来说,一个包含d个不同项的数据集可能产生2d个频繁项集。同时可能产生R条规则,R可以用如下公式表示:14 第二章数据挖掘技术研究现状R=喜l(老)×篁j=lfk.d—J尼)l=34—24“+tc2一·,发现频繁项集的一种原始方法是确定格结构中每个候选项集(candidateintesetl的支持度计数。通常我们可以通过减少候选项集的数目和减少支持度的比较次数达到降低产生频繁项集的计算复杂程度。这里有一个先验原理有必要先做一个介绍,就是如果存在一个项集是频繁模的,则它的所有子集也一定是频繁的[47-50】。假定{C,d,e)是频繁项集,显而易见,任何包含项集{c,d,e)的事务一定包含它的子集{c,d){C,e){d,e){C){d)和{e),则它的所有子集(图1.1中的阴影项集)一定也是频繁的。图1.1是项集格先验原理的示意图。图1-1项集格先验原理的示意图假定项集{a,b)是非频繁的,则整个包含{a,b)超集的子图可以被立即剪技。这种基于支持度度量修剪指数搜索空间的策略称为基于支持度的剪技(Support-BasedPruning)。图1.2基于支持度的剪技示意图:’图1-2基于支持度的剪技示意图 北京化工大学博士学位论文2.2.2规则的兴趣度度量(1)设I={il,i2⋯.,im)是所有项的集合,如果XGI则称X是一个项集(ItemSet)或模式(pattem),如果x中有k个元素,则称x为k项集。(2)假定数据D是事务数据库的集合,其中每个事务T则是项的集合,每个事务由事务标识符TID标识。(3)A,B为两个项集,且A∈I,B至I,ANB=①,事务T包含A当且仅当A∈T则关联规则是如下蕴涵式:AjB[S,C]。支持度表示在数据库D中同时出现A和B的概率,支持度具有一定的统计意义;置信度表示出现A时,同时又出现B的概率,置信度表示规则的强度。我们可以用条件概率公式计算支持度和置信度的值。support(AjB)=P(AUB)confidence(A≥B)=P(B/A)=P(AUB)/P(A)‘例1:关联规则挖掘方法表2-1数据集交易ID购买商品1A,B,C2A,C3A.D.4B,E,F表2-2频繁项集的支持度频繁项集支持度{A)75%(3){B)50%(2){C)50%(2){D)50%(2)假设:最小支持度50%(2),最小置信度60%,对于A≥C:support2support({AC}1=50%confidence=stipport({AC})/support({A}1=66.7%2.2.3关联规则的数据挖掘方法1.基于候选模式生成与测试(CandidateGenerationandTest)的方法ApriofiDl]算法由Agrawal等提出,首先确立了支持度.置信度框架,它的基本方法是通过迭代生成所有长度的频繁模式集。首先对数据库扫描生成候选1.项集C.,之后利用Apfiofi性质的反单调性进行支持度计数比较后剪枝,产生频繁1.项集L1,频繁1一项集与自身链接生成候选2一项集C2,再比较再剪枝,如此进行下去,得到所有长度为k(k≥1)的频繁项集Lk,直至不再产生新的频繁项集为止【52。55】。 第二章数据挖掘技术研究现状2..基于模式增长(PattemGrowth)的方法由于基于候选模式的算法会产生大量的候选模式集,并且需要对数据库频繁扫描,导致了在数据集稠密或支持度阈值较低时算法性能的下降,因此JiaweiHan等人提出了基于模式增长(FrequentPatternGrowth)的FP—Growth算法【561。该算法引入了扩展的前缀树结构(FrequentPatternsTree)来保存数据集信息,构建FP.tree只需扫描数据集两次,并且每一条根到叶的路径中节点的频繁程度递减,使得树结构更加紧凑,且有利于模式生成算法中对FP.Tree的拆分[57】。例:如果“abcdef’是频繁集,当且仅当“abcde,,是频繁集,且“f”在包含“abcde”的事务中是频繁的。2.2.4关联规则的交互挖掘关联规则的交互挖掘(InteractiveMining)是由于用户事先并不知道什么样的最小支持度和最小置信度阈值是合适的,因此需要不断调整两个阈值的大小,才能得到用户满意的的关联规则挖掘问题。主要包括以下两种方法:(1)基于候选项生成与测试的交互挖掘方法基于候选项生成与测试的交互挖掘方法都是基于Apriori框架,此类算法都是利用已经挖掘出来的关联规则,来尽量减少候选项集的个数,从而减少到整个数据库中去测试【58J。主要方法如IUA(IncrementalUpdatingAlgorithm)和NewlUA(NewIncrementalUpdatingAlgorithm)[59】等。在关联规则交互挖掘过程中,最小支持度和最小置信度这两个阈值需要不断调整,才能挖掘出真正有效的关联规则。当数据库不变,这两个阈值变化时,存在着关联规则的更新问题,增量式更新算法IUA就是利用已发现的频繁项集发现新的频繁项集。IUA算法不足之处是由于先将频繁项集划分为两个不相交子集,再通过两个子集拼接而成,那么在拼接后就会产生大量的无用候选集;另外其修剪步将会误删掉一些频繁项集。(2)基于模式增长的交互挖掘方法该算法是为了减少重复构建频繁模式树和重复扫描数据库,充分利用已有的关联规则进行挖掘,达到提高算法的效率。例如:Ma等人提出当阈值发生变化时在先前发现的频繁模式下有效延长和重新挖掘的更新算法Re.mining【60】。Cong等人提出了一个压缩策略以适应现有的三个频繁模式挖掘技术,并有效利用已有的压缩数据库算法Recycling[6¨。2.2.5关联规则的增量挖掘关联规则的增量挖掘(IncrementalMillin曲是指当数据库变化时,关联规则的维护 和更新问题。主要包括以下两种方法:(1)基于候选项生成与测试的增量挖掘方法这类算法都是基于Apriori算法的,尽可能的利用已经挖掘出来的关联规则。当发生数据库改变时,通过对新增数据库的扫描,来尽可能地减少那些需要到原始数据库上去测试的候选集,再通过迭代的方法生成频繁项集。例如Cheung等人提出了FUP(Fastupdate)算法,对新增数据进行挖掘[6扪。其它的增量挖掘算法还有FUP2【63】,DELIt“1等。(2)基于模式增长的增量挖掘方法这些算法都是基于分而治之的模式增长框架,充分利用已经挖掘出来的关联规则挖掘。例如:杨秀金等人提出了基于频繁模式表(FPL),可以处理数据库数据增加和最小支持度都发生改变的情况下关联规则的维护算法UFPL(UpdateFrequentPatternList)t651。王佐成等人利用以往大量关联规则作为种子规则提出了算法RGA(RuleGrowingAlgorithm)t661;邹力鹃等人提出一种快速算法FIAFAR(FastIncrementalAlgorithmtoFindAssociationRules),该算法使用CAN.树存储原始交易数据库,弥补了FP.树的不足【6川。2.2.6关联规则数据挖掘的应用随着关联规则挖掘技术的逐步成熟,许多企业已经开发出很多在特定产品上的应用,例如在商品零售领域,关联规则挖掘技术已经被广泛应用。在金融领域,美国银行家协会(ABA)预测数据仓库和数据挖掘技术在美国商业银行的应用增长率大致为15%。还可以使用数据挖掘技术分析客户使用分销渠道的情况和分销渠道的容量,其它的一些应用包括建立利润评测模型和风险控制等。在电子商务领域,使用关联规则挖掘在网上进行商品推荐,或建立个性化网页等。在生物制药、基因研究领域,使用数据挖掘技术进行DNA序列查询和匹配,还可对基因序列的共发生性进行识别。2.3时间序列数据挖掘时间序列数据挖掘(TimeSeriesDataMining)是通过分析数据的时间特性,深入研究事物发展的推进过程,从具有时间特征的数据中获得知识的方法。就是要从大量的时间序列数据中提取潜在的、不为人事先预知的,同时与时间特性紧密相连的规则,并可被应用于对时间数据的短期、中期或长期的发展趋势进行预测【681。 第二章数据挖掘技术研究现状2.3.1时间序列预测的方法时问序列是指在不同时间点上取得的某个变量指标数值,按照时问先后顺序排列而成的数据列表。在我们日常生活中存在多种时间序列数据,例如:超市销售商品的销售量数据为一元时间序列数据,气象台每天发布的天气预报数据为多元时间序列数据,金融市场中的股票价格波动为连续型时间序列数据,工程控制领域中的脉冲控制数据为离散型时间序列数据。假设我们对某一事件发展过程中的变量进行进行观察并测量其数据记为Y。,经过一系列的时刻tl,tz,⋯,tn(t为自变量,且h=SptThr;Lk2==selectPtnksfromApriori_Gen(LNewk_1)whereGetSupportCntByHash(Ptnk)>=SptThr;Lk3=IUA_Gen(k,LOrg,LNew);returnUnion(Lkl,Lk2,Lk3);)(5)HIUA输入:LOrg,DS,SptThr输出:新支持度下RulesHIUA(LOrg,DS,SptThr,CfdThr){if(SptThrwentup){L=selectPtnsfromLwherePtn.Support>=SptThr;)if(SptThrwentdown){L1=SelectPr01fromDSwhereGetSupportCntByHash(Ptnll>=SptThr;LNewl=L1-LOrgl,for(k=2;Lkqisnotnull;k++)Lk=IUA_GenLk(k,LOrg,LNew,DS,SptThr);L=Union(L1,L2,...,Lk);)If(SptThrchanged)Rules=GenerateRules(L,CfdThr);If(CfdThrchanged)Rules=selectRulesfromRuleswhereRule.Cfd>=CfdThr;,7 北京化工大学博士学位论文ReturnRules;)3.1.2算法分析(1)HashFunc,GetSupportCnt为使哈希值分布尽量均匀,本文采用基数转换法作为哈希函数,即HashFunc(Ptnk)=Pmkl木Basek-1+Ptnl(2术Basek-2+⋯+Ptnkk木Baseo(modTableSize)。例JIH:设Ptn3={1,2,9),Base为13,TableSize为100,则HashFunc(Ptnk)=(1:l:132+2木131+9术130)%100=4。出现哈希值碰撞时本文采用链表法处理,即将哈希值相同的映射保存在头结点指向HashTable的链表中。例如:设存在模式{1,2,6)、{1,2,9)、{1,2,12)、{4,9,11),对应的支持度计数为10、15、20、20,哈希值为1、4、7、4,将以上模式依次添加进哈希表,图3-1是所得哈希表。l》旧_硪10I㈠I≥I住9.nj:20i;·旧,2,9}:15l舳{l_12j:20l山、r、{链表—》哈希数组图3-1哈希表结构哈希表的查找及维护方法GetSupportCnt步骤如下:首先计算所查找模式的哈希值,并判断此哈希值所对应的链表中是否存在该模式;如不存在,扫描数据集得到其支持度计数,然后将该模式与其支持度计数成对添加进对应链表中;最后返回哈希表中相应结果。哈希表的引入使程序可以保存交互过程中得到的支持度计数,并可以以近似O(11的时间复杂度从内存中直接读取,从而避免了多余的数据集扫描以及数据集规模较大时的数据库I/O开销,减少了程序运行时间。(2)IUA—GenIUA—Gen分为拼接和修剪两个步骤,首先通过将LOrgi与LNewk-i拼接,然后对于每个Ptnk,如果它的任意Ptnk.1均属于Lk_l则将它添加至Lk3。28 第三章动态维护的关联规则算法研究(3)IUA—GenLk基于观察1,对于ckl,ck2直接使用Apriori_Gen函数生成,并由Cki剪切生成Lkl,Lk3由IUA—Gen生成,并返回LkluLk2uLk3。(4)HIUAHIUA分为维护频繁模式集和维护规则集两个步骤。首先,当支持度阈值增大时,筛选原频繁模式集L;当支持度阈值减小时,计算Ll和LNewl,接着通过IUA.GenLk迭代生成Lk,则新支持度阈值下L=LlUL2U⋯ULk。然后在相应情况下维护规则集。由于HIUA保存了算法执行过程中得到的支持度计数,进一步利用了已挖掘结果,并采用Hash结构快速存取支持度计数,较IUA减少了数据集扫描的开销,从而进一步提高执行效率。3.1.3性能分析本文比较Apriori、IUA与HIUA的运行时间进行。蚪11:厶匕I:1匕分析,以上算法均通过C≠≠(.Net4.O)实现,运行环境为i5处理器,2G内存,Win7系统。由于在置信度阈值变化或支持度阈值上升的情况下不需要更新频繁模式集,IUA与HIUA的速度显然更快,所以本文只比较支持度下降情况下不同算法计算频繁模式集的运行时间。其中数据集1至5来源于UCI标准数据集,数据集6、7为企业实际财务数据。1.数据集为retail,共88000条记录,每条记录1到50个事务ID不等。Hash函数基数为13,Hash表长度为100000,哈希值碰撞的平均概率为O%。算法效率对比如图3.2所示,其中x坐标为支持度阈值,从O.05至O.03,步长为0.02,Y坐标为计算频繁模式集的运行时间。."--4一A|)rlorl一-●PluA-}¨UA》l≯!‘}ir/’.IL/,≯./。’/兮0/\/。——■/‘●‘夕/\●-—一图3-2retail数据集上算法效率对比 北京化工大学博士学位论文2.数据集为chess,共3200条记录,每条记录37个事务ID。Hash函数基数为13,Hash表长度为100000,哈希值碰撞的平均概率为1.06%。X坐标为支持度阈值,从0.9至0.88,步长为0.002,Y坐标为计算频繁模式集的运行时间。图3—3是chess数据集上算法性能对比。—●__趣}nOF1■—-UA卜-}IlUAJ/./‘一/一./,一一j。8r,,,一1,4|.-——“叫r—叫L.一【b——-一P一’●·_一3的2。。。8。8秘路8。8甜壹8萼E毒龋窖:8如理3拍。船4。艟2。黯垂87图3-3chess数据集上算法性能对比3.数据集为accidents,共5000条记录,每条记录20到40个事务ID不等。Hash函数基数为13,Hash表长度为100000,哈希值碰撞的平均概率为0.34%。X坐标为支持度阈值,从0.8至O.7,步长为O.01,Y坐标为计算频繁模式集的运行时间。图3.4是accidents数据集上算法性能对比。—●一肆节Ion卜lUA—_一升UA≯/J.//Ir一一一。/.//●/r—_f.。—一r一一一/●/j代——一_,“j/\\/√~●}—一。/’\、÷,图3-4accidents数据集上算法性能对比4.数据集为kosarak,共10000条记录,每条记录1到100个事务ID不等。Hash函数基数为13,Hash表长度为100000,哈希值碰撞的平均概率为3.68%。X坐标为支持度阈值,从0.02至O.01,步长为0.001,Y坐标为计算频繁模式集的运行时间。图3-5是kosarak数据集上算法性能对比。 第三章动态维护的关联规则算法研究--0-一A}}nOr.dr--UAm--}{lU≠/-J移参汐’∥矿爱螽,LI≤dp-y/卜——qk———d-—一一‘≮k一.,图3-5kosarak数据集上算法性能对比滞寄嚣i西5.数据集为pumsb,共5000条记录,每条记录1.到100个事务ID不等。Hash函数基数为13,Hash表长度为100000,哈希值碰撞的平均概率为3.68%。X坐标为支持度阈值,从0.95至0.92,步长为0.003,Y坐标为计算频繁模式集的运行时间。图3-6pumsb是数据集上算法性能对比。’.A#}rlOrI—·r—lLA_一H|U、卢广声∥—.叫▲/’,/r-广/霉P“一-▲、一/‘,P——f产√声、k—《/人~_/轧、0_95209470、9427。0:937a§320927疆g签0,917支持度丽疽图3-6pumsb数据集上算法性能对比6.数据集为零售行业73家公司08.10年季报中每股指标,盈利能力,偿债能类,经营能力,成长能力,现金流量,资本结构等7类共14个财物指标(finratio),共620条记录。数据集中将所有记录聚为3类,并将每个属性离散化为6个区问。x坐标为支持度阈值,从0.25至O。05,步长为O。02,Y坐标为计算频繁模式集的运行时间,可进一步从模式集中提取规则进行财务指标关联分析。图3.7是finratio数据集上算法性能对比。 北京化工大学搏士学位论文—●一A)rlOr一-●广-lUA——p}制U#\.IH{∥●—.,.,d0∥‘≮。—..一支持度目唐图3.7finratio数据集上算法性能对比7.数据集为某电视销售企业08.10年问共35个月现金、银行存款、固定资产、本年利润、流动资产等27个财务指标记录(nnforecast),在数据集中转换为每一条记录为连续3个月的财务指标数据,然后将每个属性离散化为6个区间。X坐标为支持度阈值,从0.4至0.2,步长为O.02,Y坐标为计算频繁模式集的运行时间,可进一步从模式集中提取符合预测约束的规则进行财务指标预测分析。图3.8是finforecast数据集上算法性能对比。—●一&Ir}OH●一IUA---.41一HlUA}?如\\,j,hd芦d∥卜_叫、.1^.}‘\图3-8finforecast数据集上算法性能对比由上述比较可以看到,HIUA首次执行时间近似于IUA,随着运行过程中不断利用已保存的支持度计数,HIUA的效率较IUA有明显提高。另外,当支持度阈值减小时,在局部频繁模式集有可能变化不大,这时IUA和HIUA的候选频繁模式集Ckl会较小,并且在HIUA的哈希表中又可以找到部分模式,所以如上述比较所示,会出现一些IUA,HIUA在支持度阈值下降时,运行时间反而会下降的情况。 第三章动态维护的关联规则算法研究本文改进了原始IUA算法的剪枝过程,并通过Hash结构对其优化,进一步提高了运行效率。并将HIUA应用到企业财务数据分析预测中,具有一定实际意义。而数据集规模变化时哈希表的维护,和离散化方式改变时频繁模式的维护则是进一步研究的内容。3.2关联规则的增量挖掘算法关联规则挖掘算法以Apriorit5l】、FPGrowth[56】等最具影响力和代表性,而这些算法的提出都是在数据库和最小支持度不变的条件下进行的,由于无法更新、维护和有效管理已挖掘出来的关联规则,进而严重限制了这些算法的使用[79,83】。在关联规则的实际应用中,目标数据库总是处在不断的更新与变化中,本文主针对新的数据添加到原有数据库中的关联规则更新问题,提出了二种基于部分支持度树结构的增量式更新‘算法IUPS。Miner。该算法充分利用旧的关联规则和已构建的部分支持度树(PS.Tree)来挖掘所有新的关联规则,由于只需扫描新添加的数据库一次,算法的效率得到了较大的提高瞵4|。并且通过实例数据和合成数据对其性能进行测试,给出了IUPSMiner算法与经典算法之间的时间效率比较结果。3.2.1利用部分支持度树挖掘关联规则文【85】中使用了一种称为部分支持度树的结构来挖掘关联规则:首先将数据库中的每一条事务映射到一个树型结构上,该结构对事务数据库有压缩功能,特别是对于高度密集型的数据,然后再在这棵树上利用深度优先的顺序挖掘出所有的关联规则。该算法描述如下。.算法1:采用基于PSTree的挖掘算法,PSMiner。输入为:事务数据库D,最小支持度S;输出为:所有频繁项FD,部分支持度树PSTreeD。步骤如下:l、扫描数据库D,构建PSTreeD;2、深度优先扫描PSTreed,不断生成满足最小支持度的频繁项FD。假设图3-9为一个数据库的更新情况。D为更新前的数据库;D+为新插入的数据库;D,为更新后的整个数据库。以D为考察对象,利用文【851中的算法产生的部分支持度树如图3.10所示。假设最小支持度为40%,s=lD[×40%=2,通过深度优先扫描PSTreeD,可以得到关于D的所有频繁项FD={11:3,1112:2,1113:2,12:4,1213:2,1214:2,13:3,14:2),冒号前面表示相应的频繁项,冒号之后的数字代表对应频繁项的支持度。 北京化工大学博士学位论文TID项广nl死D{乃{瓦L瓦l‘死}乃D+{%l码Lno图3-9事务数据库实例五3卜————_.;如:??~T⋯T”、如1,一一一,j14:l;。o警,薯、≥。。图3—10事务数据库D的部分支持度树PS_TreeD和FPGrowth算法一样,深度优先的算法PSMiner并不产生候选项,这也保证了PSMiner具有比Apriori更高的挖掘效率。给定事务数据库D、最小支持度S、事务数据集D+及旷,针对实际应用需求,关联规则的更新问题可以分为如下两种情况:(1)最小支持度S发生变化后如何生成D中的频繁项目集;(2)事务数据库D发生变化后如何生成最新事务数据库D+D+_矿中的频繁项目集。目前已经提出的可用于增量式更新关联规则的算法有Cheung等人提出的FUP、FUP2算法,冯玉才等人提出的处理最小支持度更改后的更新算法IUA等,这些算法都是建立在Apriori算法基础之上。算法FIUA给出了建立在FPTree上的增量式更新算法,但该算法在求新的频繁项的时候还是利用了Apriori的性质,这也极大地限制了该算法的运行效率。为此,本文针对最小支持度不变而新的数据集添加到数据库中的情况,提出了一种基于PSTree的高效增量式更新算法IUPSMiner,该算法将充分利用已有的一切信息(如旧的频繁项目集、原来的PSTree等)来高效发现所有新的4f毛b,昆“如如如,h如如h丘S,bb如,如如如如如,如厶hh^.=‘:j0珐∥∞~砖辩一、I一一..。,,、..。,¨、,,2㈡厂l■—r卜■。一如、l厶%矗~ 第三章动态维护的关联规则算法研究频繁项目集,算法只需一次扫描新增数据库D+。3.2.2基于PS_Tree的关联规则增量更新算法(一)理论依据定理1若某一项目集C在D中为频繁项目集,在D+中也为频繁项目集,则在D7中也为频繁项目集。证明:设用户指定最小支持度为S。由于项目集C在D中为频繁项目集,有c.supD≥吲×S,在D+中也为频繁项目集,有c.supo+>,[D+I×S,其中lD忏叩)+l为原数据库和新增数据库的总事务条数,又设C在D7中的支持度为S7,于是可得。S7=c.supD+c.supD+≥lDl×s+JD+I×s=(IDI+ID+1)×S.定理2若某一项目集C在D中为非频繁项目集,在D+中也为非频繁项目集,则在D7中也为非频繁项目集。证明如定理1。由定理2可得D7中的频繁项目集一定来自D的频繁项目集或D+的频繁项目集,即可得推论1。推论1FD,∈FDuFD+,其中FD,FD+和FD,分别为D,D+和D7的频繁项目集。(二)基于PSTree的关联规则增量更新算法算法IUPSMiner描述如下。输入:PS_TreeD,D+,FD,s;输出:而,,PSTreeD,。步骤:callPS_Miner(Dt,S,PSjteeD+,FD心FD?=CD=CDF西。?。forallfeFvi雎FD+fsup=fSIpD+fSUpD+FD—FD,UfelseCDUfendforCD+=FD+-FD,forallc∈CDdeeplyfirstlyscanPS_TreeD+andgetthec.SUpD+c.supD,=c.SUpDq-c.SUpD+1气 北京化工大学博士学位论文ifc.supD,>=lD7l木SFD,:FD,UCfora11c∈CD+deeplyfirstlyscanPS_TreeDandgettheC.SUpDc.supD,=c.SUpD+c.SUpD+ifc.supD,>=lD7f枣SFD,:FD,UCPsjteeD=MergePSjIee(PS_TreeD,PS_TreeD+)以图3-9所示数据为例,假定最小支持度不变,当事务数据库D+添加进来时,利用PSMiner对D+进行扫描。图3-11是扫描D+得到PSTreed+。继4-————————叫j勉lj一薯1}尹’“、i。:’1『『∥;鬈,j}一≤爨参。ji.÷::i/纛3愚,?≮守≯。、、戳ii爹。、《囊_;7≯厶:3;一}I_『¨‘:/5:l:图3.11事务数据库D+的部分支持度树PSTreeD+扫描PS_TreeD+,得到所有关于D+的频繁项目集合FD+=∞:4,1112:3,h6:4,厶1213:3,h:4,厶h:4,h:5),由而+、而及定理1可以得出所有在D和D+中-都频繁的项集集合F7={厶:7,乃:8,h:8,厶h:5,//h:6,厶h:6,)C]TD,,CDFD-F7--{14:2,已14:2)为在D中频繁而D+中不频繁的项集集合,CD+=而+-F7=弛局h:3)为在D+中频繁而D中不频繁的项集集合。接下来的工作,只是需要将cb和c『D+中的项集分别从PSTreed+和PSTreed中得到各自项集的全局支持度,最后通过与最小支持度进行比较,将满足最小支持度的项集再添加到FD,中去即可。最后得到更新后所有频繁项集的集合而,=函:7,h:8,13:8山h:5,厶h:6,乃h:6,hhh:4)。算法在最后一步通过MergePSTree完成了两个部分支持度树的合并,得到了一棵新的关于整个更新后的数据库的部分支持度树PSTreed,,这样是为了下次再插入新的数据时还可以使用这个算法,从而提高算法的可适应性。算法MergePSTree的描述如下。36 第三章动态维护的关联规则算法研究输入:PS_TreeD,PSTreeo+:输出:PS_Treeo,。步骤:矿PS_Treeo,q=PSTreeD+ifp.child!=NULLandq.child!=NULL)ifp.item--q.item)P.sup=p.sup+q.supp印->child,q=q一>childp=MergePS_Tree(p,g)elseifp.itemrchildp=MergePS_Tree(p,g)r->r.child=pelseI—pq=q->r.childp=MergePSjtee(p,前r->r.child=pelseif((p.child--=NULLandq.child!=NULL)P.child=qelse『p->r.childq=q·>r.child『MergePSjtee(p小returnPS3t皖DendMergePS_Tree算法采用以深度优先的顺序来合并PS_TreeD禾DPSTreed+。实验表明,和重新扫描数据库构建新的部分支持度树的时间相比,当有新的数据D+插入时,合并算法消耗的时间是非常少的,特别是当插入的数据D+的元组数占原始数据的元组数比例较小时,该合并算法的效率更加明显。用MergePS_Tree将图3—10和图3-11的部分支持度树合并成一棵新的部分支持度树PSJreeD,。图3—12是合并后的部分支持度树PSTreeD7。 北京化工大学博士学位论文1l:,一』2:j}._2r’7冬妻—一、/。3秀多。。/3.:|:2囊一"k---盘裂1.一?l7I|⋯一一”‘”’“13:3_厶:::1一/5:1;、IjI』j童。∥’麓鬻-{;¨j冬翟。一受曼j爹图3.12合并后的部分支持唐树PSTreeD,3.2.3性能分析与算法比较对于本文所考虑的关联规则增量式更新问题,最具影响力的算法是FUP,而FPGrowth是不采用增量更新来挖掘关联规则的快速算法。现在就将IUPSMiner与这两个算法进行性能比较。用VisualC++6.0在内存为DDR512M、CPU为P42.4G的PC,在Windows2000Server环境下实现以上3个算法,采用了一组合成数据T40110D100K和一个实例数据CHESS.DAT,分别用D1和D2来描述它。三种算法在这2个数据中的比较结果如下图所示。图3.13是s=1.00%使用T40110D100K对3个算法性能比较;图3.14是s=1.50%使用T40110D100K对3个算法性能比较;图3.15是s=20%使用CHESS对3个算法性能比较;图3.16是s=30%使用CHESS对3个算法性能比较。|D+I/(1Dl+ID+1)图3-13使用T40110D100K,s=1.00%三种算法的性能比较图3.14使用T40110D100K,s=1.50%三种算法性能比较38 第三章动态维护的关联规则算法研究图3.15使用CHESS,s-20%三种算法性能比较图3.16使用CHESS,s-30%三种算法性能比较就数据D,采用了两个不同的固定最小支持度(分别为1.00%和1.50%),由于数据库CHESS是包含较长频繁项集的数据库,采用较高的最小支持度(20%和30%)来对算法进行比较。图3.15和图3.16表明了支持度不变的时候,当插入新的数据库时,算法IUPSMiner获得了很好的性能。事实上,由于IUPSMiner采用了非Apriori性质的策略(深度优先)来生成频繁项集,没有产生大量的候选项,从而算法的效率必然比采用Apriori的FUP算法来得要高。另外一方面,因为采用PSTree的结构,减少了大量的I/O操作,当数据可以常驻内存的时候,更新算法中只需对更新的数据库进行一次扫描即可,时间消耗也必然比重新运行一次FPGrowth要来得少,特别是当添加的数据和更新后的数据库相比相对较小((ID+I/(IDl+ID+1)比较小)的时候,IUPS—Miner的优势尤为明显。本文就关联规则的增量式更新问题进行了探讨,提出了基于PSTree的高效增量式更新算法IUPSMiner,以处理最小支持度不变而添加了新的事务数据库时的关联规则更新问题。理论与实验结果表明,该算法具有较好的性能。如何将本文所提方法应用于添加和删除数据库的同时允许修改最小支持度S的关联规则增量更新问题,即关联规则的动态维护算法将是下一节的重点研究内容。39 北京化工大学博士学位论文3.3关联规则的动态维护算法提高算法效率是关联规则研究的重要内容,而在数据库和支持度阈值同时变化的情况下,利用已有的信息进行增量挖掘和交互挖掘是提高算法效率的有效手段。在不同的支持度阈值和不同的置信度阈值下,算法产生的频繁模式以及关联规则的数目是不同的,由于用户事先不知道合适的支持度以及置信度阈值,因此用户可能需要不断的尝试不同的阈值才能得到理想的频繁模式和关联规则【391。针对支持度阈值变化的情况,冯玉材等人利用已经挖掘的信息,提出IUA算法,该算法是基于Apfiofi算法的。另外由于数据库通常都是不断更新的,所以针对数据库规模增长的情况,DavidW.Cheung等充分利用了以挖掘的信息,提出FUP算法。增量挖掘算法还包括UWEP[86】算法,以及之后出现的FUFP—tree【87】、IFP.Gro吼h【88,89]、TTF和PTF[901等上述算法的改进算法,但它们均没有考虑数据库和支持度阈值同时变化的情况。‘同时,随着数据仓库与数据挖掘技术的不断发展,借助关联规则挖掘辅助分析人员进行财务分析逐渐成为了可能,近年来,不断有学者将关联规则挖掘应用于股票数据分析预测【911,以及财务指标之间的关联分析等【8们。目前大部分关联规则算法均基于支持度.置信度框架,方法包括以Apfiofi为代表的基于候选模式生成与测试的算法,和FP.Growth以为代表的基于模式增长的算法。本文鉴于以上两种算法无法解决数据库规模增长与支持度阈值变化同时发生的情况,基于IUA与FUP算法,提出一种关联规则动态维护算法ARDM(AssociationRulesDynamicMaintenance),并对该算法在财务指标与财务比率分析中的应用作了研究。3.3。1算法描述ARDM:设SptThr为支持度阈值,CfdThr为置信度阂值,DS为新数据集,DSInc为新数据集与原数据集的差,即增量数据集,Ptni为长度为i的模式,Ptni.Cnt为长度为i的模式在相应数据集中的支持度计数,Ci、Li分别为长度为i的候选模式集、频繁模式集,LBase为原数据集频繁模式集,Llnc为增量数据集频繁模式集,LOrg为原支持度下频繁模式集,LNew为由LNewl的模式集生成的频繁模式集,Rules为规则集。(1)IUA_Oen输入:模式长度k,LOrg,LNew输出:Lk3IUA_Gen(k,LOrg,LNew){for(i=1tok){foreachPtniinLOrgi{ foreachPtnk.iinLNewk_i{Ck.Add(Concat(Ptni,Ptnk-O);)returnselectPtnksfromCkwhereeachPtnk.1inPtnkexistinLk-l;)(2)IUA_GenLk输入:模式长度k,LOrg,LNew,L,DS,SptThr输出:LkIUAGenLk(k,LOrg,LNew,L,DS,SptThr){Lkl:selectPtnksfromApriori_Gen(LOrgk-0wherePtnkisnotinLOrgkandPtnk·CminDS>=SptThr;L0:selectPtnksfromApriori_Gen(LNewkq)wherePtnk.CntinDS>=SptThr;Lk3=IUA_Gen(k,LOrg,LNew);retumUnion(Lkl,砰,Lk3);)(3)IUAwithHash输入:LOrg,DS,SptThr输出:新支持度下LIUAwithHash(LOrg,DS,SptThr){L1:SelectPtnlfromDSwherePtnl.Cnt>=SptThr;LNewl=L1-LOrgt;f.or(k=2;Lkqisnotnull;k++){Lk=IUA_GenLk(k,LOrg,LNew,L,DS,SptThr);)retumUnion(Ll,L2,...,Lk);)(4)FUPwithFP—Growth输入:LBase,DSInc,SptThr输出:新数据集下LFUPwithFP.Growth(LBase,DSInc,SptThr){Line=FP.Growth(DSInc,SptThr);L1=Intersect(LBase,Line);L2:selectPtnsfromLBase.L1where(Ptn.CntinDSBase)+(Ptn·CntinDshc)>241 北京化工大学博士学位论文SptThrL3=selectProsfromLInc.L1where(Ptn.CntinDSBase)+(Ptn.CntinDSInc)>=SptThrreturnUnion(L1,c2,L3);)(5)ARDM输入:SptThr,CfdThr,DSInc输出:新数据集下L、RulesARDM(SptTI'n-,CfdThr,DSInc){if(SptThrchanged){if(SptThrwentup){L=selectPtnsfromLwherePtn.Support>=SptThr;)’else{L=IUAwithHash(L,DSBase,SptThr);)if(DSlncisnotnull){L=FUPwithFP-Growth(L,DSInc,SptThr);)if(SptThrchangedIICfdThrchangedllDSsiz.eincreased){if(CfdThrwentup&&SptThrdidn’tchange&&DSsizedidn’tchange){Rules=selectRulesfromRuleswhereRule.Cfd>=CfdThr;>.else{Rules2GenerateRules(L,CfdThr);)retumL,Rules;)3.3。2算法分析(1)IUA_Gen算法分为拼接和修剪两个步骤,首先通过对LOrg中的LOrgi与LNew中的LNewk-i进行拼接,然后对于每个Ptnk,如果它的任意Ptnk-1均属于Lk-1则将它添42 第三章动态维护的关联规则算法研究加至Lk3。.(2)IUA—GenLk算法基于观察l,对于ckl,ck2直接使用ApfiofiGen函数生成,并由CkI剪切生成Lkl,Lk3由IUA—Gen生成,并返回LkluLk2ULk3,本文对IUA_GenLk算法进行的优化是在数据集不变的情况下,将模式的支持度计数保存在Hash结构中。(3)IUAwithHash算法首先计算Ll和LNewl,然后通过IUAGenLk迭代生成Lk,并返回LluL2u⋯uLk。(4)FUPwithFP.Growth算法首先通过FP.Growth算法得到Line,然后基于性质2,通过LBase与LInc相交,并通过更新LBase与LInc中模式的支持度计数来产生新频繁模式集。(5)ARDM算法对IUA与FUP算法进行了整合与优化,分为维护L,维护Rules两部分。在维护L时,如果SptThr发生变化,则更新原数据集LBase,如果DSInc非空,即数据集增长,计算DSIIlc的LInc,并结合原数据集LBase更新新数据集L。在维护Rules时,如果只有CfdThr发生变化且CfdThr上升,则在原数据集Rules中筛选,否则由新数据集L重新计算Rules。3.3.3性能测试本文通过比较ARDM算法与FP.Growth算法在3个数据集上的运行时间以分析ARDM性能。ARDM算法和FP—Growth算法均通过C撑(.Net4.O)实现,运行环境为i5处理器,2G内存,Win7系统。在支持度阈值上升的情况下,因为ARDM只需在频繁模式集中筛选新的频繁模式,ARDM的运行时间显然要更快,这里只对支持度阈值下降和数据及规模增大情况下两种算法的运行时间进行比较。第一个数据集为事务型稀疏数据集Retail,每条记录包含1至50个事务ID不等,共88162条数据。FP-Grwoth,一,77一、~一~。,7。/、、吗~~‰、、Ⅵ图3一17FP.Growth算法在Retail上的运行时间43 北京化工大学博士学位论文图3.17、图3—18分别为FP.Growth算法与ARDM算法运行时间对比,数据集规模从17625至88126(步长17625),支持度阈值从O.1下降至0.05(步长0.01)。其中:x坐标为数据集规模(记录条数),Y坐标为支持度阈值,z坐标为运行时间,可以看到,ARDM的运行时间少于FP.Growth。图3.17是FP.Growth算法在Retail上的运行时间。图3.18ARDM算法在Retail上的运行时间第二个数据集为事务型稠密数据集Accidents,每条记录包含1至80个事务ID不等,共340183条数据。以下两图为FP.Growth与ARDM运行时间对比,数据集规模从68036至340183(步长68036),支持度阈值从O.95下降至O.9(步长O.01)。其中x坐标为数据集规模(记录条数),Y坐标为支持度阈值,Z坐标为运行时间,可以看到,ARDM的运行时间少于FP.Growth。FP矗rowth图3.19FP—Growth在Accidents上的运行时间 第二三章动态维护的关联规则算法研究图3.20ARDM在Accidents上的运行时间第三个数据集为属性型数据集,数据稠密度介于以上两个数据集之间,每条记录20个属性,每个属性6个取值,共5000条记录。以下两图为FP.Growth与ARDM运行时间对比,数据集规模从1000至5000(步长1000),支持度阈值从o.2下降至O.1(步长O.02)。其中x坐标为数据集规模(记录条数),Y坐标为支持度阈值,Z坐标为运行时间,可以看到,ARDM的运行时间少于FP—Growth。图3—21FP.Growth在属性型数据集上的运行时间,图3—21FP—Growth在属性型数据集上的运行时间。图3—21FP—Growth在属性型数据集上的运行时间45 北京化工人学博I:学位论文图3.22ARDM在属性型数据集上的运行时间ARDM算法充分利用了原频繁模式集信息,并且通过FP.Growth算法对FUP进行了优化,通过Hash结构对IUA进行了优化。在支持度阈值上升和置信度阈值变化的情况下,由于不需要再对数据集进行扫描,算法的效率很高。在当数据集规模变化不频繁,支持度阈值变化频繁时,由于Hash结构已经记录了模式的支持度计数,大大减少了数据集扫描次数,算法性能有很大提升。由于ARDM算法中的IUAwithHash和FUPwithFP—Growth在测试候选模式时需要对数据库进行多次扫描,所以当数据集较稀疏,支持度阈值较低时算法的优势较为明显。3.4小结●本章提出了关联规则的三种改进型挖掘算法,第一,基于Hash结构的关联规则交互挖掘算法HIUA,它是针对支持度阈值变化时的关联规则维护问题,,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。第二,基于部分支持度树的关联规则增量式更新算法IUPSMiner,该算法利用部分支持度树的结构提出了对关联规则的增量式更新算法,主要用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用己挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。第三,关联规则的动态维护算法ARDM,它主要应用于数据库和阈值同时发生变化的情况。现有的挖掘方法普遍存在多次扫描数据库或重复遍历复杂数据结构的问题,该算法是基于IUA与FUP算法,提出数据库与支持度阈值同时变化情况下的关联规则维护算法,并通过Hash结构与模式增长方法进行优化。 第四章基于关联规则交互挖掘的企业财务风险分析未来是不可预测的,它具有不确定性,但是,不确定性当中又包含有规律性,就需要我们用科学的方法去发现规律,并解释我们发现的规律。企业发展过程中的不确定性既代表风险,又代表机会,企业风险管理主体在面对风险挑战时,要分析所能承受的不确定性,并且能够有效应对不确定性以及由此带来的风险和机会,增进创造价值的能力【92,931。国资委在2006年发布的《中央企业全面风险管理指引》认为:“风险就是不确定性,企业风险是指未来的不确定性对企业实现其经营目标的影响"[94】。来自不确定性的企业风险又是可以管理和控制的,通过对企业的风险分析、风险评估和风险控制活动,达到将企业发展中的不确定性转化为机遇,并通过数据挖掘技术寻找企业风险管理中的规则,为实现企业的发展战略、提升企业内在价值服务,为企业辅助决策支持服务p5|。4.1企业财务风险分析理论4.1.1企业风险管理理论美国内控研究委员会认为企业风险管理是一套由企业董事会与管理层共同设立、和与企业战略相结合的管理流程【961。它的功能是识别那些会影响企业运作的潜在事件和把相关的风险管理到一个企业可接受的水平,从而帮助企业达至它的目标。企业风险管理各个环节如下图4.1所示:要素冀羹图4-1企业风险管理——整合框架47嗣耘;维 北京化工大学博士学位论文2企业风险分析的流程企业风险的类别包括:法律与政策风险、财务风险和经营风险三个类别。企业风险分析的程序包括:1、分析风险因素、风险事故、捕捉风险征兆;2、确定风险的存在;3、确定风险的可能性和频率,确定有影响的要计量损失额;4、评判风险的性质和级别;5、评估风险:将本次风险与风险评价标准比较,排定风险次序;6、做好沟通与协调;7、对风险进行监督与审核。企业风险分析的程序可用流程图4.2表示:图4-2企业风险分析的流程图4.1.3企业财务风险管理的理论企业财务风险管理的理论是在企业风险管理理论的框架内,并且服务于企业风险管理。企业财务风险管理的环节包括:确定目标、财务风险识别、财务风险分析、财务风险评估与预警和控制财务风险等五个方面【971。确定目标是企业财务风险管理的首要任务,只有确立了目标,管理层才能针对目标风险并采取必要的行动来管理风险。在整个风险管理过程中,目标如同路标,为行为指明了前进的方向,目标代表了组织未来的发展愿望。财务目标是企业目标的细化,财务管理的具体目标包括货币资金管48 第四章基于关联规则交互挖掘的企业财务风险分析理的目标、成本费用管理的目标、信用政策的目标以及财务报告质量提高的目标等等f98】o财务风险识别是企业财务风险管理的基础,识别风险也是在企业确定了相关的财务目标之后,利用各种方法对影响企业财务目标实现的内、外冲毁事件进行分析和确认。财务风险识别的方法是通过各种渠道,采用各种手段及时获得足够、真实的财务信息,并对这些信息进行整理、归类、分析,从而作出定性的初步判断。财务风险分析是指在风险识别的基础上对财务风险的特征进行明确的定义描述。美国詹姆斯·林在《企业全面风险管理:从激励到控制》中指出:风险计量分析是风险管理过程中极有价值的一部分,没有适当的分析工具而试图管理风险,犹如没有仪器装备而试图驾驶飞机一样,在天气良好的时候,一切顺当,机构可能不会遭遇实质性的损失,但是,当天气变坏,机构就可能处于严重的危险之中而且无所适从【991。财务风险评估与预警是指在企业财务风险分析的基础上评估风险发生对企业所造成的影响程度,并建立风险预警机制【1删。财务风险评估应该从量化和非量化因素角度进行风险程度重要性水平进行界定,财务危机预警可以按指标性质分为危机、高度风险、低风险、正常、优良五个级值进行界定。图4—3是企业风险管理的五个环节。图4-3企业风险管理的五个环节4.2基于关联规则交互挖掘的企业财务风险分析方法企业财务风险分析的方法包括定性分析和定量分析两类,定性分析的方法主要是通过描述企业财务风险的特征、征兆及发展演变过程,并提出一些化解风险的建议。定量分析的方法主要是选取合适的风险分析模型和风险分析指标,对风险程度进行定量描述,并界定企业财务风险的等级。定量分析的方法与定性分析的方法相比更具有49 北京化工大学博士学位论文实际的意义,它能为管理层控制风险而采取措施提供理论和现实依据。定量分析方法的核心是建立风险分析指标体系和.风险分析模型‘tOl,102]。4.2.1企业财务风险分析指标体系以前学者在进行财务风险分析时曾经采用构建财务指标体系的方法,并且也取得了一定的研究成果【10扪。但是,财务指标的选择方法通常是根据个人对企业财务风险的认识和自己的经验判断,带有很强的主观性。本文选择财务指标的方法是通过数据挖掘的方法,比较所有财务指标,根据财务指标的相关性,最后决定选择哪些财务指标,具体相对的客观性。指标体系主要包括五个方面,具体内容如下:(一)企业盈利能力指标企业盈利能力反映企业获取利润的能力,企业只有长期盈利,才有抗击财务风险的能力,并迅速补偿因财务风险造成的各种损失,企业的盈利能力是所有财务指标中最重要的一个核心指标[104】。一般来说,企业的盈利能力通过以下几个方面的财务指标来反映和衡量。1.毛利率指标是指本期销售收入减去销售成本与本期销售收入的比率。2.营业利润率指标是指本期营业利润与本期销售收入的比率。3.净利润率指标是指本期净利润与本期销售收入的比率。以上三个指标都属于利润率财务指标,反映企业一定时期单位销售收入给企业带来的收益水平。利润率指标既可考核企业利润计划的完成情况,又可比较各企业之间和不同时期的经营管理水平,提高经济效益,利润率越高则反映企业的获利能力越强。4.每股收益指标是指本期净利润与总股份数之间的比率。5.净资产收益率指标是指本期净利润与净资产平均值之间的比率。6.总资产收益率指标是指本本期净利润与总资产平均值之间的比率。上述指标中,每股收益越高代表企业的盈利能力很强,同时也可以代表所有股东可以分得的红利就越高。净资产收益率是衡量企业盈利能力重要指标之一,它反映了股东权益的收益水平,净资产收益率可以直观的评价企业运用净资产带来的收益情况,它也是企业股利决策的重要基础。但是,净资产收益率高的企业并不代表它的盈利能力就一定很强,还要看企业的总资产收益率情况。总资产收益率是衡量企业全体股东和债权人共同投入资金的盈利能力的指标,总资产收益率越高代表企业运用资产的盈利能力就越强,但是,它是一个相对指标,评价单个企业总资产收益率的高低通常要与同行业其他企业的水平相比较才能得出结论。(二)企业营运能力指标营运能力是反映企业资产周转效率的指标,资产周转速度越快,反映企业生产和50 第四章基于关联规则交互挖掘的企业财务风险分析销售等经营环节的速度就快,经营效率就越高,形成收入和利润的周期就越短【1051。营运能力主要通过五个方面的财务指标来反映:1.应收帐款周转率指标是指本期赊销收入净额与本期应收帐款平均余额之间的比率。2.存货周转率指标是指本期销售成本与本期存货平均余额之间的比率。3.流动资产周转率指标是指本期销售收入净额与本期流动资产平均余额之间的比率。上述三个指标都是反映流动性资产周转率的财务指标,其中:应收帐款在企业流动资产中占有重要的角色,应收帐款周转率就是反映企业应收帐款周转速度的比率,一般来说,应收账款周转率越高越好,表明企业资产流动速度快,营运能力强。存货周转率是企业销售成本与平均存货余额的比率,反映存货的周转速度,即企业存货的流动性及存货资金占用量是否合理,一般来说,存货周转速度越快表明企业的流动性越强。流动资产周转率指企业主营业务收入净额同平均流动资产总额的比率,流动资产是企业全部资产中流动性最强的资产,流动资产周转率是评价企业资产利用率的重要指标,反映了企业流动资产的周转速度,一般来说,该指标越高,表明企业流动资产周转速度越快,效率越高。4.固定资产周转率=销售收入净额/固定资产平均净值=销售收入净额/(期初净值+期末净值)÷2。5.总资产周转率=销售收入净额/总资产平均值=销售收入净额/(资产总额年初数+资产总额年末数)÷2。上述两个指标都是反映固定性资产周转率的财务指标,其中:固定资产周转率也称固定资产利用率,是企业销售收入与固定资产净值的比率,固定资产周转率主要用于分析企业对厂房、设备等固定资产的利用效率,比率越高,说明利用率越高,管理水平越好。总资产周转率是指企业业务收入净额同总资产平均值的比率。总资产周转率反映了企业整体资产的营运能力,一般来说,资产的周转次数越多或周转天数越少,表明其周转速度越快,营运能力也就越强。每股净资产是指股东权益与总股数的比率,其计算公式为:每股净资产=股东权益÷总股数,通常每股净资产越高越好。(三)企业成长能力指标成长能力指标是反映企业在一定时期内的经营能力【106】。这些指标主要有以下几种。1.净资产增长率是指企业期末净资产总额减去期初净资产与期初净资产总额的比率。净资产增长率反映了企业净资产的增长情况,同时也反映了企业资本规模的扩张速度,是衡量企业总量规模变动和成长状况的重要要财务指标。2.总资产增长率=本年总资产增长额/期初资产总额=(期末总资产一期初总资 北京化工大学博士学位论文产)/期初总资产。总资产增长率反映企业总资产增长情况。总资产的增长来源于两个方面:一是所有者权益的增加,二是公司负债规模的扩大,总资产的增长率越高,表明企业一定时期内资产经营规模扩张的速度越快。3.主营业务收入增长率是指本期主营业务收入减去上期主营业务收入与上期主营业务收入的比率。4.净利润增长率是指本年净利润减去上年净利润与上期净利润的比率。净利润反映当年可供出资人分配的净收益,也称为税后利润。净利润多,企业的经营效益就好,净利润少,企业的经营效益就差,它是衡量一个企业经营效益的重要指标。5.每股收益增长率=(本期每股收益一上期每股收益)/(上期每股收益)=(本期净利润/本期总股本一上年同期净利润/上年同期总股本)/(上年同期净利润/上年同期总股本)。每股收益增长率反映企业业绩增长情况,每股收益增长率来源于资本性开支、资产周转率、营业利润率的增长,同时净负债比率和股息分配率必需下降才行。需要注意的是,每股收益增长率在企业扭亏为盈和由盈转亏的情况下,或是原来的每股收益极低的时候会失去指导意义。(四)企业偿债能力指标企业偿债能力指短期和长期两个方面的偿债能力,企业短期偿债能力不足,不仅会影响企业的社会信誉,增加以后筹集资金的难度与成本,还可能使企业陷入生产经营的危机,一般来说,企业的流动比率为2,速动比率为1比较安全叫71。1.流动比率指标是指全部流动资产与全部流动负债之间的比率。2.速动比率指标是指全部流动资产减去存货与流动负债之间的比率。3.现金比率指标是指所有现金加上有价证券与流动负债之间的比率。流动比率高反映企业短期偿还债务的能力强,但是流动比率过高,可能是积压大量存货和应收账款或拥有过多的现金。速动比率反映企业使用速动资产偿还短期内到期债务的能力,速动资产企业短期内可变现的全部资产。通常速动比率高则流动性强,速动比率低则流动性越差。现金比率反映企业使用现金及现金等价物偿还到期债务的能力,通常现金比率高则流动性强,但是企业的获利能力可能会受到影响;现金比率低则流动性越差,偿债短期债务的能力就弱【108】。长期偿债能力是指企业偿还长期债务(本金+利息)的能力,通常企业的长期偿债能力用负债比率和利息收入倍数两项指标来衡量。4.利息支付倍数反映企业本期营业利润与利息费用的比率,如果比率值越大则企业偿债能力越强。5.股东权益比率反映所有者权益总额对资产总额的比率,比率越高则偿还长期52 第四章基于关联规则交互挖掘的企业财务风险分析债务的能力越强,反之则偿还长期债务的能力越弱。5.资产负债率又叫财务杠杆,该比率越高则偿还债务的能力越弱,比率越低则偿还债务的能力较强,债权人发放贷款安全程度较高,同时也反映出企业没有很好地利用其资金【1091。(五)企业现金流量指标企业现金流量指标在企业的管理与决策中起着重要的作用,现金流是一个动态流动的过程,应该使用动态监测的方法去研究和分析企业的现金流量指标nm】。1.经营现金净流量对流动负债的比率反映本期经营活动所产生的现金净流量能否支付所有流动负债,通常比率越高则偿还流动负债的能力越好。2.经营现金净流量对负债的比率反映本期经营活动所产生的现金净流量足以抵付总负债的比率。一般来说,比率越高,说明资产的流动性越强,偿还债务总额的能力越强。3.经营现金净流量对净利润的比率反映企业净利润与经营活动产生净现金流量差异的变化,以便反映企业经营的真实的获利能力。4.经营现金净流量对销售收入的比率反映企业经营活动产生净现金流量与销售收入之问的比率。除了上述五个方面的财务指标外,还有一些财务指标如:营业收入、每股净资产、每股现金流量等,它们并不属于哪一类指标,但是它们在企业进行风险分析时起着非常重要的作用,本文研究过程中也将它们选入风险分析指标体系。4.2.2财务指标的相关性分析根据财务分析理论的研究成果:运用传统的分析变量相关系数度量的方法,选取一些样本公司的财务指标进行相关性分析,剔除其中的一些高度相关的财务指标。相关性相关系数可以用如下公式表示:rx护—堡髦墅二一(4-1)“。√胛∑x;一(∑Xi)2√咒∑y;一(Xy,)2其中:X和Y表示两个变量,rx,y表示两个变量的相关系数,且一1≤rx,y≤1。当lrx.vl=1时表示X和y完全线性相关。其中:rx,y=1时表示x和Y完全正相关,rx,y=一1时表示X和Y完全负相关。rx.v=O时表示x和y1不相关,在绝大多数情况下,一1l,这时X和Y之间存在一定的线性关系。 4.2.3按照区间划分定义风险等级关联规则数据挖掘按照所挖掘的数据类型可分为三种:布尔型关联规则、类别型关联规则和数量型关联规则[111,112]。企业财务数据都具有连续性的特点,因此,如何有效地将具有连续属性的财务指标数据离散化是挖掘数量型关联规则的关键步骤。根据财务指标数据的取值特点,现将所有财务风险指标按照区间划分为5个风险等级,具体的区间划分风险等级如下表4.1所示:表4-1企业财务指标风险等级定义表攀鬻戮戮豁瓣黼零蠹j攀攀i鬻i鬻险攀;缀i鬻麟薹灏荔攀蕊隆、≯级二豢ii雾嘴零缓j=一鬻雾露羹黪妻级.鬃毛利率人丁0.6[0.6,0.2][0.2,一0.2][-0.2,一0.6]小丁二一0.6营业利润率大丁0.5[0.5,0.1][0.1,一0.1][一0.1,一0.5]小于一0.5净利润率人丁_0.4[0.4,0.1][0.1,一0.1][-0.1,-0.4]小丁二一0.4每股收益(元)人_r.1[1,0.3][O.3,一0.3][-0.3,-1]小于一1净资产收益率人丁-0.4[0.4,0.1][0.1,一0.1][·0.1,一0.4].小于.0.4总资产收益率人丁.0.3[0.3,0.1][0.1,一0.1】[·0.1,一0.3]小丁二一0.3应收帐款周转率(次)人丁.100[100,50】[50,20][20,5][5,0]存货周转率(次)人丁100[100,50][50,20][20,5】[5,0]流动资产周转率(次)火丁.10[10,5][5,2][2,0.5][0.5,0]固定资产周转率人丁二5[5,3][3,1][1,0.5][0.5,0]总资产周转率人于5[5,3][3,1】[1,0.5][0.5,0]净资产增长率人丁^1[1,0.3】[O.3,0.1][0.1,0]小丁.0总资产增长率人丁^1[1,0.3][0.3,0.1][0.1,0]小丁.0主营业务收入增K率人丁二0.6[0.6,0.2][O.2,一0.2】[一0.2,-0.6]小丁^一0.6净利润增长率人丁-0.5[0.5,0.1】[0.1,一0.1][一0.1,一0.5]小丁-一0.5每股收益增长率人丁0.5[O.5,0.1][0、1,一0.1][一0.1,一0.5]小于一0.5流动比率人丁.3[3,2][2,1][1,0.5][0.5,0]速动比率人丁-2[2,1.5][1.5,1][1,0.5][0.5,0]现金比率人于3[3,2][2,1]【1,O.5][0.5,0]利息支付倍数·人丁二10【10,2][2,-2].[一2,10】小于.10股尔权益比率[1,0.8][O.8,0.6】[0.6,0.4][0.4,0.2][0.2,0】资产负债率[0.2,0][0.4,0.2][0.6,0.4][0.8,0.6][1,0.8]经营现金净流域对人丁|5[5,t][1,0】【0,-0.5]小丁.0.5流动负债的比率资产的经营现金人丁.0.5[0.5,0.1】【0.1,-0.1][一0.1,-0.5]小丁..0.5流量同报率经营现金净流量对人丁1【1,0.5][0.5,0][0,-0.5]小丁.0.5负债的比率经营现金净流量对人丁-1[1,0.5】[O.5,0】[0,-0.5]小于.0.5净利润的比率经营现金净流量对销售收入的比率人丁1【1,0.5]【0.5,0]【0,一0.5]小于一0.5营业收入(百万元)人r1000[1000,100][100,50][50,10][10,0]每股现金流量(元)人于1[1,0.5][0.5,0][0,一0.5]小于一0.5每股净资产(元)心‘S[5,2][2,1][1,0.5][0.5,0] 第四章基于关联规则交互挖掘的企业财务风险分析当然,不同的设计者对于财务风险的感受并不.一样,因此风险定义表中的风险划分区间并不是固定不变的,可以根据需要进行调整。4.2.4基于关联规则交互挖掘的企业财务风险分析模型利用关联规则交互挖掘算法对企业的财务风险指标进行挖掘,寻找财务指标体系之间的规则,并分析引起企业财务风险的真正根源,为企业摆脱财务风险的影响奠定基础。(一)风险概念层次树的构建建立企业财务风险分析模型的关键是根据财务指标体系构建风险概念层次树,财务指标体系包含对企业的盈利、营运、成长、偿债能力和现金流量方面的分析,其中的每个模块又分别包含不同的财务指标概念。在概念层次树中,利用高层次概念替换低层可实现数据的泛化【113】。财务风险概念层次树结构共分为四层,分别为层次0、1、2和3,层次O是最高层,是树的根结点标记,指企业财务风险等级。层次1是第二层,指企业财务风险的五个方面,层次2是第三层,包括企业财务风险的综合关键指标,具体内容包括:利润率、投资回报率、流动性资产周转率等。层次3是最低层,是描述财务风险最具体概念的指标层次,具体内容包括:毛利率、净利润率、每股收益、应收帐款周转率等。图4.4是企业财务风险概念层次树结构。撼树隧力lI曹遮熊:力l缓舞能力1l偿靛能力lI现盔漉鼙露溺ll投资墅lll潍葫住瓷I|礤迩性斑ll资产增II收益燧Il搬期憝ll毫:=竣澄1l耀金漉鼗畿ll蜣惫流露获攀lI报鬻ll产周转攀lI产J骂转零Il长率Il长攀ll债戆力lI翁髓力ll使穗力姥攀Il稠艉办澈攀滩图4_4是企业财务风险概念层次树结构经费税盘净溉麓射流动负馕豹}:l:箍i经营缆金净瀛辍对疑馕的比盛缀臀现盒净溉蹙对销锵救入比攀缀簧残衾净流辍瓣净;手Ij滤酶孢奉财务风险概念层次树描述了从高层概念到低层概念之间的相互关系,在数据挖掘过程中重点是对低层次概念进行挖掘,可以对所有指标共同挖掘,也可以对每个模块 北京化工大学博士学位论文分别时行挖掘,然后再延伸到它对应的高层次概念进行挖掘,寻找财务指标之间的规律。(二)递减支持阈值的交互挖掘策略递减支持阈值的交互挖掘策略是指风险层次树的每一层次都对应一个最小支持阈值,财务指标层次越低,对应的最小支持阈值就越小。如下图所示第一层次的最小支持阈值为20%,第二层次的最小支持阈值为10%,第三层次的最小支持阈值为5%,假设流动比率和现金比率等是频繁项集。图4.4是递减支持阈值的交互挖掘策略对于不同层次之间的关联规则在考虑最小支持度时,应根据较低层次的最小支持度来确定。图4-5递减支持阈值的交互挖掘策略(三)数据挖掘与结果输出.运用关联规则的交互挖掘算法对企业财务风险层次树进行逐层挖掘,并根据用户的要求对不同层次的挖掘可以调整支持阈值,最后得到用户满意的结果为止。4.3企业财务风险分析实证研究在实证研究过程中,考虑企业财务数据一般不容易取得,为了方便做实证研究,本研究选择国内上市公司作为研究对象,数据来源为新浪财经提供的企业年度和季度报表。4.3.1样本企业的选取样本企业的选取是否合理,将直接影响研究结果。在对企业财务风险分析的研究中,选择上市公司中的sT公司作为样本企业,主要考虑sT公司是上市企业中连续两 第四章基于关联规则交互挖掘的企业财务风险分析年出现亏损,企业财务风险较大,具有一定的代表性。本研究以1995—2010年上市企业中的131家sT公司为基础,对数据不完整及一些异常数据进行清理,最后保留32家公司作为样本企业。样本公司名称及股票代码如表4-2所示。表4-2样本公司名称及股票代码股票代码公司名称股票代码公司名称000018ST中冠A002002ST琼花000504ST传媒002145*ST钛白000505ST珠江600074宰ST中达000576ST甘化600130ST波导000595幸ST诬轴600149*ST建通.000602*ST金马600179.ST黑化000603ST盛达600203*ST福日000607*ST华控600228*ST昌九000633ST合金600355ST精伦000676ST思达600365*ST通葡000697*ST偏转600419ST天宏000720ST能山600490ST合臣000737*ST南风600609ST金杯000953ST河化600645ST中源000955ST欣龙600769ST祥龙000995ST皇台600847ST渝万里●,4.3.2财务风险指标的选择企业财务风险分析的能力主要取决于选择合适的财务指标,在进行财务分析的初始阶段,应该尽可能多的收集相关财务指标,本文在开始阶段共收集了32个财务指标,分别为:每股收益x1,每股净资产X2,净资产收益率(营业利润)X3,每股现金流量X4,净利润X5,净资产收益率(净利润)X6,净利率X7,毛利率X8,营业收入X9,每股主营业务收入X10,应收账款周转率X11,应收账款周转天数X12,存货周转率X13,存货周转天数X14,流动资产周转率X15,流动资产周转天数X16,主营业务收入增长率X17,净利润增长率X18,净资产增长率X19,总资产增长率X20,每股收益增长率X21,股东权益增长率X22,流动比率X23,速动比率X24,现金比率X25,利息支付倍数X26,资产负债率X27,经营现金净流量对销售收入比57 率X28,资产的经营现金流量回报率X29,经营现金净流量与净利润的比率X30,经营现金净流量对负债比率X31,现金流量比率X32。财务指标之间存在着相关性,运用公式(4—2)对财务指标相关性进行分析:rX,y=n>"xiy,-E蕾∑y,满孓面R墨面(4-2)其中:x和Y表示两个变量,rx,y表示两个变量的相关系数为了减少财务指标之间的共线性程度,对于指标之间存在正相关性或负相关性非常高的指标,将它们剔除掉,指标之间的相关系数如下表所示。财务指标变量相关系数如表4.3所示。表4-3财务指标变量相关系数表Xlx2x3x4x5x6x7x8Xl1x2o.06171~)c3o.7425O.12471x4o.258O.1508o.16071x5o.7868O.1233o.7678o.20561x6o.389o.20760.7147O.1441o.52031x7o.2384o.0729o.2067o.0376o.2230.10551x8o.2342—0.12270.1658o.0270.1864o.0873-o.20831x9-o.0218o.0037-o.0469O.1782一O.301l-o.2677o.0905一o.2528X10o.0295o.395—0.0135o.4039-o.106一o.0580.1162一o.3678X110.1244一o.062o.0534o.1084o.0951o.0348o.0538一o.0259●X12—0.1840.0134一o.0904一O.1393一o.0453—0.0123一O.3174o.436IX13o.0123—0.0217-o.07330.1568-o.032一o.057o.0861一o.3288X14—0.1097一o.0364一o.096—0.1183.-o.0663一o.0259一o.6576O.5191X15o.064O.0911一O.0157O.2167一O.0716o.0020.1541一o.4953X16一O.1152-o.0809-o.1065—0.128一o.0933一o.0414一o.8285o.4666X17O.2186O.10020.1530.2662O.1759o.04750.1017—0.0511X18o.49130.1211o.593o.0918o.4777o.5782o.7778一o.0851x19o.3684一o.04860.168O.1031O.136o.0702o.02270.0176x20o.4523o.0543o。479O.183lo.3572O.174O。1951o。0456X2lo.3461o.047o.239o.0880.4159o.106o.7974—0.1383x22o.2503o.055o.38640.11080.3310.1758o.0629o.0359x23o.0786o.0873o.0598-o.1467o.0697o.0452-o.06340.1932x24o.0858o.0539o.059一O.1281o.0705o.0399一o.06630.1885x25O.1066-o.1094o.087-o.0398o.0855o.0402o.0485o.0606x26-o.0952—0.04一O.1077—0.0318-o.1276-o.0535-o.8566o.344x27-o.0774-o.3338一o.1425o.226l—O.181一o.2248o.2051一o.3502x28-o.0032一o.0833-o.0065o.2875一O.0186一o.0027-o.0622-o.0497 X290.182—0.0322O.11930.77460.17590.10350.0164O.1045X30—0.04150.1307—0.08340.3599—0.0356—0.0935—0.1615一O.165lX31—0.0426—0.0708—0.031l0.218—0.0349—0.0205—0.017—0.0696X32—0.0426—0.0703—0.03320.2334—0.0397—0.0201一O.0156—0.0772(续)表4-3财务指标变量相关系数表X9XlOX11X12X13X14X15X16X91X10O.6137lX11O.01360.03531X12—0.3054—0.3496—0.29681X130.29820.48870.069—0.32911X14—0.2622—0.3214—0.01020.4003—0.28061X150.42650.52080.0939—0.53360.4695—0.42511X16—0.2557—0.3194—0.07660.4955—0.22920.8524—0.44481X170.06830.35650.2602—0.16970.104—0.10370.2599一O.164X180.0938O.14580.0997—0.3466—0.0593—0.705—0.0041—0.6784X190.0527—0.02720.0337—0.11130.0547—0.01520.05340.0063X20—0.0394—0.04290.0627—0.1304—0.0044—0.0612—0.0528—0.0976X210.01710.06590.0696—0.2510.0583—0.5035O.1038—0.638X220.2043O.09180.1443-0.0960.2062—0.03150.0248—0.0454X23-0.1527—0.2035—0.06310.0943一O.13780.2299—0.25760.3726X24—0.1381一O.1903—0.06220.0797—0.1059O.2219~0.24540.379lX25—0.0978—0.149l一0.03660.037—0.0295—0.0904一O.18070.0294X26—0.0996一O.1309—0.05110.2502—0.09460.865l—O.17760.854X270.48060.43690.1588—0.291l0.2939—0.36390.3015—0.415X280.08020.10540.06370.03460.0722—0.08590.1498-0.22740.Oll0.09870.1078—0.08690.0569—0.09110.1426—0.1125X300.2005O.1313—0.0145—0.1767—0.0248—0.09670.1756一O.1463X310.09550.13840.0553—0.02280.0875—0.06680.182—0.2726X320.10580.14030.0645—0.02810.0899—0.0702O.1916-0.2731(续)表4.3财务指标变量相关系数表X17X18X19X20X21X22X23X24X171X180.2261X190.02080.52871X200.15440.52230.22121X210.12840.7513-0.03780.1699lX220.14250.45130.08010.15390.08211X23-0.1473一O.13530.0374—0.0057—0.0377-0.00091X24-0.1497—0.11570.0407一O.0112—0.0380.00370.995llX25-0.12490.11980.0696-0.04270.06390.02540.283l0.3078X26-0.0696-0.76860.0497—0.1151—0.6815—0.04390.15950.1699X270.18160.202—0.00390.14190.14540.0633—0.5088—0.4884X280.1016-0.10990.02310.0121—0.04660.0359-0.4941—0.498359 X290.15830.06770.10690.20710.05660.0922-0.2055-0.1882X30.一0.0116-0.3857—0.08340.00360.0162-0.0809-0.0507-0.0393X31O.1334—0.0585—0.0070.0064—0.01820.0085—0.9226—0.9199X320.1302—0.1086-0.0050.0058—0.01750.0067-0.9145—0.9112(续)表4-3财务指标变量相关系数表X25X26X27X28X30X31X32X251X26-0.06021X27—0.3056-0.29431X280.0310.0406O.317l-0.0265一O.01580.25070.4387lX30-0.0053-0.0758O.221l0。33860.44451X31-0.06040.00510.37260.65780.3320.4248lX32-0.05670.00330.38370.6586O.35160.57150.9961经过对上述相关系数分析,剔除同一组财务指标中相关系数绝对值较高的10财务指标,保留22个财务指标,分别为:每股收益X1,每股净资产X2,每股现金流量X4,净资产收益率(净利润)X6,净利率X7,毛利率X8,营业收入X9,应收账款周转率X11,存货周转率X13,流动资产周转率X15,净利润增长率X18,总资产增长率X20,每股收益增长率X21,股东权益增长率X22,流动比率X23,现金比率X25,利息支付倍数X25,资产负债率X27,经营现金净流量对销售收入比率X28,资产的经营现金流量回报率X29,经营现金净流量与净利润的比率X30,经营现金净流量对负债比率X31。4.3.3基于离散化属性的财务指标数据库重构样本数据的清理是剔除所有变量的异常值,因为异常值的存在,将影响我们下一步对企业财务风险的描述性分析造成很大的偏差。因此,在对样本数据进行离散化重构之前,我们对每个变量的所有数值进行了分析,剔除其中的异常数据。表4.4样本公司财务指标变量重构前的数值表每股收益每股净资每股现金净资产收股票代码股票名称净利率x7X1产X2流量X4益率X6000018ST中冠A0.020.85O2.8743.87000504ST传媒O.020.5一O.2l4.134.25000505ST珠江0.061.170.335.574.04000576sT甘化一0.241一O.1-23.98一19.62000595*ST西轴一0。72O。95一O。07-75.49-40。81000602*ST金马一0.182.48O.71—7.16-I.68000603sT盛达O.02O.54O.024.2417.6000607*ST华控一0.340.64O.22—53.65一13.91 000633ST合金O.010.58O.021.433.78000676ST思达O.041.24一O.063.041.5l000697*ST偏转一0.41.940.05-20.41—9.61000720ST能山一O.011.03O.19—0.97—0.3l000737*ST南风一O.93O.520.2—179.86—18.46000953ST河化O.02O.5—0.273.740.91数据库重构的目的是按照财务风险等级定义将原来连续型财务指标数据离散化处理,转化为适合关联规则挖掘的离散的财务指标数据。原来的数据库和重构后的数据库分别如表4.4,4-5所示。表4.5样本公司财务指标变量重构后的数值表每股收益每股净资每股现金净资产收股票代码股票名称净利率X7Xl产X2流量X4益率X6000018ST中冠A3431000504ST传媒3543.3000505ST珠江3000576ST甘化34000595*ST西轴45000602术ST金马323000603ST盛达3432000607*ST华控4354ST合金343000676ST思达343000697*ST偏转4343000720ST能山3000737*ST南风4354000953ST河化35434.3.4基于关联规则交互挖掘策略的财务风险分析根据关联规则交互挖掘的企业财务风险分析模型,设置不同的支持度阈值和置信度阈值,挖掘出财务风险指标的频繁模式和规则数目,寻找财务指标体系之间的规则,并分析引起企业财务风险的真正根源,是本文研究的重要内容。1.算法描述针对交互挖掘中支持度阈值减小导致的重复计算,本文算法利用已有挖掘信息得到新支持度阈值下频繁项集,并通过Hash结构保存并检索频繁项集支持度计数,提高了挖掘效率。HIUA算法伪代码如下:IUA_GenLk(k,LOrg,LNew,DS,SptThr){Lkl=selectPtnksfromApriori_Gen(LOrgk_1)wherePtnkisnotinLOrgkandPtnk.CntinDS>=SptThr;61 北京化工大学博士学位论文Lk2=selectPmkSfromApriori_Gen(LNewk_0wherePtnk.CntinDS>=SptThr;Lk3=IUA_Gen(k,LOrg,LNew);retumUnion(Lkl,Lk2,Lk3);IUAwithHash(LOrg,DS,SptThr){Ll=SelectPtnlfromDSwherePtnl.Cnt>=SptThr;LNewl=L1一LOrgl;for(k=2;Lk.1isnotnull;k++){Lk=IUA_GenLk(k,LOrg,LNew,DS,SptThr);)returnUnion(L1,L2,...,Lk);)’‘首次计算频繁项集时,算法退化为Apfioff算法,得到并保留相应阈值下财务指标分级数据频繁项集。(1)之后在支持度阈值上升时,通过对上一步结果进行筛选得到新的分级数据频繁项集。(2)在支持度阈值下降时,设原频繁1项集为LOrgI,计算新阈值下频繁l项集Ll,进一步得到不属于原频繁项集的频繁1项集LNewl。设Lkl中任一模式项均属于LOrgl,设Lk2中任一模式项均属于LNewl,设Lk3为LOr91,LNewl的非空子集拼接组成。’IUAGenLk函数通过Lk.11、Lk-12的白连接、Lk-11和Lk-12的连接分别得到ckl,ck2,Ck3。对Ckl进行筛选并组合得到新支持度阈值下Lk,直到Lk为空时算法结束。然后生成相应支持度下财务指标关联规则。描述中项就是指单个财务指标分级数据。2.性能测试本文比较Apriori、IUA与HIUA的运行时间进行性能分析,以上算法均通过C≠}(.Net4.O)实现,运行环境为i5处理器,2G内存,Win7系统。由于在置信度阈值变化或支持度阈值上升的情况下不需要更新频繁模式集,IUA与HIUA的速度显然更快,所以本文只比较支持度下降情况下不同算法计算频繁模式集的运行时间。62 第四章基于关联规则交互挖掘的企业财务风险分析—1P—Apriori—_.rIUA—_卜-HIUA/●//。/./‘广/.//r/7【/≮/——”一P‘。’~//p///’、、、支持度田瞳图4-6三种算法在财务数据集中运行性能比较数据集为上市公司中ST公司2005--2010年期间的财务指标数据,共32个公司768条记录,每条记录20个财务指标。X坐标为支持度阈值从O.3至0.2,步长为0.01,Y坐标为计算频繁模式集的运行时间。图4-6是三种算法在财务数据集中运行性能比较。3.企业财务风险指标关联规则在不同支持度阈值和置信度阈值下规则数目如下图所示。X坐标为支持度,Y坐标为置信度,z坐标为规则数量。图4.7是ST公司2005--2010年财务指标分析关联规则数目。图4.7ST公司2005--2010年财务指标分析关联规则数目 北京化工大学博.j:学位论文图4-8选取支持度阈值为0.6,置信度阈值为0.3,数据集为上市公司中ST公司2005--2010年期间的财务指标数据,共计发现规则86条。?£黪l鬻i蕊黼。鬻篡萋ii越。萋嚣:i最小支持度;06ii蒸h|1鬓§黉1|||l攀j鬻jI||}i;鬻i鍪Ii鬻ir!攀爹|||||豢;攀!爹攀i黪爹i攀?攀ii篱薹鬻。蕞小置播度≤i二二二二!,j0I.。.3ii匹i霎塑笠j。j蠹菇舞丈小:32,规曼嗷巨=筠置仨舞i}黎t登j1黎i1羹“3如规则前件}『l毒鼗嫒澈r蠢蠢f争“”。”“”“。2诤飘|辜17Lewl3毛和P-Ex8Level34流动资产周转辜It5Level4、5兽资产增长率x20Level5;6每股收益增长率X21Level57现金Lg-辜-u5Level18经营l且金净流量j|寸销售收入比率X28Level39经营现金净流量对销售收入比率x28L;vel3规则后件资产酌经营现金流量回报率x29Letel资产的经营现金流量回报率]【29Level资产台勺经营现金流量回报率x29Level资产的经营现金流量回报率129Level资产的经营现金流量回报翠129Level资产的经营现金流量回报率x29Level资产的经营现金流量回报率x29Level资产酌经营现金流量回报率x29Level经营现金净漉量对负债比率X31Level经营现金净流量对负债比率X31hv“3经营现金净流量列销售收入比率128Level3经营现金净流量对负债比率x3ILevel3资产的经营现金流量回报率X29Level3霉股收益ItLevel3,现金比率X28Level1资产的经营现金流量回报率129Level3总资产增长率X28Level5.现全比率x25Levell资产旮匀经营现金流量回报率X28Level3每股收益增长率X21Level5.观金比率X25Levelt资产的经营现金流量回报辜129Lewl3现金比率X2SLevel1,经营现金净流量对销售l捉入比率X28Level3资产的经营现金流量回撮率129Level3现金比率x25Level1,经营观盒净流量对销售收^比率128Level3经营现金净琉量列叠债比率X31Level3现金比率您5Level1,经营观金净流量列负债比率X31Level3经营现金净瓶量对销售啦入比率X28Level3现盒比率125Level1,经营现金净漉量对壹愤比率131Level3资产的经营现金流量回报率x29Level3经营现金诤流量对销售收入比率x28Level3,资产自嗡营现金流量回经营现金净流量列负馈比率131Level3经营现金净流量对销售收入比率128Level3,经营现金诤流量列负债资产的经营现金流量回报率X29Level3经营现金净蔬量列{自售收入比率X28Level3资产的经营现金流量回报辜129Level3,经营观赞产的经营现金琉曼回撮率X29Level3.经营现金净流量列盎愤比率经营现盘净流量对销售收八比率x28Level323经营}且金净流量对负债比率X31Level324现金比率跹5Level1.经营现金净流量对销售收^比率X28Level:25观盒比率x25LevelI.经营现金净流量对销售收^比率x28Level!薰。≈_。i纛i㈨蕊。、蕊。螽戛螽蠹一i薹_曩。。氆。蕊-:二__..-。。--:--.-_:_:::。_:-:。:---____经营现金诤流量对{肖售收入比率x28Level3,资13.经营现金净流量列负债比率x31Level3l3,资产旮勺经营观金流量回报率x29Level31誊一⋯一⋯^、●⋯~⋯一·-~D∞i嫩__篓曼曼誊Ⅲ㈣女∞一篓耋j薹曼兽薹纂图4-8S=0.6,C=0.3ST公司2005--2010年指标规则列表图4-9选取支持度阈值为0.7,置信度阈值为O.3,数据集为上市公司中ST公司2005--2010年期间的财务指标数据,共计发现规则34条。最小支赫度oT;最小置信度k一,⋯⋯数据集大小=32.规则数目=34鬻纛l戮囊糕l霾鬻蕤、456T8;9to111213‘14151617{18{i9{20。2l;22规则前件每艘收益拍Leva3总资产增长率x20Level5现金比率x25LevelI经营现金净流量j}寸销售收入比率X28Level3经营E见金净琉量列销售收入比率x28Level3经营现金净流量对负豌比率X31Level3经营现金净流量对负馈比率X31Level3每股收益XILevel3,观金比率X25Levall总赍产增长率x20Level5,现金比率x25Level1’经营观金净流量对销售收A比率x28Level3,赍产的经营现金流量目经营观金诤流量对销售收人比军mLevel3.经营现金净流量对负愤经营l且全诤流量列销售收^tE率128Level3.资产的经营现盒流量回报率X29Level3,经营现金净流量对负债比率经营现金j争流量对负馈比率X31Lewl3每股收益xILevel3每股收益x1Level3.资产的经营现金流量回报率X29Level3每股收益X1Level3瓷产的经营现金流量回报率X29Level3总资产增长率x20Level5总资产增长率X20Level5.瓷产的经营观金流量回报率X29Level3总资产增长率x20LevelS资产的经营现金流量回报率X29Level323现金比率x25Levd124现金比率x25LewlI.25现金比率x25Level1;一一⋯-●一⋯一罐0I『Ii≯i’zt“一点。r,i⋯一i墨m==-曼。i=4|规贼后件置n^资产的经营现金琉量圄报萃x29“vel3厂_资产的经营现金流星回报率x29Level31资产的经营观金流量回报率X29Level3t㈨资产的经营现金流量回报率X29Level3L经营现金净流量对负债比率X3lLevel31j;经营现金净流量jf寸{冉售收入比率X28Level31资产的经营现金菇量回报率X29Level3ilj资产的经营现金流量回报率x29Level3i薯资产的经营现盒流量回报率X29Level31经营现金净琉量对壹债比率X31Level3I资产的经营现金流量回报率X29Level3l赞产的经营现金流量回报率X29Level3,经营现1经营现金净流量对销售收八比率X28Level31经营现金净流量列销售收入比率X28Level3,资1;现金比率X25Levell0能。现金比率X25Level109c|i-现金比率X25Level1,赍产的经营现金流量回报09E“现金比率X25Level1091t㈡现金比率X25Levell08E现金比率X25Level108E现金比率X25Level1.资产的经营现金流量回报08E总资产增长辜X20Level5081总资产增长率z20Level507∈资产的经营现金琉量回报率x29Level3总赞产增长率x20Level50TE总资产增长率120I.evel5,资产的经营现金、赢量0T∈罐-⋯⋯一一一一一一一’蓊。羹蠢薹§‰iiiiiii!ii[i;ii:撼鬻i矗薯i篓。搿:j《iji薹i蠢-:一。----:图4-8S=0.7,C=0.3ST公司2005--2010年指标规则列表图4-9选取支持度阈值为0.8,置信度阈值为O.7,数据集为上市公司中ST公司2005--2010年期间的财务指标数据,共计发现规则4条。m¨挖坞H圬婚汀培坞{寻乱篮 第pq章基于关联规则交互挖掘的企业财务风险分析图4-9s=0.8,c=0.7ST公司2005--2010年指标规则列表4.3.5研究结论与防范财务风险建议一、研究结论通过对上市企业中的sT公司财务指标的数据挖掘结果分析,当上市公司出现财务风险时,存在着一些关键财务指标总是频繁出现,它们分别为:每股收益x1,净资产收益率(净利润)X6,应收账款周转率x11,存货周转率X13,净利润增长率X18,总资产增长率X20,流动比率X23,现金比率X25,经营现金净流量对销售收入比率X28,资产的经营现金流量回报率X29等十个财务指标,它们是判别企业是否存在财务风险的关键因素。根据本文的研究结果,我们通过国内上市公司的实际数据进行分析与测试,证明关键指标的波动将严重影响并决定企业的风险程度。二、防范财务风险建议根据本文的研究结果,在防范财务风险时应重点关注以下五个方面的财务风险。(1)企业盈利能力方面在关注企业盈利能力方面,应重点关注企业的每股收益X1和净资产收益率(净利润)X6两个财务指标,每股收益直接反映每股资本的盈利情况,净资产收益率可以直观的评价企业运用净资产带来的收益情况。(2)企业营运能力指标在关注企业营运能力方面,应重点关注企业的应收账款周转率x11和存货周转率X13两个财务指标,应收帐款周转率就是反映企业应收帐款周转速度,周转率越高,表明企业资产流动速度快,营运能力强。存货周转率高反映企业的流动性强,企业的营运能力也越强。(3)企业成长能力指标在关注企业成长能力方面,应重点关注企业的净利润增长率X18和总资产增长率X20两个财务指标,净利润增长率是衡量一个企业经营效益的重要指标,总资产增长65 北京化工大学博士学位论文一———————————————————————————————————————————————————————————————一率反映企业总资产增长情况,总资产增长率越高,表明企业一定时期内资产经营规模’扩张的速度越快。它们是判别企业成长能力的关键财务指标。(4)企业偿债能力指标在关注企业偿债能力方面,应重点关注企业的流动比率X23和现金比率X25两个财务指标,流动比率越高表明企业的流动性越强;现金比率反映企业立即偿还到期债务的能力,现金比率越高,说明资产的流动性越强,短期偿债能力越强,企业风险就越小。因此,它们是判别企业是否真正具有偿债能力的关键财务指标。(5)企业现金流量指标在关注企业现金流量方面,经营现金净流量对销售收入比率X28和资产的经营现金流量回报率X29两个财务指标是重点关注的对象,经营现金流量指标是反映企业能否持续经营的重要指标,因此,它们是判别企业是否真正具有现金流的关键财务指标。4.4小结’企业财务风险分析的方法包括定量分析和定性分析两个方面,定量分析方法的核心是建立风险分析指标体系和风险分析模型。以前学者在进行财务风险分析时通常采用传统的统计分析的方法,取得了一定的研究成果。本文采用关联规则交互挖掘的方法,更广泛的选择多个方面的财务风险指标,通过挖掘指标之间的规则,最终确定选择更具有代表性的财务风险指标,与传统分析方法相比更加具有客观性和现实应用意义。首先,建立企业财务风险分析理论体系和风险分析流程,第二,建立企业财务风险分析指标体系,并运用变量相关系数分析方法,剔除其中部分相关度较高的风险指标。按照区间划分定义财务指标风险等级,将所有财务指标划分为五个等级,并对原有的数据集进行重构,转化为适合关联规则挖掘的离散型数据集。第三,建立基于关联规则交互挖掘算法的企业财务风险分析模型,主要包括构建风险概念层次树,并采用递减支持阈值的交互挖掘策略,寻找财务风险指标之间的规则。最后,选择国内上市企业中的ST公司进行企业财务风险分析的实证研究,提出了影响企业财务风险的十个关键性指标,并给出了防范财务风险的建议。 ——一第五章基于时间序列动态挖掘的企业财务危机预警———————————————————————————————————二—==二二二:=:::::=第五章基于时间序列动态维护的企业财务危机预警企业财务危机是企业财务风险恶化的结果,当企业出现财务风险而得不到及时和有效的控制,就会逐渐演变成财务危机。选择什么样的数据挖掘方法进行企业财务危机预警是合适的,要根据我们所要挖掘的对象和预期的结果来确定。经过比较研究发现,对企业财务危机预警的研究与智能工业控制系统中挖掘具有信任度高的规则的研究非常相似。原因在于:(1)对工业控制领域中的设备运行状态判断是一个动态应用场景中,智能控制系统可以根据当前设备的多个运行状态估计其态势发展趋势,依据规则准确地预测可能发生的威胁,防患于未然,避免造成生产停滞和经济损失,而作出准确的判断都需要具有高信任度的规则。(2)当设备发生异常现象时,需要的第一时间依据规则准确判断出现异常现象的可能,依据规则准确处理突发现象,以提高对异常现象的有效诊断。根据工业控制领域的特点经比较发现,对企业财务危机预警的研究也相当于一个智能工业控制系统,原因在于:(1)对企业财务危机的预警也处于一个动态的场景当中,企业的运行就相当于一个工业控制系统,企业财务当中的几十个危机预警指标就相当于控制系统中的所有设备,财务危机预警指标的的风险程度就相当于控制系统中设备的运行状态,寻找财务风险指标具有的规则就相当于寻找控制领域当中设备运行的规则。.(2)当企业财务危机预警指标发生异常时,也需要在第一时间依据我们所发现的规则进行诊断,及时化解企业财务危机,达到对企业风险管理的有效控制。综上所述,’本文主要选择了基于时间序列的动态挖掘算法用于企业财务危机预警研究。’5.1企业财务危机预警理论企业财务危机预警是对企业财务活动进行监测的过程中,根据财务指标的状态或发展趋势偏离预定目标程度,发出不同预警信息的控制过程[114]。企业财务危机预警的理论是一个包含多学科的综合性理论,它是一个涵盖企业风险管理、工业过程控制、动态信息技术、数理建模等多学科的知识【n51。要想对企业财务危机进行预警,首先要弄清如何界定财务危机。 一.i!塞些三奎兰堕主堂篁笙茎一—_———————————————————————————————————_———————————————————————————————————————一一5.1.1财务危机预警的界定企业在什么情况下就会被认定为处于危机状态,即对企业危机的界定是不存在一个统一的标准,国内外学者对此意见并不一致【116】。一般认为,财务危机是指财务失败,即是指企业处于财务困境或财务恶化当中,如无力支付短期债务、无力支付债券本金和利息而变卖资产、进行企业债务重组或申请破产保护等,最严重的财务危机是企业破产【l"J。1.国外财务危机概念的界定一种观念认为:财务危机是指已经宣告破产的企业。如Altman(1968)116]认为企业失败包括在法律上的破产、被接管和重整等。按照这样的定义可以理解,财务危机基本视同企业破产,即法定破产。另一种观念认为:财务危机有轻重之分,轻微的财务危机可能仅仅是短暂的资金周转困难,而严重的财务危机是经营失败或破产清算【l埔】。按照这样的定义可以发现:从轻微危机到严重危机是一个发展的过程。2.国内财务危机概念的界定国内对财务危机的界定基本上是与上述第二种观念是一致的,一般认为从财务危机到企业破产是一个发展过程,在这样一个发展过程中,如果采取适当的措施支应对财务危机,企业可能会化解财务危机【119J。基于这样的理解,在选择研究对象时,国内学者普遍选择上市企业中的ST公司作为研究样本【1201。5.1.2财务危机形成的路线图一般来说,企业财务危机形成的路线图主要包括危机潜伏期、发展期和爆发期三个过程【12ll。.1..危机潜伏期危机潜伏期是指企业财务危机已经出现,在某些财务指标上已经有所表现。在这一阶段的企业往往因为取得了一些暂时的胜利冲昏头脑,对一些很容易判断的风险或隐患视而不见,主要表现为企业的对未来的发展前景过于乐观。2.危机发展期危机发展期是指企业的危机已经发展的一定的程度,许多财务指标都已经反映出来。在这一阶段的企业已经意识到所处的困境,然而,因为企业风险管理中存在的缺陷、内部控制不力等原因,导致不能果断采取有效措施或根本不愿意采取措施防范风险,导致企业朝着危机发展的方向越走越远,主要表现为企业采用了较高的经营杠杆或财务杠杆。3.危机爆发期 ——第五章基于时间序列动态挖掘的企业财务危机预警————————————————————————————————————————二r二二二二=:::::危机爆发期是指企业潜在的危机出了“井喷’’现象,企业生产经营出现严重困难,所有财务指标都已经反映出来。在这一阶段的企业如果及时采取危机处理预案,企业仍可以化解危机。5.1.3企业财务危机预警的理论分析研究与分析企业财务危机预警理论,有助于我们根据企业经营状况与财务状况科学地建立预警模型,更有利于我们挖掘企业危机发生的根源,帮助企业解决经营活动中遇到的困难。企业财务危机预警理论主要包括企业预警管理理论、风险收益理论、企业生命周期理论、现代企业理论、风险管理理论【1221。(一)企业预警管理理论企业预警管理理论主要包括危机管理理论、风险管理理论、系统非优分析理论、企业逆境管理理论和企业诊断理论等几个方面的内容。1.危机管理理论危机管理理论是指企业经营管理过程中发生突发事件可能会给企业造成巨大经济损失时的危机应对和危机预防措施。危机管理过程应该包括对危机的事前、事中和事后管理的全过程【坦引。2.系统非优分析理论系统非优分析理论是指任何系统的状态都可以用“优”和“非优”表示,系统大部分时间都是处于非优状态之中,通过地系统的非优分析,寻找系统形成非优的根源,达到进一步优化系统的目的【1241。将系统非优理论运用于企业的财务管理活动,可以对财务指标进行实时动态监测,达到及时发现企业财务危机的目的。3.企业逆境管理理论.企业逆境管理理论是指企业的外部或内部环境发生了重大变化,企业的经营管理陷入极端困难的情况,外部环境变化通常是指宏观政策调整、金融危机、科技进步、自然灾害等,内部环境变化通常是指内部管理、控制和矛盾掣125,126】。运用企业逆境管理理论有助于帮助企业对财务危机进行早期预警,及时调整企业发展战略,达到扭转困境、重获新生的目的。4.企业诊断理论企业诊断理论是根据企业管理原理采用功能诊断的分析方法,对企业的组织结构、管理制度、生产经营和财务状况等所有方面进行综合诊断。运用企业诊断理论有利于建立科学合理的财务危机预警指标体系,根据财务指标的波动情况,做出相对合理的预警诊断结果。(二)风险收益理论对于身处市场竞争环境下的企业来说,风险无处不在,要处理好风险与收益之间69 的关系。一般来说,投资项目的风险越小,期望的收益率就越低,反之,投资项目的风险越大,期望的收益率也就越高‘1271。根据企业风险管理的理论,企业投资项目的风险程度与期望收益率可以用图5-1表示。弘L黼橼隧图5-1企业投资项目的风险程度与期望收益率因此,企业的投资决策时要充分考虑风险与收益的关系,选择适合企业本身发展特点的经营杠杆和财务杠杆,控制好企业财务风险。(三)企业生命周期理论任何有生命的生物体都存在着生命周期,企业虽然没有生物体的生命特征,但却存在着与生物体的共同特征。企业的生命周期是指企业诞生、成长、壮大、衰退甚至死亡的过程。企业在生命周期的不同阶段具有某些共性特征,掌握了这些特征将有助于企业了解所处的生命周期阶段,从而帮助企业更好的成长和发展壮大。企业生命周期有两种划分,一种是自然生命周期,另外一种是法定生命周期。自然生命周期是我们前面这些生命周期理论所研究的范畴;法定生命周期来源于各个国家对不同企业形式在工商登记时对企业有效期限的限制。关于企业生命周期的划分不同的研究员人有不一样的划分,通常来说,企业生命周期可以划分为四个阶段,主要包括企业的进入期、成长期、成熟期及衰退期和蜕变期。图5.2是企业生命周期理论的四个阶段。图5.2企业生命周期理论的四个阶段 第五章基于时间序列动态挖掘的企业财务危机预警处于进入期的企业因为创新能力强、市场竞争较少,企业发展较快,但因产品不稳定、市场认识度小等因素导致企业发展不稳定,风险较大。处于成长期的企业因产品稳定、市场占有率不断提高,企业发展速度快,风险小。处于成熟期的企业因产品多元化、市场占有率相对稳定,企业发展速度较慢,风险小。处于衰退期的企业因市场竞争激烈、产品生产过剩,企业利润低,风险较大。通过上述分析发现,当企业处于进入期和衰退期时风险较大,但是企业的生命周期又不同于生物体的生命周期,企业可以通过不断调整发展战略达到延展生命周期目的,主要是要根据市场的需求调整企业的主导产品。组织学者WilliamWeitzel等人把企业从衰退开始到最后死亡的过程分为5个阶段,主要包括:盲目阶段、呆滞阶段、错误行动阶段、危机阶段、消亡阶段。1.盲目阶段,企业如果能够及时获取预警信息,就在可能避免盲目性,从而避免企业走向衰退。.2.呆滞阶段,企业如果能够及时获取预警信息并能够得到良好的信息指导,采取快速行动,就有可能走出困境。3.错误行动阶段,企业已经不能再范错,只有迅速采取正确的行动,才有可能使企业脱困。4.危机阶段,企业已经深陷危机当中,只有及时寻找#t-JT帮助,通过企业重组等方法,才有可能避免企业走向衰退。5.消亡阶段,企业已经错过了所有可能的机会,采取任何行动也无法避免企业走向消亡。嶷邀辨媲———————————————+北亡图5-3企业从衰退开始到最后死亡的5个阶段71 通过对企业生命周期理论的分析,让我们进一步了解进行企业危机预警的必要性。当企业处于衰退期和蜕变期时,企业要不断改革以寻求蜕变,要么企业就要消亡。因此,建立合适的预警机制对于现代企业来说是非常必要的。(四)现代企业理论研究与分析现代企业理论将有助于我们解释企业危机事件,寻找和分析企业财务危机的根源,主要包括委托代理理论、交易成本理论、产权理论、公司治理结构和现代企业制度。1.委托代理理论委托代理理论是指企业的所有权与经营权相分离而产生的委托代理关系,所有者将其在企业产权中的经营权委托给经营者代理行使。由于所有者与经营者之间存在信息不对称和利益差异,使得经营者的行为有可能偏离所有者的要求,代理理论的目的就是要设计出一系列的契约,给代理人以激励与约束,使其行为与委托人的期望相一致,达到降低代理成本的目的:2.交易成本理论交易成本理论是指企业在商品交易过程中所花费的时间成本和费用成本,具体是指获取交易信息成本、双方谈判交易成本、商品运输成本、佣金和关税成本等,包含商吕交易的整个过程如:事前交易、事中交易和事后交易成本。3.产权理论产权理论是指一个所有者所拥有的其他人同意他以特定的方式行事的权利。完备的产权通常由使用权、收益权和让渡权构成,产权属性包括产权的排他性、产权的可分离性、产权的可分割性和产权的不完备性。4.公司治理结构公司治理结构又称法人治理结构,是用来规范公司不同权利主体,即股东、董事会、职业经理人和监事会各自的权利、责任和利益关系。5.现代企业制度现代企业制度是以产权制度为基础的企业组织和管理制度,是市场经济制度的重要组成部分,现代企业制度的内容包括:企业法人制度、企业组织制度和企业管理制度。5.1.4财务危机预警的流程按照企业财务危机形成的路线图并结合智能控制领域危机预警流程建立企业财务危机预警系统,系统主要由5个子系统组成,包括财务信息搜集子系统、财务信息 第五章基于时间序列动态挖掘的企业财务危机预警分析与评估子系统、财务危机预测子系统、财务危机预报子系统和财务危机处理子系统。企业财务危机预警的工作流程如下图5-4所示:|匿圈匿豳网圈圈{l盂一。篓^薹菡ll豳豳奥豳豳!k⋯⋯⋯⋯⋯⋯⋯:::1-_征⋯⋯⋯⋯⋯⋯⋯o图5-4企业财务危机预警的工作流程 1、财务指标信息搜集子系统财务指标信息搜集是危机管理的首要步骤,包括收集企业盈利能力信息、运营能力信息、成长能力信息、偿债能力信息、现金流量信息、市场价值信息、股权结构信息、治理结构信息等。2、财务信息分析与评估子系统财务信息分析与评估是财务危机预警系统的重要步骤,该子系统将搜集到的信息存储到数据库中,并运用财务危机分析模型进行数据分析和评估。3、财务危机预测子系统财务危机预测是财务危机管理的前提条件,该子系统根据财务危机分析与评估结果,对危机的演变、发展和趋势做出初步判断。4、财务危机预报子系统财务危机预报子系统主要是根据危机预警系统设置的各种危机警戒线,对所有选定的财务指标进行动态监测,如发现异常情况则进行预警。’5、财务危机处理子系统·财务危机处理是根据财务危机预警情况,对财务危机及时采取应对措施,以降低危机对企业所带来的不良影响。5.2基于时间序列动态维护的企业财务危机预警方法企业财务危机预警系统的建立离不开选择合适的指标体系,在选择财务指标时本文主要坚持以下几个方面的原则:全面性、可比性、相关性、灵敏性和协调性。主要考虑财务指标要覆盖财务危机的所有方面,各指标之问要相互协调且具有可比性等方面的因素。5.2.1财务危机预警指标体系本文研究财务危机预警系统的目的是通过对现有上市公司的财务状况和公司治理结构的数据分析,运用数据挖掘技术对企业的发展前景进行辅助决策支持。因此在选择财务危机预警指标时也是综合考虑企业各方面的因素,最终确立财务危机预警指标体系包含八个方面的内容,其中不仅包括财务风险分析中选定的财务指标,还包括公司股权结构和治理结构方面的非财务指标。1.企业市场价值指标企业市场价值指标包括:每股收益X1,每股净资产X2,净资产收益率(营业利润)x3,每股现金流量x4,净利润x5。74 ——一.第五章基于时间序列动态挖掘的企业财务危机预警———————————————————————————————————————————————二.二.二二_2.企业盈利能力指标.企业盈利能力指标包括:净资产收益率(净利润)X6,净利率X7,毛利率X8,营业收入X9,每股主营业务收入X10。3.企业运营能力指标企业运营能力指标:应收账款周转率Xll,应收账款周转天数X12,存货周转率X13,存货周转天数X14,流动资产周转率X15,流动资产周转天数X16。4.企业成长能力指标企业成长能力指标包括:主营业务收入增长率X17,净利润增长率X18,净资产增长率X19,总资产增长率X20,每股收益增长率X21,股东权益增长率X22。5.企业偿债能力指标企业偿债能力指标包括:流动比率X23,速动比率X24,现金比率X25,利息支付倍数X26,资产负债率X27。6.企业现金流量指标企业现金流量指标包括:经营现金净流量对销售收入比率X28,资产的经营现金流量回报率X29,经营现金净流量与净利润的比率X30,经营现金净流量对负债比率X31,现金流量比率X32。7.企业股权结构指标企业股权结构是上市公司所有股东的持股情况及持股比例,股权结构对上市公司的经营情况有重要影响,决定企业的发展理念和方向。企业股权结构指标包括:上市公司实际控制人、大股东持股比例、CR3指数、z指数。根据前人的研究成果,现对企业股权结构指标对企业经营状况的影响作简要说明。其中:上市公司实际控制人类别决定着企业的经营效率的发挥,一般情况认为,企业经营效率由高到低的顺序为民营控股、外资控股和国有控股。第一大股东持股比例可以分为两种情况分别为绝对控股和不控股,绝对控股是指第一大股东持股比例超过50%,不控股是指第一大股东持股比例低于50%。CR3指数是指前三大股东的持股比例之和,一般认为前三大股东的持股比例越高对公司的控制力越强。Z指数是指公司第一大股东与第二大股东持股比例的比值,z指数越大,第一大股东与第二大股东的力量差异越大,第一大股东的优势越明显,则说明第一大股东对公司的控制能力越强。8.企业管理层结构指标企业管理层结构指标是指企业的管理层人数是管理层持股比例,管理层结构的科学合理将影响企业的决策是否科学与合理。企业治理结构指标包括:董事会成员人数、董事会持股比例、监事会成员人数、监事会持股比例。75 北京化工大学博士学位论文5.2.2财务危机预警指标的等面积划分方法企业财务危机预警指标数值是连续随机分布,当选择足够多的企业进行研究时,每个指标的数值一般都是正态分布,根据这样的经验原理,本文在进行财务危机预警指标的划分时根据指标数值的分布情况按照等面积划分的方法,将所有指标按照企业生命周期原理划分为5个阶段。每个阶段分别用1,2,3,4,5表示,并按照等面积划分方法将企业财务危机预警指标共计22个划分为五个分区。;个数纺劢◆.,3-2.10123j!鲁土釜l辩l文图5-5财务危机预警指标的等面积划分5.2.3基于时间序列动态维护的企业财务危机预警模型挖掘模型的建立是根据数据挖掘的目的而建立,本文研究财务危机预警系统的目的是通过对现有上市公司的财务状况和公司治理结构的数据分析,运用数据挖掘的方法对企业的发展前景进行预测。根据生命周期理论,本文研究的主要内容是寻找企业在不同生命周期期间的财务危机预警指标之间的规律以及发展变化趋势,为发出财务.预警信号作准备。。(一)基于时间序列财务数据的挖掘方法对具有时间序列特征的财务数据进行挖掘,主要包括以下三个方面的核心内容:(1)研究对象为具有时间序列特征的财务数据;(2)挖掘的基本思想是从时间序列数据中发现蕴藏的历史规律和特征:(3)最终目标是从财务数据中寻找规律和特征,进而对客观事物进行描述、预测和决策。图5-6基于时间序列的数据挖掘模型76预测终缀搦述 (二)基于时间序列的增量挖掘策略.基于时问序列的增量挖掘是将企业的财务数据按季度划分,假设某年第一季度的数据为原始数据,则第二季度的数据为新增数据,也就是在对第一季度数据挖掘完成后,再对第二季度的数据进行增量挖掘,以此类推,一直挖掘到没有新增数据为止。基于时间序列的增量挖掘策略如图5.7所示。第时间煺摹援图5—7基于时间序列的增量挖掘策略(三)基于时问序列的动态维护挖掘策略基于时间序列的动态维护挖掘策略是在时间序列增量挖掘的基础上进行交互挖掘,即通过调整最小支持度阂值和最小置信度阈值达到输出适全用户满意的规则的目的。5.3企业财务危机预警实证研究通过实证研究检验财务危机预警指标体系的有效性,并根据财务危机预警模型和预警程序建立起一套行之有效的动态财务危机预警系统。一方面,对已经出现财务危机的公司,通过实证研究寻找影响企业财务危机进一步恶化的根源。另一方面,可以运用现有上市公司的公开数据,预测出下一年度可能出现财务危机的公司,为企业管理者提供企业发展战略的辅助性决策支持,也可为投资者的投资决策提供依据。5,3.1样本企业的选取基于企业财务危机预警的理论基础,在实证研究过程中,选择国内上市公司作为研究对象,数据来源为新浪财经提供的企业年度和季度报表。篱.二雾燧第{|肇缝第一举凌第隧攀度篱.一攀随簿||零澄第一零度 北京化工大学博士学位论文(一)样本一选择2008.2010年期间国内上市公司中第一年盈利后两年亏损的三年季报数据,共计12期样本数据作为研究对象。具体样本公司列表如表5—1所示。表5-1样本一公司名称及代码股票代码公司名称股票代码公司名称000595*ST西轴000602*ST金马000607*ST华控000737*ST南风002113*ST天润600074*ST中达600203*ST福日600228*ST昌九600281*ST太化600335*ST盛工600365*ST通葡600604*ST二纺600604*ST海鸟600671*ST天目(二)样本二选择2008—2010年期间国内上市公司中前两年亏损第三年盈利的三年季报数据,共计12期样本数据作为研究对象。具体样本公司列表如表5.2所示。表5--2样本二公司名称及代码股票代码公司名称股票代码公司名称000408ST金谷源000504ST传媒000603ST盛达000676ST思达000908ST天一000922ST阿继000953ST河化002072ST德棉002145*ST钛白600080ST金花600091ST明科.600170ST黑化600209ST罗顿600299ST新材600301ST南化600313ST中农600355ST精伦600444ST国通600490ST合臣600562ST高陶600609ST金杯600727sT鲁北600769ST祥龙600860ST北人600984ST建机5.3.2样本数据的清理与数据重构样本数据的清理是剔除所有变量的异常值,因为异常值的存在,将影响我们下一步对企业财务危机预警的描述性分析造成很大的偏差。因此,在对样本数据进行离散78 化重构之前,我们对每个变量的所有数值进行了分析,剔除其中的异常数据。数据库重构的目的是将财务危机预警指标的连续型数据离散化处理,转化为适合关联规则挖掘的离散的财务指标数据。由于有不同公司财务数据组成的数据集中每个财务指标变量的分布基本呈正态分布,因此选择采用正态分布等面积划分的方式进行连续变量的离散化,在本章中,依每个变量分布函数的1/5,2/5,3/5,4/5分位点将每个财务指标变量离散化为5个等级。(一)原来的数据库表5.3原来的数据库每股收益每股现金净资产收应收账款周股票代码股票名称净利率X7X1流量X4益率X6转率X11000595*ST西轴一O.20.03—10.12-28.220.54000607*ST华控一0.02一O.36一1.63一O.662.14002113*ST天润一0.250.88—7.35—10.636.57600203*ST福日一0.1—0.12‘一11.77—4.835.86600281*ST太化一0.430.27‘一26.62—7.1710.14600365*ST通葡0.0lO.09O.682.561.4095600604*ST海鸟一O.02O—1.01—9.538.87000602*ST金马一O.050.46—1.94—11.04O.20000737*ST南风一O.30O.05—27.16—7.994.91600074*ST中达一O.09O.1—6.83—6.726.98600228*ST昌九一O.05—0.05—3.67—8.881.669600335*ST盛工一O.05一O.01—4.93—25.51O.41600604*ST二纺一0.0l一0.08—1.57—5.10.9498600671*ST天目一O.3l0.05-27.76—7.69‘4.51(二)重构后的数据库‘表5-4重构后的数据库‘。每股收益每股现金净资产收应收账款周.股票代码股票名称净利率X7Xl流量X4益率X6转率xll000595*ST西轴4345000607*ST华控35324002113*ST天润5l42600203*ST福日45432600281*ST太化51541600365*ST通葡13214600604*ST海鸟24341000602*ST金马31345000737*ST南风53542600074*ST中达43432600228*ST昌九3434 北京化工大学博士学位论文600335术ST盛工345600604*ST二纺2435600671*ST天目535425.3.3企业财务危机预警指标的选择根据第四章的研究成果,剔除同一组财务指标中相关系数绝对值较高的10财务指标,保留22个财务指标,分别为:每股收益X1,每股净资产x2,每股现金流量X4,净资产收益率(净利润)X6,净利率X7,毛利率X8,营业收入X9,应收账款周转率Xll,存货周转率X13,流动资产周转率X15,净利润增长率X18,总资产增长率X20,每股收益增长率X21,股东权益增长率X22,流动比率X23,现金比率X25,利息支付倍数X26,资产负债率X27,经营现金净流量对销售收入比率X28,资产的经营现金流量回报率X29,经营现金净流量与净利润的比率X30,经营现金净流量对负债比率X31。另外,根据现代企业治理结构和股权结构的要求,添加了相应的辅助性财务指标,如企业股权结构指标中的上市公司实际控制人、大股东持股比例、CR3指数、Z指数以及企业管理层结构指标中的董事会成员人数、董事会持股比例等。5.3.4基于时间序列动态维护的企业财务危机预警根据时间序列动态维护的企业财务危机预警模型,对一段时间内的财务指标进行数据挖掘,可以先挖掘第一个时间点的财务数据,然后将后续时间点的财务数据添加进来进行增量挖掘,另外,还可以设置不同的支持度阈值和置信度阈值,对想要的挖掘结果进行调整,寻找符合要求财务危机预警指标频繁模式和规则数目,并分析最终挖掘结果,总结引起企业财务危机的真正根源,是本文研究的重要内容。1.增量挖掘算法描述’设SptThr为支持度阈值,Cfdm为置信度阈值,DS为新数据集,DSInc为新数据集与原数据集的差,即增量数据集,Ptni为长度为i的模式,Ptni.Cnt为长度为i的模式在相应数据集中的支持度计数,Ci、Li分别为长度为i的候选模式集、频繁模式集,LBase为原数据集频繁模式集,LInc为增量数据集频繁模式集,LOrg为原支持度下频繁模式集,LNew为由LNewl(新支持度阈值下)的模式集生成的频繁模式集,Rules为规则集。具体算法伪代码如下:.FUPwithFP-Growth(LBase,DSInc,SptThr){LInc=FP-Growth(DSInc,SptThr);L1Intersect(LBase,Line);L2=selectPtnsfromLBase—L1where(Ptn.CntinDSBase)+(Ptn.CntinDSInc)>=SptThrRn 第五章基于时间序列动态挖掘的企业财务危机预警L3=selectProsfromLInc.L1where(Ptn.CntinDSBase)+(Ptn.CntinDSInc)>=SptThrreturnUnion(L1,L2,L3);)ARDM(SptThr,CfdThr,DSInc){if(SptThrchanged){if(SptThrwentup){L2selectPtnsfromLwherePtn.Support>=SptThr;)else{L=IUAwithHash(L,DSBase,SptThr);)if(DSlncisnotnull){L=FUPwithFP—Growth(L,DSInc,SptThr);)if(SptThrchangedCfdThrchangedlfDSsizeincreased){if(CfdThrwentup&&SptThrdidn’tchange&&DSsizedidn’tchange){Rules=selectRulesfromRuleswhereRule.Cfd>=CfdThr;)else{Rules=GenerateRules(L,CfdThr);)returnL,Rules;).2.动态维护挖掘算法描述。ARDM算法对IUA与FUP算法进行了整合与优化,分为维护L,维护Rules两部分。在维护L时,如果SptThr发生变化,则维护原数据集LBase,如果DSInc非空,即数据集增长,计算DSInc的LInc,并结合原数据集LBase维护新数据集L。在维护Rules时,如果只有CfdThr发生变化且CfdThr上升,则在原数据集财务指标关联规则中筛选,否则由新数据集L重新关联规则。FUPwithFP.Growth算法首先通过FP.Growth算法得到Llnc,然后基于性质2,通过LBase与LInc相交,并通过更新LBase与Llnc中模式的支持度计数来产生新财务指标频繁模式集。ARDM中的IUAwithHash算法与第4章描述算法相同。3.利用关联规则进行时序分析(1)数据预处理 北京化工大学博士学位论文本章将每个公司3年12个季度12个财务指标汇总作为一条记录以进行时序分析,在这里将离散化后数据集以每年每季度每个财务指标的每一等级为粒度进行编码(如将2010年第一季度每股盈利等级为3的属性编码为以对应整数x),作为关联规则挖掘算法的输入。(2)关联规则挖掘通过本文方法对数据集在指定支持度阈值下进行频繁模式集挖掘,并由频繁模式集生成不同时间点下财务指标等级的关联规则。(3)规则筛选盈亏规则:以盈亏(或亏盈)临界时间点为区分将财务指标等级编码划分为两个集合,其中关联规则的前件指标等级编码属于临界点前,即盈利(或亏损)阶段的编码集合,规则后见属于临界点后,即亏损(或盈利)阶段的编码集合。然后将规则中整数编码的属性进行翻译得到最终的盈亏规则。-时序规则:将规则依照规则前件、后件属性所要满足的时序约束条件进行筛选以得到时序规则,在本文中即规则前件中任意属性的时间参数要不大于规则后件中任意属性的时问参数,并且时序规则的挖掘可以利用本文算法进行增量挖掘以提高挖掘效率。利用关联规则进行财务指标预测及危机预警,在进行财务分析时可以对分析目标的财务指标等级属性集在挖掘出的规则库规则的前件中进行整体或部分匹配以得到相对应的危机预警信息,还可以利用关联规则得到财务指标的发展趋势,从而向财务分析人员提供决策支持。4.性能比较本文通过比较ARDM算法与Apriori算法在两个数据集上的运行时间以分析ARDM性能。ARDM算法和Apriori算法均通过C≠}(.Net4.O)实现,运行环境为i5处理器,2G内存,Win7系统。(1)时间效率比较数据集为25家上市公司前两年亏损第三年盈利的12个季度22个财务指标数据集,其中:X坐标为支持度阈值,数值区间为O.05.0.1,Y坐标为数据及规模,数值区间为100.300,Z坐标为运行时间。图5-8是Apriori算法和ARDM算法的时间效率比较。82 图5-8Apriori算法在前两年亏损第三年盈利数据集的时间效率图5-9ARDM算法前两年亏损第三年盈利数据集的时间效率数据集为14家上市公司第一年盈利后两年亏损的12个季度22个财务指标数据集,其中:X坐标为支持度阈值,数值区间为O.05.0.1,Y坐标为数据及规模,数值区间为100—300,Z坐标为运行时间。面所列为Apfiori方法和本文方法的时间效率图。 北京化_T人学博士学位论文图5-10Apriori算法在第一年盈利后两年亏损数据集的时间效率图5-11ARDM算法在第一年盈利后两年亏损数据集的时间效率(2)规则数目比较数据集为14家上市公司第一年盈利后两年亏损的12个季度22个财务指标数据集,X坐标为置信度阈值,数值区间为0.35—0.7,Y坐标为支持度阈值,数据区间为0.2—0.9,Z坐标为规则数目。 ——.第五章基于时问序列动态挖掘的企业财务危机预警———————————————————————————————————————二二二二=::二图5-12Apfiofi算法数值区间为0.35—0.7的时间效率数据集为14家上市公司第一年盈利后两年亏损的12个季度22个财务指标数据集,X坐标为置信度阈值,数值区间为0.45—0.8,Y坐标为支持度阈值,数据区间为0.4—0.8,Z坐标为规则数目。图5—13ARDM算法在数值区间为0.45—0.8的时间效率5.3.5研究结论与预测财务危机建议一、研究结论企业产生财务危机是一段时间的演变过程,是一个时期概念,存在着危机的开始 北京化工大学博士学位论文阶段到逐步恶化,最后发展到企业破产阶段。经过实证研究,并进行规则筛选,本文提出定性分析与定量分析相结合的方法作为判定企业危机的程度和所处的不同阶段。定性分析是根据规则的发展趋势判断企业的危机程度;定量分析是通过计算危机系数最终确定企业所处的危机阶段。l、定性分析的方法(1)如果规则前件低后件高,则企业危机加重;反之,前件高后件低,则企业危机减轻。(2)如果规则总是处于levell的水平,则企业危机程度较轻,如果规则总是处于level3的水平,则企业危机程度中等,如果规则总是处于level5的水平,则企业处于破产边缘。(3)如果规则分布比较分散,则采用定量分析的方法2、定量分析的方法——综合因素法计算危机系数采用危机系数公式计算企业财务危机的具体程度,具体公式(5.1)如下:F=雨,sup龟),co碱))-三擎supp(xz)+专争。碱)(5-,)其中:n表示规则数目,x表示离散后的变量数据。二、预测财务危机建议本文选择了六种类型的企业发展变化趋势进行研究,主要包括:第一年亏损后两年盈利、前两年亏损第三年盈利、前两年亏损第三年亏损、第一年盈利后两年亏损、前两年盈利第三年亏损、前两年盈利第三年盈利。总体上可以归类为两种趋势类型,即由亏损到盈利和由盈利到亏损两种类型。重点研究了企业出现亏损的情况未来的发展变化趋势。1.企业第二年亏损是否会继续亏损的财务危机预警‘通过对企业第一年出现亏损,第二年出现盈利和亏损这两种情况比较研究发现,企业财务危机是否会继续恶化,应重点观察以下八个方面的财务指标:净资产收益率(营业利润)X3,每股现金流量X4,净资产收益率(净利润)X6,净利率X7,每股主营业务收入XlO,主营业务收入增长率X17,净利润增长率X18,现金流量比率X32。2.企业前两年亏损是否会继续亏损的财务危机预警通过对企业前两年出现亏损,第三年出现盈利和亏损这两种情况比较研究发现,企业财务危机是否会继续恶化,应重点观察以下六个方面的财务指标:净资产收益率(营业利润)X3,每股现金流量X4,营业收入X9,净利润增长率X18,,流动比率X23,资产的经营现金流量回报率X29。 第五章基于时间序列动态挖掘的企业财务危机预警通过对两类样本的数据挖掘,对所有规则的输出结果分析,我们以企业出现亏损为标志作为判别企业出现危机的开始阶段。下图选取支持度阈值为O.7,置信度阈值为0.6,数据集为13家sT上市公司中前一年盈利后两年亏损2008--2010年期间的财务指标数据,共计发现规则9条。最小支持度≤二:二::蔓零最小置信度[二二至i[至!iiij堕]数据集大小:13.规则数目:9IIi氦氟赢赫箨规则后件支持度置信度l第1年第4季每股收益XILevel1第2年第4季每股收益x1Level5oTT091;r第T年笫4孳每股啾益XrK“rr篇乏军第《莉羰严暇益翠掰I品aF⋯⋯⋯⋯U:竹⋯百百IF第i埠第i攀莓般收益nK妊irj眨年笫戳股收益“【品矗i第i军第鹌薯争资一?矿行矿ji4第1年第4季每股收益xlLevdi.第2年第4季每股收益xiLevel5058095第1年第4季每股收益X1Leveli.第2年第4季净资产收益率x6Levels069096第1年第4季每股收益X1Levell,第2年第4季每股收益X1Level5,第2年第4季净赍069o9T第i年第4季净资产收益率x6LevelI第2年第4季每股收益x1Level50690828第1年第4季净资产收益率X6Levell第2年第4季净资产收益率x6Level5089o829第1年第4季净资产收益率舫Level1第2年第4季每股收益XILevel5,第2年第4季诤资068o8Z图5-14支持度l阂值为0.7,置信度阂值为0.6的规则根据数据挖掘结果我们选定每股收益x1作为首要观察指标。在整个演变过程中我们应以净资产收益率(净利润)X6作为重要观察指标,它可以直观的评价企业运用净资产给企业带来的净利润情况。如果该指标不断恶化,最后观察每股净资产指标X2,如果出现每股净资产小于1或更低的情况,说明企业已经处于非常严重的危机阶段,如果出现每股净资产小于0的情况,说明企业已经宣告破产。三、企业财务危机评估方法在本文研究中除了寻找所有财务指标之间的规则之外,还专门设置了通过筛选的方式去寻找企业出现财务危机时各个财务指标体系评价方面之间的关系。1.企业市场价值评估下图选取支持度阈值为0.7,置信度阈值为O.5,数据集为13个sT上市公司中前一年盈利后两年亏损2008--2010年期问的财务指标数据,按照时序规则和每股收益进行规则筛选,共计发现规则15条。图5.15支持度阈值为0.7,置信度闽值为0.5的规则 北京化工大学博士学位论文通过筛选结果可以发现:每股收益x1和净资产收益率X6总是频繁出现,则可以认为这两个指标是评价企业市场价值的关键指标。2.企业盈利能力评估下图选取支持度阈值为0.6,置信度阈值为O.5,数据集为13个ST上市公司中前一年盈利后两年亏损2008--2010年期间的财务指标数据,按照时序规则和净利率进行规则筛选,共计发现规则48条。最小支持度_~⋯⋯—石百最小置信度[j二二一”二哆[至jiiii妇数据集太小=13,规则数目=48瞩鏊隧鬻鬻骥黍鬻囊爨i纛鬻鬻攀i鍪蹇’师獭r一一溪j{黼障矿⋯⋯一≮i8’9{1;11第世年第3季净利率X7Level1.第i年第4季净资产收第1年第4季每股收益x1Level1年第3季净利率X7Lewli,第i年第4季每股收益x第2年第4季每股收益x1Level5年第3季净利率X7Level1,第1年第4季每股收益x第2年第4季净赍产收益率x6Level5‘年第3季净利率XTLevel1,第1年第4季净资产收第2年第4季每般收益X1Level5年第3季净利率X7Leveli,第1年第4季净资产收第2年第4季净资产收益率x6Level5纛■≯慕’烹.;.。慧纛‘‘f荔’。““‘‘’~~’~■””’54图5—16支持度闽值为0.6,置信度阈值为O.5的规则通过筛选结果可以发现:净利率X7与每股收益X1、净资产收益率X6总是频繁出现,则可以认为净利率是评价企业盈利能力的关键指标。3.企业现金流量评估下图选取支持度阈值为0.5,置信度阈值为O.5,数据集为13个ST上市公司中前一年盈利后两年亏损2008--2010年期间的财务指标数据,按照时序规则和每股现金流量进行规则筛选,共计发现规则8条。.囊鬻霾纂鬻霪i黧l鬻鬻鬻}辫麓l鬻纂≤豢藜豢爹豢攀霪鬻蘩i霪鬻鏊;。鍪黎瀵I||i萋鬓;攀蠹豢最小支尊度[:二二二三孽最小霉!f言度L7--:二二戛雯匝垂垂基口照麴二二二熏数据集大小=13,规则数目=8冀!蘩|霎瓣籍1|纂1||||鍪攀i辫。鬣1|1|每股现金流量x4i⋯⋯巍i谪挥⋯~⋯⋯~⋯~⋯““⋯氟葡羞挥~⋯~“‘。1⋯“一⋯一一一董薄笸一?童籍蠢““⋯。。。{=‘=‘::::鬻霉鬻萋萋隧《ili灌籍:i孽要荨:=:::萋{摹蓁蓬簧鬻霞嚣鬻篷鏊;≤ii墓若{i“:等;纂二二!!;:二==:;3-4;56:T:8第年第3季净资产收益率X6Level年第3季净资产收益率x5Level年第4季每股现金流量x4Level年第4季每股现金流量x4Level1年第3季净资产收益率x6Level年第3季净资产收益率x6Level图5—17支持度阈值为0.5,置信度阈值为O.5的规则88 第五章基于时间序列动态挖掘的企业财务危机预警通过筛选结果可以发现:每股现金流量x4,资产的经营现金流量回报率X29总是频繁出现,则可以认为每股现金流量和资产的经营现金流量回报率是评价企业现金流量的关键指标。5.4小结企业财务危机预警的理论是一个包含多学科的综合性理论,它是一个涵盖企业风险管理、工业过程控制、动态信息技术、数理建模等多学科的知识。企业财务危机预警的研究就是要针对财务指标的波动挖掘其中具有信任度高的规则,当指标波动超出一定的范围,系统就应该发出预警。首先,建立企业财务危机预警理论体系,内容包括:企业财务危机的界定、形成的路线图、企业生命周期理论、财务危机的发展趋势’分析和企业财务危机的预警程序。第二,建立企业财务危机预警指标体系,危机预警指标体系不仅包括财务风险分析指标,还增加了企业治理结构指标,并利用连续数据正态分布进行等面积划分,按照危机企业的发展步骤将原有财务数据划分为五个等级,然后进行财务指标数据重构得到适合数据挖掘的数据集。第三,提出了基于时间序列动态维护的企业财务危机预警模型,主要包括构建时间序列财务数据挖掘方法,采用时间序列增量挖掘和交互挖掘机制,进行关联规则的动态维护挖掘,寻找财务指标之间的规则和预测危机企业的发展趋势。最后,选择国内上市企业中的ST公司分为两种发展趋势进行财务危机预警的实证研究,提出了定性和定量分析相结合的财务危机预测方法,并给出了预测财务危机的建议。89 原书空白页不缺内容 第六章结论与展望6.1结论随着我国资本市场的快速发展,企业面临激烈的市场竞争环境,加强企业的风险管理已经成为现代企业必须面对的课题。针对传统统计分析方法存在假设条件多,无法处理海量数据的问题;以及人工智能的方法没有考虑财务指标的时间延续性无法跟踪财务指标的波动和变化趋势等问题。本文提出了关联规则交互挖掘的财务风险分析方法和基于时间序列动态维护的财务危机预警方法,积极探索影响企业财务风险的关键因素,并根据财务指标的变化趋势对企业可能发生的财务危机进行预警。首先提出了关联规则的三种改进型算法,极大的提高了算法的效率,为进一步的应用研究提供了技术保证。在应用研究中本文提出了多层次的.企业财务风险概念树模型和时间序列动态维护的财务危机预警模型。主要研究内容及创新点有:1.提出了基于Hash结构的关联规则交互挖掘算法HIUA。现有的关联规则挖掘算法均基于支持度.置信度框架,同一数据库在不同的支持度和置信度阈值下,算法产生的频繁项集和关联规则的数目是不同的。由于事先用户不知道什么样支持度以及置信度阈值是合适的,需要不断的尝试不同的阈值才能得到理想的频繁项集和关联规则。该算法针对支持度阈值变化时的关联规则维护问题,即当用户调整阈值时存在多次遍历数据库和重复计算问题,为了尽量避免复杂数据结构的重建,减少已有计算结果的重复计算,提出了基于Hash结构的关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构快速存取算法执行过程中得到的支持度计数,提高算法运行效率。2.提出了基于部分支持度树的关联规则增量式更新算法IUPSMiner:关联规则的增量挖掘是针对数据库的不断更新而提出的,由于已有的关联规则增量挖掘方法无法更新、维护和有效管理已挖掘出来的关联规则,进而严重限制了这些算法的使用,该算法提出了基于PSTree结构的关联规则增量式更新算法,用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和构建的PSTree来挖掘所有新的关联规则,利用保留的部分支持度树和新增的部分支持度树进行合并来改善性能,减少原数据库扫描,并且只需对新数据库进行全面的挖掘,从而进一步提高算法的效率。3.提出了关联规则的动态维护算法ARDM。关联规则的动态维护算法是指当数据库和支持度阈值同时变化的情况下,将产生不同的频繁模式以及不一样的关联规则数目,现有的挖掘方法通常需要多次扫描数据库,该算法针对数据库规模增长与支持度阈值变化同时发生的情况,提出一种基于IUA和FUP算法的关联规则动态维护算 北京化工大学博士学位论文法ARDM。利用已有的信息进行交互挖掘和增量挖掘,即在原来的数据库中使用新的支持度阈值进行交互挖掘,同时在新增加的数据库中使用新的支持度阈值进行增量挖掘,并通过Hash结构与模式增长方法进行优化,有效提高了算法的效率。4.提出了将关联规则交互挖掘算法应用于企业财务风险分析中。本文采用关联规则交互挖掘的方法,选择更加广泛的多个方面的财务指标,通过挖掘所有财务指标之间的规则,最终确定选择更具有代表性的财务风险指标,与传统分析方法相比更加具有客观性和现实应用意义。首先,建立企业财务风险分析理论体系和风险分析流程,第二,建立企业财务风险分析指标体系,并运用变量相关系数分析方法,剔除其中部分相关度较高的风险指标。按照区间划分定义财务指标风险等级,将所有财务指标划分为五个等级,并对原有的数据集进行重构,转化为适合关联规则挖掘的离散型数据集。第三,建立基于关联规则交互挖掘算法的企业财务风险分析模型,主要包括构建风险概念层次树,并采用递减支持阈值的交互挖掘策略,寻找财务风险指标之间的规则。最后,选择国.内上市企业中的121家ST公司作为研究样本,时间跨度为2005.2010年,经过数据筛选,保留48家公司样本数据,合计6144条研究样本记录,进行企业财务风险分析的实证研究,经过指标变量相关性分析、数据集重构,并建立关联规则交互挖掘平台,能够比较轻松调整阈值的变化,并输出时间效率图和规则数量图,在此基础上进行规则的分析,并提出影响财务风险的十个核心指标和防范财务风险的建议。并通过实际数据分析和测试,证明关键指标的波动将严重影响并决定企业的风险程度。5.提出了将时间序列动态维护挖掘算法应用于企业财务危机预警中。首先,建立企业财务危机预警理论体系,主要包括:企业财务危机的界定、财务危机形成的路线图、企业生命周期理论、财务危机的发展趋势分析和企业财务危机的预警程序。第二,建立企业财务危机预警指标体系,危机预警指标体系不仅包括财务风险分析指标,还增加了企业治理结构指标,并利用连续数据正态分布进行等面积划分,按照危机企业的发展步骤将原有财务数据划分为五个等级,然后进行财务指标数据重构得到适合数据挖掘的数据集。第三,提出了基于时间序列动态维护的企业财务危机预警模型,主要包括构建时间序列财务数据挖掘方法,采用时间序列增量挖掘和交互挖掘机制,进行关联规则的动态维护挖掘,寻找财务指标之间的规则和预测危机企业的发展趋势。最后,选择国内上市企业中的106家ST公司作为研究样本,时间跨度为2008.2010年,经过数据筛选,保留38家公司样本数据,合计9120条研究样本记录,进行企业财务危机预警的实证研究,经过指标变量区间划分、数据集重构,并建立关联规则动态维护挖掘平台,不仅能够进行阈值调整和添加新的数据,还能够进行任意指标的筛选,并输出时间效率图和规则数量图,在此基础上进行规则筛选,提出了定性分析与定量分析相结合的方法,定性分析是根据规则的发展趋势判断企业的危机程度;定量分析是通过计算危机系数最终确定企业所处的危机阶段。 第六章结论与展望6.2工作展望本文的研究内容在以下几个方面值得做进一步的深入研究:1.进一步深入研究数据挖掘方法,提升数据挖掘的效率,以适应大型数据库挖掘的需要。·2.积极探索其它数据挖掘方法在财务风险分析与危机预警中的应用,比较这些方法的优越性。93 原书空白页不缺内容 参考文献【1】[2】[3】[4】[5】[6】●[7】[8】[9】[10】1】2]3】[14】[15]【16】[17][18】[19】[20】[21】[22][23][24】Gui巧MeiH,ChenZAnAnalysisoftheCausesandEnlightenmentoftheUsSubprimeCrisis:AnAssetSecuritizationPerspective[C].ProceedingsoftheFourthInternationalConferenceonManagementScienceandEngineeringManagement,Nov15—17,2010,TaiwanMukuddem-PetersenJ,MulaudziMP,PetersenMA,SchoemanIM.OptimalMortgageLoanSecuritizationandtheSubprimeCrisis[J].OptimizationLetters,2010,4(1):97—115雷良海,魏遥.美国次贷危机的传导机制【J】.世界经济研究,2009,(1):24—31DiasJ.SovereignDebtCrisisintheEuropeanUnion:AMinimumSpanningTreeApproach[J】.PhysicaA:StatisticalMechanicsandItsApplications,2012,391(5):2046-2055HuangS-C.UsingGaussianProcessBasedKernelClassifiersforCreditRatingForecasting[J].ExpertSystems、)l,itllApplications,2011,38(7):8607—8611刘文琦,毛一峰.企业财务风险的识别方法研究[J】.企业经济,201l,(1):348.349陈文俊.企业财务风险:识别、评估与处理[J】.财经理论与实践,2005,(3):87—91WangYWangS,LaiKK.MeasuringFinancial雕skwithGeneralizedAsymmetricLeastSquaresRegression[J].AppliedSoftComputing,2011,11(8):5793·5800方东明.论杜邦财务分析体系在企业财务管理中的运用【J】.安徽理工大学学报(社会科学版),2011,(2):27—31LiYM,JiaS,ZhaoN.StudyontheEvaluationModelofInternalControlBasedontheErmFramework[C].ProceedingsofIscramChina2010:FourthInternationalConferenceonInformationSystemsforCrisisResponseandManagement,Sept10-12,2010,Harbin徐蔼婷.德尔菲法的应用及其难点【J】.中国统计,2006,(9):57—59刘平.财务报表分析方法与应用[J】.商场现代化,2007,(20):348—349Rodriguez-P6rezG,SlofJ,SolaM,TorrentM,VilardellI.AssessingtheImpactofFair-ValueAccountingonFinancialStatementAnalysis:ADataEnvelopmentAnalysisApproach[J].Abacus,2011,47(1):61—84刘焕蕊.控制权视角下中小股东利益保护问题探讨[J】.商业时代,2011,(32):102—103FitzpatrickPJ.AComparisonofRatiosofSuccessfulIndustrihlEnterpriseswithThoseofFailedFirms[J].TheAccountantsPublishingCompany,1932,(2):589-605AltmanEI.FinancialRatios,DiscriminantAnalysis,andthePredictionofCorporateBankruptcy[J].TheJournalofFinance,1968,23(4):589—609MeyerPA,PiferHW.PredictionFoBankFailures[J].TheJournalofFinance,1970,25(4):853-868LaitimenEK.FinancialPredictorsforDifferentPhasesoftheFailureProcess[J].Omega,1993,2l(2):215—228朱怀意,高涌.核心能力战略危机预警系统设计原理与方法[J】.软科学,2002,16(5):13.16任华,徐绪松.企业危机管理的预警系统[J】.武汉理工大学学报(信息与管理工程版),2003,25(06):153—157刘恒江,陈继祥.战略环境分析和危机预警研究【J】.上海管理科学,2003,(4):47_49何杰,丁智慧.构建中小企业危机预警系统【J】.企业改革与管理,2005,(7):10.11SmithRF.WinakorAH.ChangesintheFinancialStructureofUnsuccessfulCorporations[J].UniversityofIllinois,BureauofBusinessResearch,1935,(10):57-69MerwinCL.FinancingSmallCorporationsinFiveManufacturingIndustries,1926—1936[M].New95 北京化工大学博士学位论文【25】[26]【27]【28】【29】[30】[31】[32]【33】【34]【35][36】[37】【38][39】[40]【41】[42]【43]【44][45】[46】[47】[48】York:A1TIOPress,1979BeaverWH.FinancialRatiosasPredictorsofFailure,EmpiricalResearchinAccounting:SelectedStudy[J].JournalofAccountingResearch,1966,(5):47—59彭素欣.基于z.Score模型的上市公司财务风险预警研究【J].中国乡镇企业会计,2008,(5):101—102WangFIChengJ.FinancialRiskAssessmentModelofListedCompaniesBasedonLogisticModel[M].inModelingRiskManagementforResourcesandEnvironmentinChina.Berlin:Springer,2011MaftiIlD.EarlyWarningofBankFailure[J].JournalofbankingandFinance,1977,1(3):249—276OhlsonJA.FinancialRatiosandtheProbabilisticPredictionofBankruptcy[J].JournalofAccountingResearch,1980,(18):109—131宁静鞭.基于knn和logistic回归方法的财务预警模型比较[J].商业时代,2008,(13):74-75ShenH,CuiJ,ZhouZ,MiIlH.Bp—NeuralNetworkModelforFinancialRiskWarninginMedicineListedCompany【C】.FourthInternationalJointConferenceonComputationalSciencesandOptimization(cso2011),April15—19,2011,Yunnan吴应宇,蔡秋萍,吴苋。基于神经网络技术的企业财务危机预警研究[J].东南大学学报(哲学社会科学版),2008,10(1):22.26李铭,肖东生.基于bp神经网络的上市公司财务预警[J】.工业工程,2008,11(6):122—129邓亮,赵进,王新.基于遗传算法的网络编码优化【J].软件学报,2009,20(8):2269—2279SivapathasekaranC,MukherjeeS,RayA,GuptaA,SenR.ArtificialNeuralNetworkModelingandGeneticAlgorithmBasedMediumOptimizationfortheImprovedProductionofMarineBiosurfactant[J].BioresourceTechnology,2010,101(8):2884-2887李清.基于适度财务指标和遗传算法的财务危机预测模型研究[J].统计与信息论坛,2010,25(2):3-9杨毓,蒙肖莲.用支持向量机(Svm)构建企业破产预测模型(J】.金融研究,2006,(10):65—75孙伟,叶如意.基于案例推理的平衡计分法在财务预警体系构建应用研究[J】.科技与管理,2011,13(2):32—3.5CeglarA,RoddickJEAssociationMining[J].AcmComputingSurveys,2006,38(2):ArticleID5韩家炜,KamberM.数据挖掘概念与技术【M].北京:机械工业出版社,2004WuX-D,ZhuX-Q,ChenQ—J,WangF-YUbiquitousMiningwithInteractiveDataMiningAgents[J].JournalofComputerScience&Technology,2009,24(6):1018—1027YinY,GongG,HanL.TheoryandTechniquesofDataMininginCgfBehaviorModeling[J].ScienceChina:InformationSciences,2011,54(4):717—731张潇,恽爽,陆桑璐,陈道蓄.并行数据挖掘研究【J].计算机工程,2003,29(17):59一59刘英华,杨炳儒,马楠,曹丹阳.分布式隐私保护数据挖掘研究[J].计算机应用研究,2011,28(10):3606—3610CreightonC,HanashS.MiningGeneExpressionDatabasesforAssociationRules[J].Bioinformatics,2003,19(1):79—86LiL,ZhaiDH,JinEGrg:AnEfficientMethodforAssociationRulesMiningonFrequentClosedItemsets[C].Proceedingsofthe2003IeeeInternationalSymposiumonIntelligentControl,Oct,8,2003,Houston陈鹏,吕卫锋.一种基于有效修剪的最大频繁项集挖掘算法[J】.北京航空航天大学学报,2006,32(2):218—243宋威,李晋宏,徐章艳,杨炳儒.一种新的频繁项集精简表示方法及其挖掘算法的研究【J】.计96 参考文献算机研究与发展,2010,47(2):277—285[49】颜跃进,李舟军,陈火旺.基于fp—Tree有效挖掘最大频繁项集【J].软件学报,2005,16(2):216—222[50】[51】【52][53】【54】[55】[56][57][58]【59][60]【61][62][63】[64][65]【66】[67][68]战立强,刘大昕.频繁项集快速挖掘算法研究【J].哈尔滨工程大学学报,2008,29(3):266.271BodonEAFastAprioriImplementation[C].ProceedingsoftheIEEEICDMWorkshoponFrequentItemsetMiningImplementations,Dec19-22,2003,Melbourne,Florida,USAAgrawalR,ImielinskiT,SwamiA.MiningAssociationRulesbetweenSetsofItemsinLargeDatabases[C].ProceedingsoftheACMSIGMODInternationalConferenceontheManagementofData,May26—28,1993,Washington,D.C.,UnitedStatesAgrawalR,SrikantR.FastAlgorithmsforMiningAssociationRules[C].Proceedingsofthe20thInternationalConferenceonVeryLargeDataBases,Sept12-15,1994,SantiagoAgrawalRC,AggarwalCC,PrasadVv.ATreeProjectionAlgorithmforGenerationofFrequentItemsets[J].JournalofParallelandDistributedComputing,2001,61(3):350·371AgrawalRC,AggarwalCC,PrasadVDepthFirstGenerationofLongPatterns[C].Proceedingsofthe6thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMiningAug20—23,2000,BogtonMAHanJW,PeiJ,YinYW.MiningFrequentPatternswithoutCandidateGeneration[C].ProceedingSIGMOD’2000,May16-18,2000HanJWjPeiJ,YinYW.MiningFrequentPatternswithoutCandidateGeneration:AFrequent—PatternTreeApproach[J].DataMiningandKnowledgeDiscovery,2004,8(1):53—87冯玉才,冯剑琳.关联规则的增量式更新算法【J】.软件学报,1998,9(4):301—306周海岩.关联规则的开采与更新[J].软件学报,1999,10(10):1178—1184MaXL,TangSw,YangDQ,DuXP.TowardsEfficientRe—MiningofFrequentPatternsUponThresholdChanges[J].LectureNotesinComputerScience,2002,2419:80—88CongG,OoiBC,TanKL,TungAKH.GoGreen:RecycleandReuseFrequentPauerns[C].Proceedingsofthe20thInternationalConferenceonDataEngineering,Mar30一Apr2,2004,Boston,MassachusettsCheungD,HanJ,Ng《WongCZMaintenanceofDiscoveredAssociationRulesinLargeDatabases:AnIncrementalUpdatingTechnique[C].ProceedingsofInternationalConferenceonDataEngineering,Feb26一Mar1,1996,NewOrleansCheungD,LeeS,KaoB.AGeneralIncrementalTechniqueforMaintainingDiscoveredAssociationRules[C】.Proceedingsofthe5thInternationalConferenceonDatabaseSystemsforAdvancedApplications,apr1-4,1997,MelbourneLeeSD.CheungDW.MaintenanceofDiscoveryAssociationRules:WhentoUpdate?[C].Proceedingsofthe1997ACM—SIGMODWorkshoponDataMimngandKnowledgeDiscovery,May,1997,Tucson杨秀金,孟军.基于频繁模式表的增量更新算法[J】.计算机应用,2006,22(Supp):110-112WangZ-C,XueL—X.ANewIncrementalUpdatingAlgorithmforAssociationRules[J].JournalofChongqingUniversityofPostsandTelecommunications(NaturalScienceEdition),2007,19(3):309—313邹力鸥,张其善.基于can-树的高效关联规则增量挖掘算法【J].计算机工程,2008,34(03):28—3l肖辉,胡运发.基于分段时间弯曲距离的时问序列挖掘[J】.计算机研究与发展,2005,42(1):72—78【69]TsayRS.AnalysisofFinancialTimeSeries[M].NewYork:Wiley-Interscience,201097 北京化工大学博士学位论文【70】[71]【72】[73][74】【75】[76】[77][78】[79】[80】[81][82】[83][84]【85][86】[87】[88]【89]【90】【91】[92】黎子良,邢海鹏.金融市场中的统计模型和方法【M】.北京:高等教育出版社,2009KhasheiM,BijariM,ArdaliGAR.ImprovementofAuto—RegressiveIntegratedMovingAverageModelsUsingFuzzyLogicandArtificialNeuralNetworks(Arms)[J].Neurocomputing,2009,72(4—6):956—967林子雨,杨冬青,王腾蛟.用基于移动均值的索引实现时问序列相似查询【J】.软件学报,2008,(09):2349—2361吕志军,王照飞,谢福鼎,桑雪.基于fcm聚类的时间序列模糊关联规则挖掘[J】.大连理工大学学报,2010,50(05):806—810王骏,钟富礼,王士同,邓赵红.基于移相加权球面单簇聚类的周期时间序列异常检测【J】.自动化学报,2011,37(08):984—992朱冲,朱贤贵,张向利.金融时间序列挖掘综合模型[J].计算机系统应用,2009,(02):46-48荣冈,刘进锋,顾海杰.数据库中动态关联规则的挖掘[J】.控制理论与应用,2007,24(01):127—131潘定,沈钧毅.时态数据挖掘的相似性发现技术[J】.软件学报,2007,18(02):246—258杨蓓,黄厚宽.挖掘数据流界标窗口top-K频繁项集[J】.计算机研究与发展,2010,47(03):463-473●XuKLi×ShawG.ReliableRepresentationsforAssociationRules[J].Data&KnowledgeEngineering,2011,70(6):555—575。ZhongRW:WangHP.ResearchofCommonlyUsedAssociationRulesMiningAlgorithminDataMining[C].Proceedingsofthe2011InternationalConferenceonInternetComputingandInformationServices,Sept17—18,2011,HongKong温蕴.一种基于阈值变化的增量式更新算法研究[J】.计算机科学,2008,35(8):247—248宋中山,成林辉,吴立峰.一种基于关联规则的增量数据挖掘算法【J].湖北大学学报(自然科学版),2006,28(03):240.243HongT-P,WangC-YTsengS-S.AnIncrementalMiningAlgorithmforMaintainingSequentialPatternsUsingPre—LargeSequences[J].ExpertsSystemswithApplications:AnInternationalJournal,201l,38(6):7051-7058.赵春,林晓勇,朱群雄.基于部分支持度树的关联规则增量式更新算法[J].清华大学学报,2011,51(12):1677—1681GoulboumeG,CoenenF,LengP.AlgorithmsforComputingAssociationRulesUsingaPartial-SupportTree[J].Knowledge—BasedSystem,2000,13:141—149‘AyanNF,TanselAU,ArkunE.AnEfficientAlgorithmtoUpdatingLargeItemsetswithEarlyPruning[C].KDD’99ProceedingsofthefifthACMSIGKDDinternationalconferenceonKnowledgediscoveryanddatamining,Aug15—18,1999,SanDiego,California,USAHongT-P,LinC·彤WuY-L.MaintenanceofFastUpdatedFrequentPatternTreesforRecordDeletion[J].ComputationalStatistics&DataAnalysis,2009,53(7):2485-2499LinKC,LiaoIE,ChenZS.AnImprovedFrequentPaRemGrowthMethodforMiningAssociationRules[J].ExpertSystems谢t11Applications,2011,38(5):5154—5161易彤,徐宝文,吴方君.一种基于审树的挖掘关联规则的增量更新算法【J】.计算机学报,2004,(05):52—57CoenenF,LengP,PagourtzisA,RytterW:SouliouD.ImprovedMethodsforExtractingFrequentItemsetsfromInterim—SupportTrees[J].Software:PracticeandExperience,2006,39(6):263—276夏卿强9,杨晋浩,钟守铭.基于股价均线形态序列的数据挖掘模型[J].电子科技大学学报,2007,36(2):459—462MoellerRobertR.CosoInterpriseRiskManagement[M].NewYork:JohnWiley&Sons.2007 参考文献【93】[94][95】[96]【97][98][99][100][101】[102】【103]04]05]06][107】[108][109】[110】[111]【112】【113】[114][1151FraserJ,SimkinsBJ.EnterpriseRiskManagement[M].NewYork:JohnWiley&Sons,2010郝松.中央企业风险管理框架的建立与实施[J].经济管理,2007,29(23):82—84ChenH,ChauM,LiSH.EnterpriseRiskandSecurityManagement:Data,TextandWebMining[J].DecisionSupportSystems,2011,50(4):649—650ZhengX,HanYCommEBMO.Irm-theNewTrendofEnterprise耻SkManagement[C].2ndIntemationalConferenceonEngineeringandBusinessManagement,Mar22—24,2011,Wuhan张飒.基于COSO风险管理框架的企业财务风险控制评价研究[J】.南京财经大学学报,2009,(03):63—67ChapmanRJ.SimpleToolsandTechniquesforEnterpriseRiskManagement[M].NewYork:JohnWiley&Sons.2006LamJ.EnterpriseRiskManagement:FromIncentivestoControls[M].NewJersey:JohnWiley&Sons,Inc.,2003XingLM,MaL,LiYH.Ahp-FuzzyComprehensiveEvaluationMethodforEnterpriseTechnologyInnovationRiskAssessmentandEarlyWarningResearch[C].Proceedingsofthe2ndIntemationalConferenceonRiskManagement&EngineeringManagement,Jan04—06,2008,TorontoYacovY.Haimes.RiskModeling,Assessment,andManagement[M].NeWYork:JohnWiley&Sons,2007HoTSYLeeSB,YiS-B.TheOxfordGuidetoFinancialModeling[M].Oxford:OxfordUniversityPress,2004InspurGroupGenersoftCoLtd.FinancePre—WarningExpertSystemforFlexibleAdjustingWeight,HasPre—WarningExpertSystemComprisingFinancialIndexTrainings,andPre—WarningProcessinFinancialIndexCalculatingWeightValueAccordingtoAdjustingChange[P].China:CNl02214332-A,Oct12,2011程建伟.上市公司盈利能力和影响因素的实证研究[J】.金融教学与研究,2006,(05):44-46陈俊.企业营运能力指标分析及评价[J】.会计之友,2006,(06):61—62刘刊,王宏宇.基于投入产出的创新型企业成长能力评价指标的建立[J].企业技术开发,2009,28(07):94—96’Ablanedo.RosasJH,GaoH,ZhengX,AlidaeeB,WangH.AStudyoftheRelativeEfficiencyofChinesePorts:AFinancialRatio—BasedDataEnvelopmentAnalysisApproach[J].ExpertSystems,2010,27(5):349—362.郝玉英.企业现金流量控制的对策探析【J】.东北财经大学学报,2005,(03):49—51BahiraieA,AzharAKM,IbrahimNA.ANewDynamicGeometricApproachforEmpircalAnalysisofFinancialRatiosandBankruptcy[J].JournalofIndustrialandManagementOptimization,2011,7(4):947—965XieLH,XieYL.AnEnterpriseCashFlowManagementModelBasedonSystemDynamics[C].Proceedingsof2009ConferenceonSystemsScience,ManagementScience&SystemDynamics,May29—31,2009,Shanghai张朝晖,陆玉昌,张钹.发掘多值属性的关联规则【J].软件学报,1998,9(11):801-805HerawanT.DensMM.ASoftSetApproachforAssociationRulesMining[J].Knowledge—BasedSystems,2011,24(1):186-195‘王德兴,胡学钢,刘晓平,黄冬梅.基于扩展概念格的属性归纳算法【J】.上海交通大学学报,2009,43(3):476—479ChenYX.AWarningModelforEnterpriseFinancialCrisis[C].5thInternationalConferenceonInnovationandManagement,Dec10-11,2008,MaastrichtFocardiSM,FabozziFJ.TheMathematicsofFinancialModelingandInvestmentManagement[M]. 北京化工大学博士学位论文[116】[117】【118】【119]【120】【121][122][123】【124】[125]【126]【127】北京:中国人民大学出版社,2000ZhangTN.ResearchontheStrategicCrisisManagementoftheEnterprise[C].ProceedingsoftheFirstISCRAM.ChinaWorkshopOilInformationSystemsforCrisisResponseandManagementSept2—3,2006,Harbin宋建兰.浅谈上市公司财务危机的界定[J】.商业时代,2008,(04):78曾俊丽,陈留平.财务危机的定义研究[J】.商场现代化,2007,(10):382LillFYLiangDR,ChenEC.FinancialRatioSelectionforBusinessCrisisPrediction[J].ExpertSystemswithApplications,2011,38(12):15094-15102崔慧岩.上市公司财务危机预警研究[J].财会通讯,2011,(18):86—88崔洁.企业财务危机预警系统问题及对策【J].财会通讯,2011,(14):138-140俄召娣,陈红.高科技企业财务危机预警模型构建[J】.生产力研究,2009,(13):175—176刘茜,王高.国外企业危机管理理论研究综述[J】.科学学研究,2006,24(Supp):255—260DuanLH.HeESyntheticAssessmentSystemBasedonNon-OptimumAnalysisTheory[C].InternationalConference011ResearchChallengesinComputerScience,Dec28-29,2009,ShanghaiLiangJH,FanJP,ZhangYModemEnterpriseEcologyandNewParagonofModemEnterpriseManagement[C].InternationalConferenceonManagementScienceandEngineering,Aug15—17,2003,Atlanta。ZhangMH,YuanZP.ResearchonConstructionoftheEnterprise’SCoreCompetitivenessfromtheViewofComplexScientificManagement[C].3rdInternationalConferenceonWirelessCommunications,NetworkingandMobileComputing(WiCOM2007),Sept21—25,2007,ShanghaiCrouhyM,GalaiD,MarkR.RiskManagement[M].NewYork:TheMcGraw-HillCompanies,2009100 致谢经过五年的不懈坚持与努力,我的研究和学位论文即将完成,首先,要向我的导师朱群雄教授表示感谢。在整个研究过程中,从开始的选题到最后的完稿中间经历过许多曲折与调整,每当我感到无所适从,不知如何开展进一步的深入研究时,朱老师总是能给我新的启发,让我看到了研究工作继续开展下去的新希望。从朱老师的身上让我深刻体会到做学问要坚持科学的态度和不断追求创新的精神,我所取得的每一点进步和成绩都凝聚着朱老师辛勤的汗水,特此向朱老师表示衷心的感谢。智能工程研究室是一个融洽、互助的团队,学术气氛浓厚,每当我遇到困难时大家都给予无私的帮助。在此,要感谢研究室的林晓勇老师,本课题的研究工作得到他很多指导;感谢史晟辉、徐圆、李芳老师对我的热情帮助和积极研讨;感谢经管学院程礼盛老师给予我的支持与帮助。最后,要向我的父母、爱人、单位领导和亲戚朋友表示感谢,在撰写论文的过程中大家给予我很多支持和鼓励。101 原书空白页不缺内容 研究成果及发表的学术论文发表及已接受的论文1.ChunZhaoXiaoyongLinandQunxiongZhu.Share—ARM:Asharestrategyalgorithmforassociationrulesmining.TheProceedingsof3rdInternationalconferenceoninformationscienceandengineering(ICISE2011).2011,1269-1272(EI)2.赵春,林晓勇,朱群雄.基于部分支持度树的关联规则增量式更新算法.媾:擎尢学学缎EI核心).2011,51(12):1677-16813.朱群雄,赵春,冯磊,林晓勇.关联规则的动态维护及其在财务数据中的应用.媾:擎夕睁撒EI核心).2012,52(5):694-698·4.朱群雄,赵春,冯磊,林晓勇.基于Hash结构的关联规则交互挖掘算法HIUA.游擎力学学掇EI核心).2012,52(6):874.879103 原书空白页不缺内容 作者和导师简介导师简介朱群雄,男,1960年出生,汉,江苏无锡人,工学博士、教授、博士生导师。研究方向:智能系统与数据挖掘、过程工业模拟与生产安全、虚拟现实与地理信息系统(Web.VRGIS)。电子信箱:zhuqx@mml.buct.edu.cn作者简介赵春,男,1973年出生,江苏省泰州人,工学博士,副研究员。研究方向:数据挖掘电子信箱:zhaochun@mail.bun.edu.cn 北京化工大学博士研究生学位论文答辩委员会决议书研究生姓名:赵春专业:控制理论与控制工程论文题目:基于数据挖掘技术的财务风险分析与预警研究指导教师姓名朱群雄职称:教授论文答辩日期:2012年5月30日地点:信息学院3层会议室论文答辩委员会成员姓名职称工作单位是否博导本人签名黄德先教授清华大学是税先戴亚平教授北京理工大学是书多耷张朝晖教授北京科技大学是潮黄克谨教授县专屯涟,~王建林教授是旌默I、注:1.答辩委员会成员中博士导师和外单位专家应各占一半以上。2.此表用于存档,除本人签名务必用钢笔填写外,其余处必须用计算机打印。 答辩委员会对论文的评语(选题意义、文献综述、论文所取得的成果及水平、学风和论文写作水平、论文的不足之处):论文研究了关联规则数据挖掘算法及其在财务风险分析与预警中的应用,选题具有重要的理论意义和应用价值。,论文取得如下主要成果:1、提出了基于Hash结构的关联规则交互挖掘算法HIUA、基于部分支持度树的关联规则增量式更新算法IUPSMiner和关联规则的动态维护算法ARDM,算法运行效率高。2、提出了多层次的企业财务风险概念树模型,根据递减支持阈值的交互挖掘策略和支持度阈值的调整,确定具有代表性的财务风险指标,通过ST公司的财务数据验证了模型的有效性。3、提出了基于时间序列动态维护的企业财务危机预警模型,实例验证了预警模型的有效性。论文结构合理、书写规范、条理清晰、观点正确。研究成果具有创新性。论文工作表明作者掌握了本学科坚实宽广的基础理论和系统深入的专门知识,具有独立从事科研工作的能力。论文达到了工学博士学位论文的水平。答辩过程中讲解清楚,回答问题正确。对学位论文水优秀良好一般较差平的总体评价一答辩委员会表决结果:同意授予博士学位五票,不同意授予博士学位零票,弃权零票。根据投票结果,答辩委员会做出建议授予该同学博士学位的决议。答懒蝴繇前彘乞_012年5J30日

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
大家都在看
近期热门
关闭