基于数据挖掘技术的财务分析方法研究

基于数据挖掘技术的财务分析方法研究

ID:33986861

大小:2.73 MB

页数:68页

时间:2019-03-02

上传者:U-22107
基于数据挖掘技术的财务分析方法研究_第1页
基于数据挖掘技术的财务分析方法研究_第2页
基于数据挖掘技术的财务分析方法研究_第3页
基于数据挖掘技术的财务分析方法研究_第4页
基于数据挖掘技术的财务分析方法研究_第5页
资源描述:

《基于数据挖掘技术的财务分析方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

西安石油大学硕士学位论文基于数据挖掘技术的财务分析方法研究姓名:薛建楼申请学位级别:硕士专业:企业管理指导教师:赵选民20090520 中文摘要论文题目:基于数据挖掘技术的财务分析方法研究专业:企业管理硕士生:薛建楼(签指导教师:赵选民(签摘要会计核算进入了以网络为特征的新时代,财务数据库规模不断扩大,财务数据呈现“爆炸”式增长。与此同时,财务信息使用者对信息的要求越来越高。面对大量的财务数据,如果没有高级分析技术手段,而只拘泥于现有的分析方法,就不能分析海量财务数据中存在的关系和规则,隐藏在数据背后的真实经济业务活动,也不能根据现有的数据预测公司未来的发展趋势,从而做出正确的决策。数据挖掘技术的迅猛发展可以很好地为我们解决这一难题,是推动财务分析方法发展的应用技术之一。本文以我国沪深A股上市房地产业70家公司为研究样本,引入以统计学为基础的一种数据挖掘方法一主成分分析,并借助于计算机软件SPSS和EXCEL进行研究,期望在财务研究方法上有所创新,满足新环境下信息需求者的要求。在具体研究过程中,本文主要有以下创新之处:改变依靠人为和经验选取财务指标的做法,而是遵循一定的原则进行选取;在应用主成分分析方法时,改变将各种财务指标同等对待的做法,而是采用分层的研究思路,首先对偿债能力、运营能力、获利能力和发展能力分别进行主成分分析,计算每项财务能力的综合得分,其次是以每类财务能力综合得分为数据对象再次进行主成分分析,最终计算企业综合财务能力得分,并用聚类分析方法验证最终计算结果的有效性。本文最后的研究结果集中表现为上市房地产公司财务状况综合得分表,各方财务信息需求者可以选择不同的角度进行经济决策分析,从而提高决策的可行性和科学性。关键词:数据挖掘技术财务分析主成分分析聚类分析房地产行业论文类型:应用基础研究 英文摘要Subject:ThestudyontheFinancialAnalysisMethodBasedonDataMiningTechnologySpeciality:EnterpriseMaName;XueJianlou(siInstructor:zhaoXuanminABS’I’RAC’I’AccountingintoaneweraiScharacterizedbythenetwork,thescaleofthefinancialdatabaseisbeingexpanded,thefinancialdatais”explosive”growth.Atthesametime,usersoffinancialinformationhadbecomeincreasinglydemandingofinformation.Thefaceofmassivefinancialdata,iftherewasnoadvancedanalysistechniques,adheretotheonlywayofexistinganalysismethod,itCallnotbeanalyzedinthemassoffmancialdataandrulesthatexist,theoperationalactivitieshiddeninthedata,thedevelopmenttrendofthefuturecallnotbeforecasted,inordertomaketherightdecisions.,nlerapiddevelopmentofDataMiningTechnologygaveUSagoodsolutiontothisproblem,promotedthedevelopmentofthefinancialanalysisoftheapplicationoftechnology.TllispaperselectedChina'srealestateindustryinShanghaiandShenzhenA—sharelisted70companiesassamples,introducedaDataMiningmethodbyusingthescientificstatisticsways—theprincipalComponentAnalysis,andusedcomputersoftwareofSPSSandEXCELtostudy,expectedinnovativemethodsinthefinancialresearchmethodstomeettheinformationneedsofthenewenvironmentdemands.Inthespecificcourseofthestudy,thispaperhasthefollowinginnovations:changedselectingfinancialindicatorsreliedonman.madeandexperience,butmustfollowtheprincipleofselection;IntheapplicationofthePrincipalComponentAnalysisMethod,changedintreatingfinancialindicatorsinthesameway,insteadofusingtheideaofstratificationresearch,firstofall,onthesolvencycapability、operationcapability,profitabilitycapabilityanddevelopmentcapacitytocarryoutPrincipalComponentAnalysis,calculatedfinancialcapabilityofeachoftheintegratedscore,followedbyfinancialcapabilityofeachtypeofdataobjectintegratedscoreofprincipalcomponentanalysisagain,thefinalcalculationoftheconsolidatedfinancialcapacityofenterprisesScores,usedClusterAnalysismethodtoverifythefinalresults.Finally,thefindingsfocusontheperformanceoflistedrealestatecompanyforthefinancialsituation6fthecomprehensivescoresheet,thefinancialinformationneedsofthepartiesCanchooseadifferentpointtomakeeconomicdecision,therebyenhancingthedecision-makingpracticalandscientific.Keywords:Thesis:DataMiningTechnology,FinancialAnalysis,PrincipalComponentAnalysis,Clusteranalysis,TherealestateindustryAppliedResearchIII 学位论文创新性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安石油大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:隰掣学位论文使用授权的说明本人完全了解西安石油大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安石油大学。学校享有以任何方法发表、复制、公开阅览、借阅以及申请专利等权利,同时授权中国科学技术信息研究所将本论文收录到《中国学位论文全文数据库》并通过网络向社会公众提供信息服务。本人离校后发表或使用学位论文或与该论文直接相关的学术论文或成果时,署名单位仍然为西安石油大学。论文作者签名:龇引⋯数隰尹 第一章绪论1.1研究背景及意义1.1.1研究背景财务分析是管理中不可缺少的工具,是会计信息供给与会计信息需求之间的枢纽,它通过对会计信息的准确透视与剖析,满足不同财务信息需求者的不同层次的要求。随着社会经济、科学的发展,会计核算呈现出新的特点,其中网络特征尤为突出。在网络环境下,会计核算的业务量以及数据库规模不断扩大,呈“爆炸”式增长。与此同时,各方财务信息需求者对企业财务信息的要求也越来越高,不仅要求得到企业的财务与非财务数据,尤其希望通过财务分析能更多地披露核心与非核心信息。面对大量的财务数据,如果没有相应的高级分析技术手段及工具,而只拘泥于现有的分析方法,就不能有效、快速地分析海量财务数据中隐含的关系和规则、隐藏在数据背后的真实经济业务活动,也不能根据现有的数据预测公司未来的发展趋势,从而帮助相关决策者做出正确的经济决策。数据挖掘信息技术的迅猛发展可以很好地为我们解决这一难题。数据挖掘技术是推动财务分析方法发展的应用技术之一,是可以借鉴的有效途径之一。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,进行抽取、转换、分析和提炼,从中提取隐含的、人们事先不知道的、但又是潜在有用的信息和知识的过程【5】。目前,数据挖掘已经广泛应用于电子商务、金融风险、生产管理、市场控制及分析和科学探索等领域,同时,数据挖掘技术也被应用在财务领域,研究焦点主要集中在财务分析和财务管理、决策上。一1.1.2研究意义随着我国社会主义市场经济体制的建立和完善,市场体系日臻健全,上市公司逐渐增多,投资风险也越来越大。投资者要准确、及时地掌握上市公司的经营状况和财务状况,必须利用上市公司提供的财务报告进行财务分析,但是新时期会计核算及信息呈现出新的特点——网络化、财务活动业务量及数据爆炸式增长等,如果继续沿用现行财务分析方法,不仅得不到真实、可靠的财务信息,而且分析成本也越来越大。本文主要基于实用指标学派开创的财务指标,应用有效的数据挖掘技术,挖掘上市公司有效的财务信息,积极探索一条新的、简单实用的财务分析方法,具有广泛的意义:(1)提升财务分析水平,提高财务信息质量。提高财务信息的真实、可靠性,提供科学的财务决策依据。数据挖掘技术能在网络环境下的财务信息数据库中筛选出关键财务数据及指标、减少冗余,完成一系列的目标转换、结构改变等,从庞大的财务业务及数据信息流中分辨、析取、整理、挖掘出各方相关需求者急需的财务信息,在提升分析水平同时,迸一步提高财务信息的真实、可靠性,满足新形势下不同会计信息需求者 西安石油大学硕士学位论文的决策需要。本文通过对A股上市公司网络财务数据库的截取,以房地产行业为研究样本,利用数据挖掘技术中的主成分分析方法对上市公司财务状况进行综合打分,可以指导投资者在同一行业内如何选择最优投资对象。(2)降低财务分析成本,扩大财务分析范围。在新形势下,如果继续使用传统的财务分析方法,对财务数据的处理、分析成本势必增加。相比传统手工财务分析方法,数据挖掘技术可以大大降低财务分析成本。同时,智能化的数据挖掘技术满足使用者需要实现多部门信息的综合分析,扩大财务分析的范围。本文主要研究思路就是首先对上市公司的偿债能力、运营能力、获利能力和发展能力进行打分,然后确定主要成分的权重计算综合财务能力得分,整个分析过程不仅扩大了财务分析的范围,还大大降低财务分析的成本。(3)深化财务分析层次,挖掘潜在财务信息。数据挖掘技术,可以揭示数据的特征和内在的联系,使它们转化为信息需求者需要的有关公司财务管理、经营管理和各种决策中的更直接、更有用的信息。本文利用统计技术准确描述每类财务能力及其具体指标之间的依赖关系或关联关系,找出财务数据中隐藏的勾稽关系,准确表达最终的挖掘到的知识。1.2国内外研究现状1.2.1国内研究现状从财务报告及其分析的历史演进和发展趋势上看,财务报告分析主要有实用指标分析、财务失败预测和资本市场研究三大学派。实用指标分析从财务报表中开发出财务比率指标,应用科学的数学方法进行财务报表分析。财务失败预测将财务报告分析的重心从历史评价转向未来预测,认为财务报告分析的有用性在于对未来事项,尤其是财务失败的预测。资本市场研究认为财务报告分析的作用在于解释和预测证券投资的报酬和风险,主要研究财务信息与证券投资的关系。如何运用财务信息对企业价值进行评价,一直是会计学界着力研究解决的重要问题。随着相关学科和技术的发展,在传统财务分析方法思想指导下,我们需要引进新的财务分析技术进行更深层次的财务分析,特别是人工智能、计算机技术等方法。数据挖掘技术属于智能化的计算机技术,已经应用到财务分析当中。数据挖掘是指从大量的数据中发现隐藏的、内在的和有用的知识或信息的过程。当前在我国把数据挖掘技术运用在财务领域的学术研究成果不多,这主要是由于大多数公司财务人员不了解数据挖掘的方法和技术,他们更多地从自身所掌握的基本财务分析方法进行财务分析,而对数据挖掘方法有一定研究的计算机工作人员对财务知识了解不够深入,无法完成二者的完美组合。当前数据挖掘在财务领域的运用主要在财务分析和财务管理、决策上。数据挖掘运用在财务分析方面,一是来研究行业内企业的分类特征,其中李剑锋、李一军、祁威在2 第一章绪论《数据挖掘在公司财务分析中的应用》中利用数据挖掘中的模糊聚类分析方法,根据一些最新的、关键的财务指标,对十大上市钢铁公司进行了聚类分析【7】;林伟林,林有在《数据挖掘在上市公司财务状况分析中的应用》中运用数据挖掘工具Clementine对我国深沪A股上市公司进行财务状况分析,并通过因子分析,对其进行排序和行业归类【8】。门可佩、薛亮等选取了获利能力、偿债能力、运营能力、成长能力、资本结构等五大类15个指标,利用主成分分析计算出了每个指标的贡献率,然后把贡献率与对应指标的乘积相加得出了该公司的财务能力,并将其应用于2004年电力上市公司【10。。何慧婷、柳建民等选择了112家上市公司的财务报表数据,运用主成分分析方法,确定和解释了考察中国上市公司经营状况的主成分因素,构建了七大主成分的评价体系【111。毛定祥分别运用主成分分析方法对各财务指标进行综合了评价,构建了上市公司财务评价指标体系,得到复合财务系数和动态复合财务系数,客观综合地反映了企业财务状况、经营成果的现状和发展趋势,为投资者提供了客观、合理的决策依据【I2】:潘琰,程小可运用主成分分析法构建了上市公司经营业绩评价体系,并对上证30指数进行了检验,认为在上证30指数公司范畴内部,这种分析是有意义的。二是对财务预警的研究,刘晏,罗慧在《上市公司财务危机预警分析一基于数据挖掘的研究》中以我国上市公司为研究对象,运用了判别分析、Logistic回归和神经网络三种独立的方法并建立它们的混合模型进行预测[131。姚靠华,蒋艳辉在《企业动态财务预警系统研究》中探讨了嵌入数据挖掘技术的动态财务预警系统建立的技术基础和系统框架【14J;李爱玲,沈宪章,李豫州在《数据挖掘在财务预测中的应用》中探讨了决策树、神经网络方法在财务预测中的运用思路[15j;在财务管理和决策方面,刘胜平,张启銮在《基于数据挖掘技术的财务实时控制系统研究》中初步研究了基于数据挖掘技术的财务实时控制系统【l6】;杨春华在《数据挖掘OLAP在财务决策中的应用》中研究了财务决策中运用OLAP和数据挖掘的必要性和流程117】。1.2.2国外研究现状国际上数据挖掘技术已经广泛应用到各行各业,包括金融业、保险业、电信业、零售业、制造业等,而在财务领域应用主要表现在以下几个方面:多维数据挖掘决策支持系统预测破产风险,根据客户影响企业破产的多维指标,利用企业历史财务数据,建立决策树和神经网络结合的破产预警系统。其中应用数据挖掘技术中的网络神经方法进行财务预警研究较多,Coats和Fant对47家财务危机公司和47家正常公司运用神经网络模型进行判别时,对财务危机公司的预测准确率达到了91%,明显高于多元判别法72%的准确率。数据挖掘中的动态建模,利用正常情况下的现金流与总资产的比值、现金流与负债的比率、危机情况下的固定资产与股东权益比率、固定资产与长期负债的比率等指标判断企业财务风险的动态变化【191。皮彻思、米高和卡如瑟采用主成分分析的方法,研究了221家公司1951年、1957年、1963年和1969年四年的财务指标。他们将公司的48种财务指标分成了组:投资回报;资本状况;存货状况;财务杠杆;应收账款; 西安石油大学硕十学位论文短期流动性;现金状况【201。高姆包拉和凯茨认为皮彻思等的研究中忽略了现金流量指标与公司盈利指标的差异,并且现金流量指标的估计也存在着问题,不能简单地以净利润加折旧来代替,因为这样就忽略了应收应付项目对现金流量的影响。高姆包拉和凯茨用严格调整后的经营活动营运资本和经营活动现金流量及其他会计数据,设计了40个财务指标,通过主成分分析提取了8个近似代表所有指标的主成分,并且经营活动现金流量指标是其中的一个主成分【2l】。通过对以上国内外研究现状的阅读与分析不难发现,。目前,将数据挖掘技术应用于财务分析中存在以下几点研究不足:(1)财务分析指标的选取。在进行研究时,上述研究文献并没有明确指明研究过程中财务指标的选取原则或方法,而是依赖于人为或是经验等进行选取,从而造成了分析指标存在缺陷与不足。(2)财务分析指标量纲。上述文献中,很多研究没有统一选取财务指标的量纲,而是简单进行统计整理或是简单的标准化,从而造成财务信息在研究过程中逐步损失,最终影响分析结果。(3)财务分析指标的权重。无论是传统的综合财务分析还是新探索的财务分析,在进行综合财务分析时,为了表示不同财务指标对综合情况的影响程度,进而需要确定每项指标的权重。财务分析的权重直接影响最终的分析结果,所以要对权重进行科学的测定。上述文献中,很多是用管理学中的专家评分法、经验数据进行确定的,难免存在统计上的缺陷与不精确。进而影响财务分析模型的建立及最终知识的表达。1.3研究方法及创新点1.3.1研究方法正确且适合的研究方法会使研究结果更加可信,本文在总结借鉴的基础上主要采用了以下研究方法:(1)定性与定量分析相结合的方法。定性分析主要以理论事实和普遍规律为前提,从问题的本质进行演绎推理,直接揭示问题的本质,从而指导定量分析。定量分析利用定性分析确定的方法进行具体的研究。本文应用EXCEL和SPSS计算机软件,挖掘不同上市公司以及同一上市公司财务数据之间的数量关系并揭示研究对象之间的内在规律,在简化研究过程的同时,使得研究结果更具说服力。(2)采用数据挖掘技术中的主成分分析方法建立财务分析模型。数据挖掘具有一整套的流程和一系列的方法,本文通过对比分析各种方法的优劣,选择了主成分分析方法,利用EXCEL和SPSS软件将选取的上市公司财务数据进行智能化建模,在得出每类财务能力得分之后,利用相关理论确定权重,计算上市公司的财务综合得分。(3)采用对比分析的方法。本文利用主成分分析方法建模后,继续采用数据挖掘4 第一章绪论技术中的另外一种分析方法——聚类分析进行财务分析建模,通过两种模型分析结果对比验证基于主成分分析模型的有效性。1.3.2本文创新点本文在借鉴和吸收相关理论和实证研究学者的研究成果的基础上,系统的分析和研究了利用主成分分析方法对上市公司进行综合的财务分析,具有以下创新之处:(1)合理选取财务分析指标,统一研究量纲。本文通过理论分析、对比分析选取反映上市公司财务状况的偿债能力、运营能力、获利能力和发展能力四大类财务指标下的15个具体核心指标,减少数据研究范围,并统一研究量纲,免除由于公司经营规模不同造成财务指标绝对值不可比的影响,使得不同公司之间的财务指标更具可比性,最终分析模型更具适用性。(2)科学确定主成分权重,精确建立财务分析模型。鉴于上述研究文献中关于主要影响因素的权重测定不科学,本文通过科学的、精确的统计方法对分析出的主成分进行权重的测定,大大提高了分析模型的精确性。在进行主成分分析时,本文区别于上述研究文献中将公司所有财务指标或是部分财务指标同等对待进行分析,抽取出若干主要影响因素的研究方法。而是首先对偿债能力、营运能力、获利能力和发展能力每一类能力进行主成分分析,计算每类财务能力的综合得分;其次将每类财务能力的综合得分作为研究对象继续进行主成分分析,最终得出公司的财务状况综合得分,得分越高财务状况越好,更具有明确的指导意义。 西安石油大学硕士学位论文第二章财务分析基本方法及应用分析分析问题是人类社会生活中的一项经常性的、极其重要的认知活动。对于一个事物或研究样本的分析需要涉及多个因素或多个指标,分析是多重因素相互作用下的一种综合评价。分析事物或研究样本的主要依据是可靠的因素指标,包括数字的和非数字的,由于影响事物或研究样本的因素往往是繁多而复杂的,如果只对单一指标进行分析,结果往往不尽合理,因此需要将反映事物或研究样本的多项指标的信息加以汇集,分辨主要影响因素,确定综合指标,据此来从整体上反映事物或研究样本的整体状况。上市公司的财务状况分析就是这样一个复杂的工程,在上市公司的财务报表及其附注中有众多的财务指标,如何分辨这些指标、如何将这些指标中的有效信息加以整合、如何从中找出内在的评价依据及联系,是一项极其复杂的工作。2.1财务分析的重要意义财务分析是每个企业进入规范资本市场融通资金必不可少的财务管理工作,企业只有具备较好的综合财务能力,才能得到投资者的了解,信任、支持,最终从资本市场上成功融资。据统计资料显示,综合财务状况较好的上市公司的融资占银行放贷总量的60%以上。企业财务分析的准确及有效,是提高企业竞争力必不可少的手段之一。企业可以通过准确而有效的财务分析了解到竞争对手和合作伙伴的真实情况,进一步降低企业的信息搜集成本,有助于企业防范信用危机。投资人在决定是否进行投资之前,必须广泛搜集各项与投资标的相关的财务及非财务信息,以判断企业是否能够如期履约,偿还本息。2.2现行财务分析的局限性2.2.1财务分析内容存在局限性我国企业的财务分析更侧重于经济现象的微观分析、财务报表分析,缺乏从企业资本运营的角度来进行财务分析,应扩大财务分析范围,不可忽视宏观经济政策的分析;侧重于货币领域的分析,忽视了非货币领域的分析,应加入无形资产、人力资本、企业社会责任的履行的分析:侧重于单一财务信息的分析,忽视了与相关经营信息的有机结合分析,还应结合人力资源、无形资产等知识财产的分析以及关联企业的分析;侧重于资金运作的分析,忽视了企业资源分析,明确企业各种资源,包括现有的以及潜在的各种资源;侧重于经济事项的事后分析,缺少有效的前瞻性分析,加强基于历史基础的预测性分析;侧重于财务指标的静态分析,忽略了企业经营的动态性,考虑进行适时的财务分析,增强财务分析的及时性;财务指标分析缺少可比性,企业之间的横向比较缺乏,经营者难以了解相关分析指标在行业中的地位,统一分析指标的量纲,增强不同规模企业的相互可比;财务分析的适时性和快速反应能力滞后,缺少对企业风险防范和发展潜6 第二章财务分析基本方法及应用分析力的分析【22】·【23】’【241。2.2.2财务分析方法存在问题财务分析的基本方法有比率分析法、比较分析法和趋势分析法以及包括沃尔评分法、杜邦财务分析体系等在内的综合财务分析方法,无论是何种方法均是对企业过去的经济事项进行的反映。会计报表使用者取得会计报表的时间与业务发生的时间就间隔更长了,用过去的经济业务数据去判断企业目前甚至将来的财务状况,往往不切实际,偏离企业的真实财务状况。除此,现行财务分析方法通过财务报表项目及其数据之间所揭示的财务关系进行研究,其自身也存在固有局限性,表现在:比率分析法是一种事后分析方法,主要是针对已经发生的经济活动进行分析,在市场经济条件下,已表现出一定的滞后性,针对单个指标进行分析,综合程度较低,缺乏一定的相关性和预见性;趋势分析法所依据的资料,主要是财务报表的数据,具有一定的局限性,不同时期的财务报表可能不具有可比性;比较分析法是指通过经济指标的对比分析,确定指标间差异与趋势的方法。只有具有可比性的指标采用比较分析法才有价值,而由于报表数据的局限,不同企业甚至同一企业不同时期的数据均缺乏可比性,价格水平的波动使得不同时期的数据间更无可比性,比较分析法的运用必然受到影响。2.2.3财务分析指标存在局限性企业财务指标缺乏统一的一般性的标准,不同行业之间划分较粗,不具备必需的代表性,使相关财务信息使用者无所适从,只是将众多的财务指标进行堆积,而忽视财务指标的本质内涵。财务报告无法揭示全方位的会计信息资料,‘使得各方财务信息使用者较难取得诸如存货结构、资产结构、季节性生产变化等信息。进行企业财务比率分析只能对财务数据进行比较,对财务数据以外的信息,诸如宏观经济政策、企业所处行业状况、企业发展战略等未考虑,就可能造成对实际情况的片面理解,甚至是错误理解。财务报告是企业整体财务以及经营状况的一个总结,其中财务报表是用数据反映企业经营管理情况,除了财务报表,还有许多其他的信息会在财务报告中向外公布。而比率分析由于其自身的计算和比较过程只是涉及到财务数据的比较,所以如果分析人员不注意参考非数字信息来对比率进行分析,就会造成对报表理解的偏差,而误解企业财务的实际情况。2.3数据挖掘技术在经济领域中的应用鉴于传统财务分析方法以不能满足财务信息使用者的更高要求,就应该借鉴其他相关学科的相关成熟技术帮助财务分析工作人员改善财务分析方法、提升财务分析质量。目前,数据挖掘技术已经广泛应用到各行各业,包括金融业、保险业、电信业、零售业等,尤其是在客户关系管理、投资项目决策、银行风险项目评估、信用评估、消费者行为和金融市场股价等领域。7 西安石油大学硕士学位论文在消费者行为研究中,王萍在其《基于数据挖掘技术的消费者行为研究》中深入探讨了如何运用数据挖掘方法分析消费者行为。提出了基于数据挖掘技术的消费者特征分析法、基于数据挖掘技术的消费者购买模式分析法、基于数据挖掘技术的消费者购买倾向预测法,并且对所提出的方法分别用实例数据进行了验证,证明了方法的有效性和可行性,并对数据挖掘技术在消费者行为研究中的应用做了进一步的展望【251。在证券市场领域,陈佐在其《时间序列相空间重构数据挖掘方法及其在证券市场中的应用》中以相空间重构技术为基础,以时间序列作为研究对象,分析面向时间序列数据的数据挖掘方法,并将研究结果应用于实际金融市场,以发现金融时间序列中隐含的规律、模式和知识,为市场分析和投资决策提供新的思路、方法和辅助决策信息【261。在零售业领域,安建华在其《数据挖掘技术在零售业中的应用研究》中,首先对数据挖掘技术做了简要介绍,探讨了数据挖掘技术的概念以及数据挖掘常用技术、数据挖掘发现知识的分类、数据挖掘流程和数据挖掘工具等。其次对零售业领域业务特点及目前零售业TI应用现状做了分析。第三,重点讨论了零售业领域实施数据挖掘项目的具体应用,分析了数据挖掘技术在零售业领域的应用形式,实施步骤及零售业实施数据挖掘项目应该注意的问题。最后结合笔者目前实际工作介绍了一种数据挖掘模型(关联分析)在零售业领域的具体应用【271。以上只是列举了数据挖掘的一些应用,而不是包罗万象。随着各有关交叉学科的进一步发展,数据挖掘也一定能够在进一步完善自己的理论基础上得到各行各业的进一步有效应用。2.4数据挖掘技术在财务分析中的适用性分析2.4.1数据挖掘技术的应用前提在利用数据挖掘技术进行具体问题分析时,研究对象应满足以下四个条件时才予以考虑应用数据挖掘技术:对研究对象能够清楚的定义挖掘的问题、研究对象存在潜在有意义或是有经济内涵的数据、研究对象的数据中包含隐藏的经济知识及规律、处理数据的费用低于应用数据挖掘技术所获得的潜在知识而增加的经济利益。如果不能满足上述四个条件,应用数据挖掘技术分析问题将会失败或者无效。利用数据挖掘技术分析上市公司财务状况本身就清楚的定义了挖掘的任务也即对上市公司财务状况进行挖掘分析;分析的数据对象是选取的反映偿债能力、运营能力、获利能力和发展能力的各项具体财务指标数据,蕴含丰富的经济内涵;四大类财务能力之间存在密切的相关关系或称勾稽关系以及关于每类财务能力、财务指标的内在规律;应用数据挖掘技术是一种智能化的数据处理技术,其将大大节约处理费用,其所带来的收益是巨大的。基于此,本文考虑应用数据挖掘技术进行上市公司财务分析。2.4.2数据挖据在财务分析中的适用性分析8 第二章财务分析基本方法及应用分析2.4.2.1网络环境下财务分析特点随着计算机技术和信息技术的迅猛发展,特别是各种财务软件以及网络的广泛应用,企业的会计核算已经从传统意义的会计核算向网络会计发展,其职能也相应地得到加强和扩展,比如随着企业的知识资源、人力资源、文化资源和市场顾客资源等重要性的增强,企业应考虑将其纳入资产要素核算范围,从而进一步扩展企业核算及财务分析范畴。在网络环境下,随着资本市场日臻完善,企业股东结构日趋多元化,要求企业不仅要满足现有投资者信息需求,更要吸引潜在投资者注意,从而增强发展能力。财务分析不仅要面向过去,更要面向未来。由于潜在投资者的增多,财务信息使用者更加需要的是能为其提供决策依据的准确信息,要求企业在结合外部所处经济环境、宏观经济政策等情况下全面分析企业内部经营发展情况和趋势,尤其是资本的有效运营,向财务信息使用者充分披露企业发展前景,营利预测和现金流量等信息。2.4.2.2数据挖掘技术为财务分析提供新的技术支持财务数据挖掘是一种新的、更深层次的财务分析方法,是一种高效的信息处理技术,其主要特点是能对会计数据库以及相关业务数据库中的大量数据进行抽取,转换,分析及其他模型化处理,从中提取辅助经济决策的核心数据,为企业决策提供真正有价值的信息,进而满足新时期财务信息使用者的不同要求。目前数据挖掘技术在企业财务分析中已能够投入使用,具体表现为:数据挖掘技术已广泛应用于各行各业,研究领域从学术、医药、军事、科学研究领域扩展开来,已被非常有效地应用在零售、银行、电信、保险、旅行和服务行业,且其经济效益表现显著。XBRL语言为数据挖掘技术在财务分析中的应用提供有效的支持。XML技术的出现,为互联网上的电子数据交换提供了一个标准,而且XML技术从数据的角度提供了一个更好的表示数据内容以及数据所代表意义的手段。XBRL作为XML在网络财务报告语言上的应用,则为我们进行大量的财务数据分析,提供有效的技术支持。数据挖掘已成为稳定且易于理解和操作的应用技术,尤其是多种数据挖掘软件的出现更加简单化挖掘操作。数据挖掘的核心模块技术历经了数十年的发展,其中包括数理统计、人工智能、机器学习等。目前某些数据库的并行使用技术使得数据库内部的挖掘成为可能。通过在数据库内部进行挖掘,企业可以避免数据移动,利用并行处理的性能,最小化数据冗余,以及消减数据挖掘专用的整个新的冗余的数据库的创建及维护成本。2.4.2.3数据挖掘在财务分析中的适用性的具体表现数据挖掘技术作为决策支持系统的主要技术工具在不断应用和发展,将数据挖掘技术引入财务分析领域的研究也在不断进行。数据挖掘技术应用在财务分析领域的适用性表现在以下几个方面:企业财务分析有明确的内容和目标,也就准确定义了数据挖掘的9 西安石油人学硕士学位论文任务和目的;企业在财务分析领域应用数据挖掘技术的优势明显,计算机科学技术的进步使得各个企业,尤其是特大型企业的会计电算化程度逐步提高,企业的财务数据库和生产数据库比较完善,形成了一定规模的数据仓库,成为数据挖掘的基础对象;在大量的经济业务数据中,影响企业财务指标的因素众多,如果只局限于公司提供的三大财务报表及其附注是不够的,因为影响企业财务指标的因素众多,而深入挖掘其中的因素,揭示经济数据背后的真正经济业务恰恰是数据挖掘技术的优势所在12引。10 第三章数据挖掘原理及方法选择3.1数据挖掘技术数据挖掘技术是随着人工智能、数据库和机器学习的发展而兴起的,是近年来一个十分活跃的研究领域。1989年8月在美国底特律召开的第十一届国际联合人工智能学术会议(IJCAI)上首次提出了KDD(KnowledgeDiscoveryinDatabase)的概念,即数据库中的知识发现。随后在1991年、1993年和1994年举行的KDD专题讨论会上,汇集了来自各个领域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算法、知识表示、知识运用等问题。随着参与人员的不断增多,KDD国际会议发展成为年会。在1995年召开了第一届知识发现和数据挖掘的国际学术会议,首次提出了数据挖掘(DataMining)的概念。数据挖掘(DataMining)是KDD的核心,一般对这两个概念不做区分。在1998年,美国纽约举行的第4届知识发现与数据挖掘国际学术会议不仅进行了学术讨论,并且有30多家软件公司展示了他们的数据挖掘软件产品【291。目前,在市场上出现了种类繁多的挖掘工具软件:SAS公司的SASEM(EnterpriseMiner)系统,SPSS公司的SPSS社会科学统计软件包,Microsoft公司的SQLServer等,熟练应用这些数据挖掘软件就能大大提高数据挖掘的效率。3.2数据挖掘的主要方法数据挖掘是一个交叉学科领域,涉及数据库技术、统计学理论、机器学习技术、模式识别技术、可视化理论和技术等。由于所用的数据挖掘方法的不同、挖掘的对象数据类型与知识类型的不同,数据挖掘应用不同的挖掘方法。根据不同的标准,数据挖掘方法可以有多种分类,如根据挖掘的数据库类型分类、根据挖掘的知识类型分类、根据所用的技术分类、根据应用分类。目前,几种典型的数据挖掘是关联规则、分类、聚类、预测、Web挖掘、主成分分析等,下面就几个常见的数据挖掘方法做简单介绍:3.2.1关联规则挖掘关联规,ⅢfJ(associationPattern)分析是反映一个事件和其他事件之间相互依赖或关联的知识,是数据挖掘研究中的一个重要分支。关联规则挖掘主要表现在确定性关联规则的挖掘、量化关联规则的挖掘、增量式关联规则的挖掘、模糊关联规则的挖掘、广义关联规则的挖掘等。经典的关联规则分析可分为两步:第一步是迭代识别所有的频繁项集,要求频繁项集的支持率不低于用户设定的最低值;第二步是从频繁项集中构造可信度不低于用户设定的最低值的规则。识别或发现所有频繁项集是关联规则发现算法的核心,也是计算量最大的部分。在进行关联知识发现时,需要由用户输入最小置信度C和最小支持度S,一般由专家给出。关联规则一直是数据挖掘的研究热点,从超市的购货篮分析、数据仓库中的关联规则的发现到Internet上数据的关联规则的挖掘等等【30】。 西安石油大学硕士学位论文3.2.2分类挖掘数据挖掘的另一个重要应用是对大量数据的分类能力,又定义为数据分类规则。分类和预测是两种数据分析形势,可以用于提取描述重要数据类的数据模型或预测未来的趋势。分类问题也是机器学习、模式识别、专家系统、统计学和神经生物学的研究领域,并已开发出许多相应的算法,如决策树方法、统计学方法、贝叶斯网络、神经网络等。决策树算法是一种常用的数据挖掘算法,它是从机器学习领域中逐渐发展起来的一种分类函数逼近方法。决策树学习的基本算法是贪心算法,采用自顶向下的递归方式构造决策树。目前,利用决策树进行数据分类的方法已经被深入的研究,并且形成了许多决策树算法,例如ID3算法、C4.5算法、CART算法、SLIQ算法、SPRINT算法。贝叶斯网络是基于统计学的分类方法,可以预测类成员关系的可能性,即给定样本属于一个特定类的概率。数据挖掘领域主要使用两种贝叶斯方法,即朴素贝叶斯方法和贝叶斯网络方法。神经网络(neuralnetwork,NN)就是基于对人脑思维的探索和模仿而发展起来的,是在计算机上运行的实现模式识别和机器学习算法的计算机程序,通过对大量历史数据库的计算来建立预测模型,并在硬件中实现。自上世纪90年代起,神经网络一直保持持续的发展【31】。3.2.3序列模式序列模式(SequencePaRem)分析和关联分析相似,其目的也是为了挖掘数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后序列关系。它能发现数据库中形如“在某一段时间内,顾客购买商品A,接着购买商品B,而后购买商品C,即序列A.B.C出现的频度较高”之类的知识,序列模式分析描述的问题是:在给定交易序列数据库中,每个序列是按照交易时间排列的一组交易集,挖掘序列函数作用在这个交易序列数据库上,返回该数据库中出现的高频序列。在进行序列模式分析时,同样需要由用户输入最小置信度C和最小支持度S。3.2.4聚类分析聚类分析也称无监督学习或无教师学习、无指导学习,和分类学习相比,聚类的样本没有标记,需要由聚类学习算法来自动确定。聚类(clustering)是对物理的或抽象的样本集合分组的过程。聚类分析有多种目标,但都涉及把一个样本集合分组或分割为子集或簇(cluster)。聚类分析使得每个簇内部的样本之间的相关性比与其他簇中样本之间的相关性更紧密,即簇内部的任意两个样本之间具有较高的相似度,而属于不同簇的两个样本之间具有较高的相异度【321。3.2.5Internet和Web挖掘12 第三章数据挖掘原理及方法选择在数据挖掘领域,近来,另一个引人注目的焦点是Intemet和WWW上的数据挖掘。Internet上存储了大量的数据,用户可以随意链接到Intemet的任意站点上检索自己所需要的信息。全球有上亿个站点,其用户具有不同的背景、兴趣和目的,支持用户有效地发现和利用全球信息网络上的资源对信息系统的研究者提出了新的挑战。大量存储的非结构化数据,网络搜索的性能、效率及最优的信息获取成为难题。对此,进行数据挖掘是快速获取有用信息的有效方法。Web挖掘主要有Web内容挖掘、结构挖掘、用法挖掘【331。3.2.6主成分分析在实际问题中,不同变量之间是有一定相关性。由于变量较多及变量间有一定的相关性,势必增加分析问题的复杂性。因此,需要一种进行简化的方法,可以在不损失或很少损失原有信息的前提下,将原来个数较多而且彼此相关的变量转换为新的个数较少而彼此独立或不相关的综合变量,主成分分析就是这样的一种方法。主成分分析就是指设法将原来变量重新组合成一组新的互相无关的几个综合变量来代替原来的变量,同时根据实际需要从中可取几个较少的综合变量尽可能多地反映原来变量的信息。主成分分析的基本思想是将原来众多具有一定相关性的变量重新组合成新的少数几个相互无关的综合变量,来替代原来变量,这些新的综合变量称之为主成分【341。3.3数据挖掘的主要步骤数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、事先不知道的、但又是潜在有用的信息和知识的过程。挖掘出的信息和知识反映出数据对象之间的某种特定关系,包括大部分有用的信息,为经营决策、市场策划、金融预测等活动提供依据。简单的说,数据挖掘过程就是要从数据集中整理出或者说挖掘出有效的、新颖的、潜在有用的,以及最终可理解模式的高级处理的过程。数据挖掘的过程,大致可以分为以下几个步骤:3.3.1确定挖掘对象进行数据挖掘,要清晰地定义出挖掘对象,认清挖掘的目的是数据挖掘的重要步骤。挖掘的最终结构是不可预测的,但要探索的问题应该是可预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。本文数据挖掘的对象就是分析上市公司的综合财务状况。3.3.2数据准备如果没有数据的预处理阶段,单纯进行数据挖掘将成为一个盲目搜索的过程,可能会得出毫无意义,甚至是错误的结果。数据准备的过程主要进行如下工作:数据的选择,搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的 西安石油大学硕士学位论文数据,本文主要是选择反映上市公司财务状况的若干财务指标;数据的预处理,研究数据的质量,主要包括对数据缺失值、超出正常范围的数据的处理,为进一步的分析做准备,本文在这个阶段做了大量工作,利用EXCEL对选取的财务指标进行预处理,并确定将要进行的挖掘操作的类型;数据的转换,将数据转换成一个分析模型。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。3.3.3挖掘知识和信息作为数据挖掘技术的核心,知识与信息的挖掘主要有下面几部分构成:确定挖掘的任务类型,确定系统要实现的功能及任务,本文的主要任务是提取影响财务状况的主要因子,确定权重,计算上市公司财务状况综合得分;选择合适的挖掘技术,在确定挖掘任务的基础上,选择适当的数据挖掘技术,本文通过对各种数据挖掘技术的优劣分析,针对财务数据指标的特点,选择使用统计分析技术中的主成分分析方法进行数据挖掘;用选定的算法或算法组合,利用SPSS软件进行反复迭代的搜索、降维,提取出主要影响因素,建立模型。3.3.4模式的解释和评价数据挖掘发现的模式进行解释和评价,过滤出有用的知识,具体包括消除无关的、多余的模式,过滤出要呈现给用户的信息;利用可视化技术将有意义的模式以图形或逻辑可视化的形式表示,转化为用户可理解的语言,本文最终将分析结果用得分的形式表现,得分高的财务状况就好,易于理解和评价p5。。3.4本文数据挖掘方法的选择数据挖掘所处理的数据类型是多种多样的,如文本数据,关系数据库,Web页面等等,不同类型的数据采用不同的储存方法,所得到的数据集也不相同,进而采用的数据挖掘技术也不同,下表3.1根据数据集的情况分析常用数据挖掘技术方法的选择【36】。表3-1数据集情况及挖掘方法性能矩阵类别方法分类估值预测相关性分析聚集描述统计技术能关联规则能MBR能GA能聚类能连接分析能决策树能神经网络能注:“能”表示可以获得该种挖掘结果,空格不能得到挖掘结果。14 第三章数据挖掘原理及方法选择通过矩阵对比分析,可以发现每类数据挖掘方法都能满足一定的挖掘结果的需求,其中统计类数据挖掘技术又是性能最好的一类技术。基于因子分析的主成分分析方法又是统计类数据挖掘技术中最有效的一种方法,是把多个错综复杂的变量归结为少数相互几个无关的综合因子的一种多变量统计技术。基于因子分析的数据挖掘技术是一种客观的赋权方法,比层次分析法更简便。主成分分析方法相对于人工神经网络模型来说,所需要的数据的可获得性和可度量性都比较高,模型也较成熟,应用相对广泛。除此之外,主成分分析方法在对综合财务状况得分的同时也对单项财务能力指标做出评价并确定其在综合得分中所占的权重。基于以上对各种数据挖掘技术优劣及适用对象的分析和分析问题的实质,本文选取了数据挖掘技术中易于理解和操作,功能强大的主成分分析方法。3.5主成分分析的数据挖掘方法主成分分析(principlecomponentanalysis),也称主分量分析。该概念首先由KarlParson在1901年提出,不过当时只是对非随机向量来讨论的。直到1933年Hotelling将这个概念推广到随机向量,后经Rao(1964)、Cooley&Lohes(1971)、Gnanadesikan(1977)、Kshirsagar(1972)、Morrison(1976)和Mardia、kent&BilIy(1979)发展和成熟起来【37】。主成分分析是一种基于统计分析方法的数据挖掘技术,是将原有多维数据影响因素重新组合成一组新的互相无关的低维综合数据影响因素,同时根据分析问题的实际情况从中抽取出几个较少综合因素尽可能多地反映原来多维数据的综合信息。进一步解释是主成分分析是构造原随机变量的一系列线性组合,使得各线性组合彼此不相关,且尽可能地反映原变量信息,也即方差最大。或者说,主成分可以依次指向观测变量最大分散性的方向,从而使得原始变量的分布信息损失最小。3.5.1主成分分析数学模型设ZI)z:,⋯,z。为实际问题所涉及的g个随机变量,含有P个独立的公共因子X。,X:,⋯X,(m≥p),每个变量z,含有特殊因子U』(f=l,⋯朋),特殊因子间互不相关,且与公共因子不相关,每个z,可以由P个公共因子和自身对应的特殊因子U,(江l,⋯m)线性组合,如下:Zl=IiIXl+屯x24-⋯+,IPXP+C1UlZ22121XI+,22Ⅳ2+⋯+,2|口X,+c2U2zM=lmLXt+lm2xl+⋯+l。xp+c捌m 西安石油大学硕士学位论文即:简记为:ZlZ2●●●ZM=(Iv),。pXlX2z=LX+cU+c。U。(3.1)(3.2)3.5.2主成分分析的求解原理将式Z=IX+CU乘以转置矩阵方程Z’=X。£+U~C,再取数学期望可得:E(zz’)=F。(LXX‘£4-LXU’C+CUX’15+CUU’C。)(3.3)又由于E(zz’)=R,为Z的相关矩阵,得到:R=“+,2,令R。=R—Z2,称R‘为约相关矩阵,有R+=三Z:足’:,121一,;(3-4)当进行主成分分析求解时,用相关矩阵R取代约相关矩阵尺‘,即令有变量的公因子方差为l,此时:尺’=R=(3-5)因为任意一个实对称矩阵可用它的标准正交特征向量组成的矩阵Q进行变换。R是一个实对称矩阵,因此可以分解为:R=Q^Q‘,其中Q是它的标准正交特征向量组成的矩阵,^是对应的特征根。进一步推导可得:R=QAg_.。=(Q仄)(Q√天)’,同时结合R=LL',可得因子载荷矩阵的解:A=Q√天。这样求解因子载荷矩阵,可通过资料矩阵的相关阵R计算特征值力和特征向量进行。3.5.3主成分分析的功能2肿mm一,■吃一一 第三章数据挖掘原理及方法选择3.5.3.1判断是否符适合应用主成分分析不是所有的多变量数据都适合采用主成分分析的方法。计算变量之间的相关系数,若大部分变量之间的相关性很小,表明他们之间存在公共因子的可能性很小。只有变量之间彼此相关且绝对值较大并显著时,才可进行主成分分析。(1)巴特利特球体检验(Bartletttestofsphericity)。目的在于确定所要求的数据是否取自多元正态分布的总体。其虚无假设是“相关矩阵是一个单位矩阵”。也即“相关矩阵对角线上所有元素为l,所有非对角线上元素值为零”。若差异检验的F值显著,表示该相关矩阵不是单位矩阵,所取数据来自正态分布总体,可以做进一步分析。(2)KMO检验。KMO检验(Kaiser-Meyer-OlkinMeasureofSamplingAdequacy)从比较观测变量之间的简单相关系数和偏相关系数的相对大小出发,其值的变化从¨l。当所有变量之间的偏相关系数的平方和,远远小于简单相关系数平方和时,KMO值接近于l。KMO值的数字意义包括:0.90表示极好;0.80表示可奖励的:0.70表示还好;0.60表示中等;0.5以下表示不可以接受。综上,只有当KMO大于0.50时,才适合进行主成分分析。3.5.3.2确定主成分数目保留的方法主成分分析简单可以概括为在尽可能保存原有资料信息的前提下,用较少的维度,或是较少的新变量去表示原来的数据结构,从而便于发现规律和本质。进行主成分分析保留主成分的方法如下:(1)一般取累计方差贡献率达850/o--'95%的主成分。(2)选用所有特征根元≥1的主成分。(3)累积特征值乘积大于l的主成分。一旦确定主成分,就要利用主成分得分系数矩阵计算主成分的得分。3.5.3.3确定权重计算综合得分方差贡献率的分析结果对财务能力指标分析有两个作用,一个作用是减少财务指标数量,略去相对不重要的财务指标,从而达到简化数据结构的目的;另一个作用是进行综合指标计算时,用来计算主成分的权重,即以方差贡献率作为对应主成分的权重:w=丢(3-6)∑五换句话说,权重就是用每个主成分的方差百分比在最终选取的主成分方差累计贡献率的累计数中所占的比重。如果研究的样本包含刀个样本,则可根据以上的确定的主成分和权重给各个样本进行综合打分,若Yi(f’为样本,在第,个主成分上的得分,则该样本的17 西安石油大学硕士学位论文综合得分值用下式计算【38】:Fo’=Wly:”+W2J,50+⋯+W。y2’18(3·7) 第四章上市公司财务分析指标体系构建4.1上市公司财务分析模型样本的选取公司财务分析是一项复杂的工作,尤其是上市公司,财务分析结果将直接影响投资者的投资行为。目前针对上市公司财务状况的分析模型及方法有很多,但有关行业财务分析模型很少有涉及,主要有以下几个原因:各行业之间的壁垒性不同造成投资者的潜在分类;不同行业的财务比率差别巨大,具有明显的行业特征,如零售业与制造业、石油开发炼化业在许多财务指标上就有很大的差别,如果运用通用模型进行分析势必影响分析结果的准确性。从目前国内实际情况来看,大部分行业上市公司数量有限,获取建模数据有一定的困难,而房地产业上市公司数量较多,具有建立行业财务分析模型的可行性,且所建立的模型有较广的适用范围。因此,本文以沪深A股房地产业上市公司为研究对象,从实证角度进行研究,拟建立一套科学的,具有较高实用价值的同一行业上市公司的财务分析模型,指导投资者做出投资决策。截止目前,我国上市房地产公司共计70家,其中五家上市公司已经被ST,本文以四大财务能力中的基本的财务数据指标为基础,利用数据挖掘技术中的主成分分析进行新的财务分析方法探析,为投资者提供可以借鉴的决策信息。选取的样本公司如下表4.1。表4.1选取的上市公司代码及名称股票代码股票名称股票代码股票名称股票代码股票名称00003l中粮地产600748上实发展600463空港股份600663陆家嘴600266北京城建000736ST重实000002万科A600052浙江广厦000502绿景地产600038保利地产0007“天伦置业600240华业地产600325华发股份600638新黄浦000090深天健000718苏宁环球600053中江地产600648外高桥600246万通地产000608阳光股份000042深长城600393东华实业600576万好万家000573粤宏远A002133广宇集团000616亿城股份600736苏州高新600383金地集团000150宜华地产600603ST兴业002244滨江集团600665天地源600684珠江实业60079l京能置业600895张江高科600634海鸟发展000514渝开发600007中国国贸000014沙河股份000046泛海建设000838国兴地产600615丰华股份19 西安石油大学硕士学位论文600675中华企业002077大港股份000029深深房A600840新湖创业000558莱茵置业600732上海新梅000667名流置业600639浦东金桥000007ST达声000024招商地产000402金融街600767运盛实业60064l万业企业601588北辰实业000505珠江控股600376首开股份600322天房发展000628*ST高新002146荣盛发展0005ll银基发展600890ST中房600533栖霞建.缦000546光华控股600503华丽家族000006深振业A600159大龙地产002208合肥城建600823世茂股份4.2上市公司财务分析模型样本4.2.1数据来源本文选用2007年上市公司年报公布的数据,主要包括财务摘要(报告期)、利润表及利润分配表、现金流量表及补充资料、资产负债表。所有数据均来自由国内最大证券交易方案供应商核心软件精心打造的专业,最受欢迎的股票证券行情资讯平台——同花顺股票证券交易分析软件。该软件运用于全国95家证券公司,覆盖2400多家营业部,占有率89%以上,因此,数据可信度较高。4.2.2数据清洗数据清洗就是把选取的研究对象的大量的以各种格式储存的数据中存在的错误、缺失以及特殊值进行修复,消除噪声以及被污染的数据。数据清洗是整个挖掘过程的重要阶段,是建立数据挖掘模型必要的准备工作。数据在积累的过程中不可避免地出现各种噪声、污染。如果忽视对数据的清洗,这些问题就会潜在地影响模型的执行效率和精确度。数据清洗包括除去数据空值、除去无关属性、除去局外数据等数据预处理步骤。具体包括下面的内容:对处在正常属性分布外围的记录,计算局外限定值并标记那些落在外围的记录行,然后决定删除该行;删除缺失属性的样本数据或是用均值替代缺失值和非正常值。本文选取的上市公司财务数据有速动比率、存货周转率、应收账款周转率、净资产收益率、三项费用增长率等都带有缺失值,考虑到缺失指标对整体聚类的影响,各以此列的均值代替,这样保证了该指标对其他公司的聚类效果,用均值代替缺失数据也避免了该值对整列聚类效果的过大扰动。其中速冻比率均值为0.7505、存货周转率均值为1.1513、应收账款周转率均值为1838.9889、净资产收益率均值为5.1926、三项费用增长率均值为41.4674,将各个均值代替各自对应的缺失值。4.2.3数据标准化 第四章上市公司财务分析指标体系构建通过对选取的数据进行简单的统计可知每个指标的数据相差较多,同时这些数据都是在某个时间点上固定的指标数据,只反映了一个时期某家上市房地产公司的基本财务数值,并没有更深刻的意义,如果用这样的原始数据进行分析,不能得到满意结果。为此,必须对选取的财务数值进行标准化处理,比较常见的标准化方法有小数缩放、最小最大、标准差方法。这些方法会使本来分散的数据人为的集中在某个很小的范围之内。本文利用最小——最大规范化方法对数据进行标准化处理,设min,和max,分别为属性三的最小和最大值,则利用公式£:生二竺!璺i(4一1)max£一rainL对原样本进行标准化处理,将选取的财务数值按比例缩放,使之落入一个小的特定区间(m—1)。4.3上市公司财务指标选取上市公司年报中的财务数据是多方面的,但是反映上市公司偿债能力、营运能力、获利能力和发展能力的指标如下:流动比率、速动比率、现金流动负债比、股东权益比、流动负债率、负债权益比、利息保障倍数、债务偿还期、或有负债比率、已获利息倍数、带息负债比率、存货周转率、应收账款周转率、总资产周转率、主营业务收入增长率、营业利润增长率、税后利润增长率、净资产增长率、净资产收益率、销售毛利率、三项费用增长率、成本费用利润率、每股收益、每股收益增长率、每股可分配利润、每股未分配利润、每股净资产、每股现金含量、每股资本公积金、每股盈余公积金、每股负债比、营业费用比例、管理费用比例、财务费用比例、经营净利率、经营毛利率、资产利润率、资产净利率、净利润率、净资产同比增长率、主营业务收入同比增长率、净利润同比增长率、每股净资产同比增长率、税前利润增长率、净资产收益率增长率、总资产增长率、股东权益增长率、主营利润增长率等将近50项具体财务指标【39】’【40】'【411。如果将所有的具体财务指标数据都选择的话,势必造成挖掘数据的冗余。鉴于此,本文采用以下几个原则进行目标数据的选取:(1)全面性原则。本文为了更全面的反映企业的财务状况,在进行财务指标体系初选时,力争建立能够综合反映企业的偿债能力、营运能力、获利能力、发展能力指标体系。对企业各方面能力进行全面的分析,以尽量全面揭示和判断企业财务状况和综合发展水平。(2)重要性原则。本文并没有选择反映四大类财务能力的所有财务指标,因为并不是指标越多越好。分析指标选择过多,则冗余的信息过多,不仅使计算过程变得复杂、分析模型表达变得复杂,最主要的是影响了财务分析的效果,降低了财务分析模型的实用性。有些财务指标是通过一个或几个基础财务指标经过演算而得出,那么就没有必要2l 西安石油大学硕士学位论文再选择演算出的财务指标,只选择基础财务指标。在此基础上,本文还重点参考了在历史文献中被普遍使用且已经证明其重要性的指标。(3)可比性原则。具有可比性的财务指标构造的财务分析模型才有价值,得出的结论才具有统计意义。本文财务指标体系的构建没有引入诸如每股收益、每股净资产等绝对值性质的指标,因为这类指标不具可比性,受上市公司经营规模、在外发行总股数等因素的影响,研究过程中只选择了财务比率指标。C4)易获得性原则。本文建立财务分析模型的主要目的是为了给予信息使用者一个简单判别上市公司目前财务状况的方法,所以原始的财务指标数据必须容易获得。本文选择的15个具体财务指标可以在同花顺软件中轻松获得。根据以上四个选取指标的原则,本文最终选取了每类财务能力下的少量具体财务指标。对选取的数据进行清洗、标准化,人为的将本来分散的数据集中在特定的很小的范围之内,但同时也导致了标准化值的无意识集中,为了克服这一问题,本文采用实用指标学派开创的具体财务指标,并对其进行标准化处理,从而使得数据更加有意义。4.3.1上市公司偿债能力指标体系选取偿债能力是指企业偿还到期债务的能力。企业偿还债务能力的强弱是判断企业财务状况好坏的主要指标之一。偿债能力的强弱取决于企业资产流动性和企业负债的规模以及负债的流动性,除此还必须分析企业负债与所有者权益的比率以及各项负债占负债总额的比例关系等。通过财务摘要(报告期)、利润表及利润分配表、现金流量表及补充资料、资产负债表等原始数据,计算偿债能力相关财务指标:(1)流动比率=流动资产/流动负债(2)速动比率=(流动资产一存货)/流动负债(3)资产负债率=负债总额/资产总额(4)股东权益比率=股东权益总额/资产总额4.3.2上市公司营运能力指标体系选取上市公司的营运能力主要是对企业资产周转速度进行的分析。一般情况下,资金周转越快,说明利用效率越高,企业经营管理水平越高。分析的对象主要是流动资产、固定资产和总资产周转状况的分析。资产使用效果分析指对企业使用资产的结果进行分析,主要包括流动资产、固定工资产以及全部资产使用效益进行综合分析。反映企业营运能力的指标主要有:(1)存货周转率=主营业务成本/存货平均余额(2)应收账款周转率=主营业务收入/应收账款平均余额(3)总资产周转率=主营业务收入/平均资产总额4.3.3上市公司获利能力指标体系选取 第四章上市公司财务分析指标体系构建获利能力分析主要是通过对企业状况的全面分析,将各种收益与其对应的资金相比较,解释企业综合和具体的盈利能力。上市公司与非上市公司分析的侧重点各不相同,非上市公司主要以营业收入为基础分析评价盈利能力和以投资报酬为基础分析评价盈利能力两大部分。上市公司不仅在财务分析的角度、深度、广度和形式上,还表现在分析的内容和指标上,都与非上市公司不同。上市公司分析指标除非上市公司要分析的指标外,还必须进行每股收益、市盈率和股利支付率的计算分析等。每股收益是评价上市公司盈利能力的基本指标之一,但是其为绝对指标,本文不做选择,而是选择净资产收益率。反映上市公司盈利能力的指标主要有:(1)净资产收益率=净利润/平均所有者权益(2)销售毛利率=(销售收入.营业成本)/销售收入(3)三项费用增长率=经营、管理和财务费用增长额/基期总额(4)成本费用利润率=利润总额/成本费用总额4.3.4上市公司发展能力指标体系选取成长能力是指未来一定时期企业发展的能力。发展能力分析通过对企业各项财务指标与往年相比所进行的纵向观察,判断企业在未来一定时期的动态发展变化趋势。发展能力分析对于判断企业未来一定时期的发展潜力,行业地位,面临的发展机遇与盈利发展变化以及指定中长期发展计划、决策等具有重要意义和作用。发展能力分析主要通过各年历史资料进行环比分析得出企业资产增长能力比率、营业增长情况分析、盈利能力增长情况分析和可持续增长能力分析。相关指标如下计算:(1)净资产增长率=本年净资产增长额/上年净资产(2)主营业务收入增长率=本年主营业务收入增长额/上年主营业务收入(3)净利润增长率=本年净利润增长额/上年利润(4)每股净资产增长率=本年每股净资产增长额/上年每股净资产4.4上市公司综合财务分析指标体系构建本文选取了上述反映70家上市房地产公司的偿债能力、营运能力、获利能力和发展能力四大类指标,每一类指标下又选取了相应的能综合反映该类财务能力的15个具体财务指标,总结如下表4.2: 西安石油大学硕士学位论文表4.2上市房地产公司财务分析指标体系上市偿债能力流动比率、速动比率房地指标体系资产负债率、股东权益比率产公营运能力存货周转率、应收账款周转率司财指标体系总资产周转率、务分析指获利能力净资产收益率、销售毛利率、’标体指标体系三项费用增长率、成本费用利润率系发展能力净资产增长率、主营业务收入增长率指标体系净利润增长率、每股净资产增长率24 第五章基于主成分分析的上市房地产公司财务分析模型的构建5.1财务分析模型实验本文主要应用EXCEL和SPSS两个软件,利用其强大的统计功能和数据分析能力,主要使用主成分分析的方法分别对上市公司四大类能力进行分析,得出每一类财务能力的综合得分,最后在缩减变量的基础上求算最终四大类财务能力综合得分。实验模型工作统计如下:表5一l实验工作统计实验实验年度:2007年度数据:实验类别:偿债能力运营能力获利能力发展能力财务指标数量:434模型群体规模:70最大迭代数:25参数:综合评价权重:PW,=丑/∑丑,_l5.2上市房地产公司偿债能力主成分分析本文选取的70家上市公司的四大类财务能力的15个财务指标数据都具有相同量纲,也即都是百分数的形势,所以可以不先进行标准化处理,只是将缺失的数据以该财务指标的平均值来表示就完成了数据的准备和清洗。将反映上市房地产公司的四类财务能力所属财务指标数值,按照SPSS要求的格式录入到软件中,进行主成分分析。SPSS中没有专门的主成分分析工具,本文主要利用基于因子分析的主成分分析方法,分析结果及相,关图标如下:5.2.1KMO检验和Bartlett检验表5.2KMOandBartlett。STestKaiser-Meyer-OlkinMeasureofSampling.518Adequacy.Bartlett’sTestofApprox.Chi-Square540.50ISphericityDf6Sig..000本文中的Bartlett检验的F值等于0.000,表明70家上市房地产公司经营状况个财务指标数据来自正态分布总体,不存在人为特殊考虑的因素。KMO分析观测变量之间简单相关系数和偏相关系数的相对大小,得出KMO=0.518,适合进行因子分析,效果较好。 西安石油大学硕士学位论文5.2.2主成分的确定表5.3为全部解释方差表,表中的InitialEigenvalues(初始特征根)栏,给出了按顺序排列的主成分得分的方差(Total),在数值上等于相关系数矩阵的各个特征根允,因此可以直接根据特征根计算每一个主成分的方差百分比(%ofVariance)。由于全部特征根的总和等于变量的数目,也即m=罗丑=8,因此第一个特征根的方差百分比为元/m=2.247/4=56.167%,第二个特征根的百分比为36.789%,⋯⋯,其余类推。然后根据第一个主成分的方差百分比,可以计算出方差累计值(Cumulative%)。根据累计贡献率取85%一95%的主成分和选用所有特征根元≥l两条原则,提取主成分l和主成分2。并得出主成分方差贡献率矩阵,如表5.4。表5.3TotalVarianceExplainedComp-onetitInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%TotaI%ofVarianceCumulative%l2.24756.1672.24756.16721.47236.78992.9561.47236.78992.9563.28l7.03699.992.28l7.03699.9924.000.008100.000.000.008100.000ExtractionMethod:PrincipalComponentAnalysis.表54主成分方差贡献率主成分方差贡献率特征根方差贡献率方差贡献率累计主成分12.24756.167主成分21.47236.78992.9565.2.3成分载荷Componentl234股东权益比率.884..466..033.013资产负债率..882.469.035.013速动比率.515..466..3651.396E.05流动比率.650.657.382.6.440E.05 第五章基于主成分分析的上市房地产公司财务分析模犁的构建表5.5的成分载荷矩阵给出了主成分载荷系数,每一列载荷值都是各个变量与有关主成分的相关系数。以第一列为例,0.884实际上是股东权益比率与第一个主成分的相关系数,将标准化的股东权益比率与第一主成分得分进行回归,容易算出R=0.884,这正是股东权益比率在第一个主成分上的载荷。从主成分载荷矩阵可以看出,股东权益比率在第一主成分上的载荷较大,也即与第一主成分的相关系数较高;流动比率在第二主成分上的载荷较大,也即与第二主成分相关程度高。5.2.4成分得分系数表5.6ComponentScoreCoefficientMatrixComponentl234速动比率.229.527.1.296.042流动比率.289.4471.358..195股东权益比率.393..317..11838.923资产负债率..393.319.12638.878表5-6是主成分得分系数矩阵,根据该矩阵以及变量的观测值可以计算每个主成分的得分:Yl=0.229xl+0.289x2+0.393x3—0.393x4Y2=0.527xI+0.447x2一O.317x3+O.319x4式中薯,x:,屯,_为速动比率、流动比率、股东权益比率和资产负债率标准化得分值,有上式计算出主成分Y。、y:的各主成分得分后,由计算综合得分的公式:鼻=wlYl+w2Y2其中Ⅵ,w2计算公式为:Wi=五/∑以,根据表5-4中的数据,计算得:,=1wI:—56.—167:0.642.w2:—36.7—89:0.35892.956最终得出计算上市公司偿债能力综合得分的计算公式为:F1=O.642yI+0.358y25.2.5上市房地产公司偿债能力相关得分 西安石油大学硕士学位论文计算主成分得分及其综合得分,本文利用EXCEL进行,首先将最初数据进行标准化处理,根据公式£:—生!竺1L,利用MaxMin函数求出每列的最大与最小值,maxL‘。mlnL然后利用计算公式“=(C2:C71一$C$73)/($C$72.$C$73)”,进行数组公式计算,得出速动比率的标准化值,以此类推!计算主成分得分时,按照计算公式yl=0.229幸C2:C71+0.289木D2:D71+0.393乖E2:E71—0.393F2:F71和Y,=O.527"C2:C71+0.447*D2:D71.0.317*E2:E71+0.319*F2:F71进行数组公式计算,从而得出主成分1和2的得分,同理按照F=0.642*G2:G71+0.358*H2:H7l计算出综合得分。最后以主成分l的得分降序排列,计算结果如下表5.7:表5.7偿债能力分析评价分值表股票代码股票名称主成分I主成分2综合得分600240华业地产0.8950.6700.814600634海鸟发展0.7090.3080.565600767运盛实业0.6280.0600.425600159大龙地产0.584O.1390.42560064lZi"、II,,f净、II,0.5760.0450.386600684珠江实业0.5760.0570.390600638新黄浦O.55l0.0300.3640007ll天伦置业0.5370.0220.353600890ST中房0.529.0.0260.330000573粤宏远A0.528.0.04l0.32400003l中粮地产0.509.0.04l0.312600663陆家嘴0.500.0.0690.296000514渝开发0.496.0.0980.283000667名流置业0.495.0.0870.28760079l京能置业0.493.0.05l0.298000616亿城股份0.488.0.0550.2940005ll银基发展0.483.0.1180.268600322天房发展0.480.0.0850.278000150宜华地产0.479.0.0990.272000014沙河股份0.475.0.0740.278000006深振业A0.468.0.08l0.27l28 第五章基于主成分分析的上市房地产公司财务分析模型的构建002133广宇集团0.466—0.0700.274000029深深房A0.459.0.1280.249600383金地集团0.456.O.1050.255600038保利地产0.453.0.0980.256600246万通地产0.453.0.0960.256600503华丽家族0.453.0.1480.238000046泛海建设0.452.0.1580.234600675中华企业0.449.0.1070.250000502绿景地产0.447.0.1060.249000002万科A0.444.O.1170.243000838国兴地产0.444.0.1230.24l600533栖霞建没0.443.O.1170.243600748上实发展0.443.O.1200.24l002146荣盛发展0.442.O.1390.234601588北辰实业0.442.0.1470.23l600823世茂股份0.441.O.1450.23l600053中江地产0.438.0.1290.235002077大港股份0.437.O.1460.228002208合肥城建0.434.O.1250.234000608阳光股份0.432.0.1360.229600732上海新梅0.432.0.16l0.220000402金融街0.430.0.1480.223000090深天健0.430.O.1690.216000024招商地产0.429.O.1520.22l000042深长城0.427.0.1530.219600615丰华股份0.427.0.1570.218600665天地源0.426.0.1470.22l000546光华控股0.426.O.1640.215600325华发股份0.423.O.1330.224600463空港股份0.422.O.1670.2ll600266北京城建0.418.0.1670.209600393东华实业0.417.O.148O.215600576万好万家0.417.0.1870.20l 西安石油大学硕士学位论文600648外高桥0.417.0.1520.213600007中国国贸0.411.0.2170.186600736苏州高新0.410.0.1660.204000718苏宁环球0.409.O.1570.206002244滨江集团0.407.0.1480.208600840新湖创业0.401.0.1820.192600376首开股份0.400.0.16lO.199600895张江高科0.394.0.2080.178000558莱茵置业0.392.0.185O.185600639浦东金桥0.391.0.2630.157000505珠江控股0.386.O.1930.179600052浙江广厦0.383.0.184O.180000628*ST高新0.377.0.1750.179000007ST达声0.353.0.199O.155000736ST重实0.311.0.1520.145600603ST兴业.O.35l0.401.0.0825.3上市房地产公司运营能力主成分分析将反映上市房地产公司运营能力的八项财务指标的数据输入SPSS,进行主成分分析,得出如下图表:5.3.1KMO检验和Bartlett检验表5—8KMOandBartlea’STestKaiser··Meyer··OlkinMeasureofSamplingAdequacy..63lBartlett。sTestofApprox.Chi—Square293.78lSphericitydfjSig..006本文中的Baalett检验的F值等于0.000,表明70家上市房地产公司经营状况数据来自正态分布总体。KMO分析观测变量之间简单相关系数和偏相关系数的相对大小,得出KMO=0.631,适合进行因子分析,效果较好。5.3.2主成分的确定 第五章基于主成分分析的上市房地产公司财务分析模型的构建ComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%l1.15938.6181.15938.6182.98l32.69471.313.98l32.69471.313j.86l28.687100.000.86l28.687100.000ExtractionMethod:PrincipalComponentAnalysis.按照确定主成分数目的保留方法——选用所有特征根五≥1或近似于l的主成分,可以确定主成分l和主成分2为最终保留的主成分。并根据表5.9计算主成分方差贡献率,如下表5.10:表5一lO主成分方差贡献率主成分特征值主成分l1.15938.618主成分2O.98132.69471.3135.3.3成分载荷由表5.1l可知,主成分l在总资产周转率上的载荷比较高,主成分2在应收账款周转率和存货周转率上的载荷较高。Componentl2.)总资产周转率.736一.003.677应收账款周转率.551.707一.443存货周转率..559.693.4545.3.4成分得分系数表5.12为最终的成分得分系数矩阵,根据表中数据可以计算主成分得分:主成分l得分:Componentl23存货周转率..483.707.528应收账款周转率.476.721..515总资产周转率.635一.003.786Yl=一0.483xl+0.476x2+0.635x3 西安石油大学硕士学位论文主成分2得分:Y2=0.707xl+0.721x2—0.003x3其中x。、x:、x,分别是存货周转率、应收账款周转率、总资产周转率标准化后的数值。根据表5.1l主成分方差贡献率,利用前文的公式计算综合得分的权重:w.:—38.6—18:0.542,w2:—32.6—94-0.458‘71.313则综合得分计算公式为:F2=O.542y1+0.458y25.3.5上市房地产公司运营能力相关得分利用EXCEL首先对八个财务指标数据进行标准化处理,然后利用数组公式计算主成分得分以及综合得分,计算结果如下表:表5.13营运能力分析评价分值表股票代码股票名称主成分l主成分2综合得分00003l中粮地产0.1180.0030.779600663陆家嘴0.107O.0170.347000002万科A0.32l0.0050.3lO600038保利地产O.1890.0020.253600325华发股份0.2330.06l0.24l000718苏宁环球0.2920.0060.237600246万通地产0.2300.0040.222600393东华实业0.3680.0070.220002133广宇集团0.2580.0050.208600383金地集团0.289O.0180.206002244滨江集团0.2720.0050.20560079l京能置业0.5600.0150.203000514渝开发O.177O.0lO0.199000046泛海建设0.3780.0030.184600675中华企业O.1900.005O.18l600840新湖创业0.4000.0070。180000667名流置业0.4320.007O.176000024招商地产O.1470.0020.17260064l万业企业O.142O.015O.165600376首开股份0.2230.0060.16l002146荣盛发展0.3360.0050.158600533栖霞建设0.8240.726O.154000006深振业A0.1560.004O.153 第五章基于主成分分析的上市房地产公司财务分析模型的构建002208合肥城建0.3150.0190.153600748上实发展0.2820.0ll0.150600266北京城建O.1190.0020.142600052浙江广厦0.2030.0060.1420007ll天伦置业0.2060.008O.139600638新黄浦0.08l0.036O.135600053中江地产0.2600.0020.130000608阳光股份0.1800.0050.126600576万好万家0.23l0.0030.126000616亿城股份0.3130.006O.126000150宜华地产0.2170.018O.123600665天地源0.18l0.0030.122600895张江高科O.1090.0050.122600007中国国贸.0.3970.7080.115000838国兴地产0.4380.0080.“3002077大港股份0.6050.042O.“2000558莱茵置业0.3700.0090.1lI600639浦东金桥0.0960.0040.109000402金融街0.2220.0050.105601588北辰实业O.1670.005O.103600322天房发展0.2020.005O.1000005ll银基发展0.2790.0040.100000546光华控股0.1390.0030.100600159大龙地产0.0970.0020.093600823世茂股份0.2780.0060.090600463空港股份0.4000.0120.086000736ST重实.0.0030.03l0.084000502绿景地产0.4590.0090.081600240华业地产0.224O.0180.08l000090深天健0.356O.0140.080600648外高桥O.1160.0050.077000042深长城0.1450.0040.073000573粤宏远A0.1320.0020.072600736苏州高新O.20l0.0040.066600603ST兴业0.0470.0030.066600684珠江实业O.210O.0180.065600634海鸟发展O.1280.0240.065000014沙河股份O.112O.00l0.065600615丰华股份0.0970.0020.06l000029深深房A0.2390.0llO.06l600732上海新梅O.12l0.0150.060000007ST达声0.1490.0190.05433 西安石油大学硕士学位论文600767运盛实业0.0420.0000.054000505珠江控股O.1170.0050.053000628*ST高新0.2440.0140.027600890ST中房0.373O.0140.023600503华丽家族0.320O.0160.0135.4上市房地产公司获利能力主成分分析5.4.1KMO检验和Bartlett检验表5.14ICMOandBartlett'sTestKaiser·Meyer-OlkinMeasureofSampling.569Adequacy.Bartier’sTestofApprox.Chi—Square13.105Sphericitydf6Sig..04l本文中的Bartlett检验的F值等于0.041,接近于0.000,表明70家上市房地产公司经营状况数据来自近似正态分布总体。KMO分析观测变量之间简单相关系数和偏相关系数的相对大小,得出KMO=0.569,适合进行因子分析,效果较好。5.4.2主成分的确定CompOnetitInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%l1.49937.4671.49937.46721.06426.59464.0621.06426.59464.062.).75l18.78682.848.75l18.78682.8484.68617.152100.000.68617.152100.000表5.15为全部解释方差表,根据累计贡献率取85%_95%的主成分和选用所有特征根五≥l两条原则,提取主成分l、主成分2和主成分3。并得出主成分方差贡献率矩阵,如下表5.16。 第五章基于主成分分析的上市房地产公司财务分析模型的构建表5.16主成分方差贡献率主成分方差贡献率特征根方差贡献率方差贡献率累计主成分11.49937.467主成分21.06426.59464.062主成分3.75l18.78682.8485.4.3成分载荷Componentl234成本费用利润率.755..112..076.642销售毛利率.720.007.616-.320净资产收益率.575.562..513..302=项静用增长率..284.858.321.284表5.17的成分载荷矩阵给出了主成分载荷系数,每一列载荷值都是各个变量与有关主成分的相关系数。以第一列为例,O.755实际上是成本费用利润率与第一个主成分的相关系数,将标准化的成本费用利润率与第一主成分得分进行回归,容易算出R=0.755,这正是成本费用利润率在第一个主成分上的载荷。从主成分载荷矩阵可以看出,成本费用利润率在第一主成分上的载荷较大,也即与第一主成分的相关系数较高;三项费用增长率在第二主成分上的载荷较大,也即与第二主成分相关程度高:销售毛利率在第三主成分上的载荷较大。5.4.4成分得分系数Componentl234净资产收益率.383.528..683..440销售毛利率.480.007.819..467三项费用增长率..189.806.427.413成本费用利润率.504..105..101.935表5.18是主成分得分系数矩阵,根据该矩阵以及变量的观测值可以计算主成分得分计算公式: 西安石油大学硕士学位论文主成分1得分:Yl=0.383xl+0.480x2一O.189x3+0.504x4主成分2得分:Y2=0.528xl+0.007x2+0.806x3—0.105x4主成分3得分:Y3=--0.683xl+0.819x24-0.427x3—0.101x4式中X1X:,X,,X。为净资产收益率、销售毛利率、三项费用增长率和成本费用利润率标准化得分值,有上式计算出主成分Y。、Y:y;的各样本得分后,由计算综合得分的公式:F3=W⋯Y-I-W2Y2+w3Y3由前文公式,利用主成分方差贡献率表可以计算得到W,=0.452,W:=0.321,叱=0.227,综合得分计算式为:F3=0.452yl+0.321y2+0.227y35.4.5上市房地产公司获利能力相关得分最后通过EXCEL计算成分得分以及综合得分如下表5.19-表5.19获利能力分析评价分值表股票代码股票名称主成分I主成分2主成分3综合得分600246万通地产0.4921.2730.2890.697000046泛海建设0。6201.088O.1880.672600663陆家嘴1.22l0.384.O.08l0.657600767运盛实业0.69l0.8080.2500.629600840新湖创业0.9550.618.O.0170.62600003l中粮地产0.7900.692O.1990.624000007sT达声O.8140.6040.2730.624600240华业地产0.6740.8570.1350.61l600639浦东金桥0.7760.627O.1850.594600603ST兴业0.8650.4720.2240.593000736ST重实0.7170.6520.2420.588600675中华企业0.8090.6070.1000.583002244滨江集团0.7530.772—0.03l0.58l000514渝开发0.6690.784O.1090.579 第五章基于主成分分析的上市房地产公司财务分析模型的构建600007中凼凼贸0.8700.500O.1040.577000006深振业A0.74l0.6580.1lOO.57l000402金融街0.6450.8160.0780.57l600576万好万家0.6730.7260.1230.565000002万科A0.6400.7990.0450.556600053中江地产O.7170.7190.0040.556000667名流置业0.7450.690.0.02l0.554000838国兴地产0.5560.9430.00l0.554000024招商地产0.7520.6350.0080.546600383金地集团0.6630.7340.0430.54560064l万、Il,仓、II,0.7480.672.0.0430.544002208合肥城建O.78l0.646.0.0740.5440007ll天伦置业0.4561.0050.0150.532600038保利地产0.6790.709.0.0290.528002146荣盛发展0.6890.727.0.0750.528600895张江高科0.6590.694.0.008O.519600615丰华股份0.6940.5870.064O.517000718苏宁环球0.6860.703.O.1000.513000616亿城股份0.6600.680.0.016O.513600325华发股份0.6420.726.0.048O.512600638新黄浦0.596O.731.0.0380.495:000608阳光股份0.6340.674.0.0460.493000546光华控股0.6530.620.0.0200.490600533栖霞建设0.6890.635.O.1220.488600748上实发展0.6270.672.0.0480.488600823世茂股份0.6940.552.O.0140.488000014沙河股份0.6370.6070.0030.483002133广宇集团0.7140.580.0.1180.4820005ll银基发展0.6540.619.0.07l0.478000573粤宏远A0.6080.646.0.0290.476600463空港股份0.5370.782.0.0950.472000042深长城O.6160.649.0.0690.47l60079l京能置业0.6250.661.0.1300.46537 西安石油大学硕:十:学位论文601588北辰实业0.6280.608.0.0600.465600634海鸟发展0.4970.784.0.0580.463600266北京城建0.6720.539.0.0950.455000502绿景地产0.6550.538.0.0770.45l000150宜华地产0.7620.474.0.2090.449600736苏州高新0.5520.704.0.1340.445600052浙江广厦0.5860.650.0.1490.440000558莱茵置业0.6670.578.0.2270.436600732上海新梅0.4630.794.0.1340.434600684珠江实业0.595.O.12l0.433600376首开股份0.5750.623.0.1500.426600393东华实业0.57l0.653.0.1960.423600665天地源0.5660.603.O.166O.412000505珠江控股0.5580.553.0.078O.412600159人龙地产0.6270.503.O.1770.405000029深深房A0.5630.555.O.1940.388600322天房发展0.4940.655.0.2120.385002077大港股份0.505O.661.0.285O.376000090深天健0.5380.579.0.25l0.372600890ST中房0.4620.609.0.15l0.370600648外高桥0.4770.592.0.275O.343600503华丽家族0.2690.619.0.4330.222000628*ST高新0.162O.1550.409O.2165.5上市房地产公司发展能力主成分分析5.5.1KMO检验和Bartlett检验表5.20KMOandBartlett’STestKaiser-Meyer-OlkinMeasureofSampling.572Adequacy.Bartier’sTestofApprox.Chi-Square47.312Sphericitydf6Sig..000 第五章基于主成分分析的上市房地产公司财务分析模型的构建本文中的Bartlett检验的F值接近于0.000,表明70家上市房地产公司经营状况数据来自正态分布总体。KMO分析观测变量之间简单相关系数和偏相关系数的相对大小,得出KMO=0.572,适合进行因子分析,效果较好。5.5.2主成分的确定ComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVafianceCumulative%TotaI%ofVarianceCumulative%11.89947.4831.89947.48321.05226.29073.7721.05226.29073.7723.69317-33391.105.69317._Go91.1054.3568.895100.000.3568.895100.000表5.2l为全部解释方差表,根据累计贡献率取85%叫5%的主成分和选用所有特征根丑≥l两条原则,提取主成分l、主成分2和主成分3。并得出主成分方差贡献率矩阵,如下表5.22。表5.22主成分方差贡献率主成分方差贡献率特征根方差贡献率方差贡献率累计主成分11.89947.483主成分21.05226.29073.772主成分3.69317.33391.1055.5.3成分载荷Componentl234净资产增长率.884..103.067..45l每股净资产增长率.771..340.417.34l净利润增长率.703.279..626.189主营业务收入增长率.170.920.352.018表5.23的成分载荷矩阵给出了主成分载荷系数,每一列载荷值都是各个变量与有关主成分的相关系数。以第--3iU为例,O.884实际上是净资产增长率与第一个主成分的相关系数,将标准化的净资产增长率与第一主成分得分进行回归,容易算出R=0.884,这正是净资产增长率在第一个主成分上的载荷。 西安石油大学硕士学位论文从主成分载荷矩阵可以看出,净资产增长率、每股净资产增长率和净利润增长率在第一主成分上的载荷较大,也即与第一主成分的相关系数较高;主营业务收入增长率在第二主成分上的载荷较大。5.5.4成分得分系数Componentl234净资产同比增长率.465..098.096.1.268主营业务收入同比增长率.090.875.507.052净利润同比增长率.370.266..903.532每股净资产同比增长率.406..324.601.958表5.24是主成分得分系数矩阵,根据该矩阵以及变量的观测值可以计算因子得分:主成分l得分:Yl=0.465xl+O.090x2+0.370x3+0.406x4主成分2得分:Y2=-0.098xl+0.875x2+0.266x3—0.324x4主成分3得分:Y3=0.096xI+0.507x2-0.903x3+O.601x4式中XIX:,x3,x4为净资产同比增长率、主营业务收入同比增长率、净利润同比增长率和每股净资产同比增长率标准化得分值,有上式计算出主成分Y。、Y:和Y,的各样本得分后,由计算综合得分的公式:F4=wlYI+w2Y2+Way3由前文公式,利用主成分方差贡献率表可以计算得到w。=0.521,w:=0.289,w3=0.190,综合得分计算式为:F4=0.521yl+O.289y2+O.190y35.5.5上市房地产公司发展能力相关得分最后通过EXCEL计算成分得分以及综合得分如下表5.25: 第五章基于主成分分析的上市房地产公司财务分析模型的构建表5.25发展能力分析评价分值表股票代码股票名称主成分1主成分2主成分3综合得分000514渝开发1.894-0.3800.8771.044600503华丽家族1.446.0.8601.58l0.805600246万通地产0.6400.1360.7470.5140007ll天伶詈、fl,0.3130.7680.668O.512600159大龙地产0.860.0.4570.8450.477600038保利地产O.721.0.2950.7150.426002133广宇集团0.666.0.2200.68l0.413002146荣盛发展O.661.0.30l0.6380.379000616亿城股份0.626.0.2660.5990.363000046泛海建设0.542.0.1240.5440.350002244滨江集团0.581.O.2120.56l0.348600383金地集团O.571.O.1990.5560.346000024招商地产0.553.0.2230.5240.323600240华业地产0.571.0.2840.530O.316600890ST中房0.1860.48l0.3870310600322天房发展0.452.O.1320.4320.279600325华发股份0.427.0.0840.4070.27600003l中粮地产0.425.0.0980.3930.268000002万科A0.430.O.1190.40l0.266000718苏宁环球0.441.0.165O.3860.25560079l京台垮詈、Il,0.415.0.1300.3840.252600748上实发展O.413一O.1490.3780.244000608阳光股份0.394—0.1350.35l0.233000090深天健0.373.0.1170.3340.224600266北京城建0.369.O.1470.3000.207600840新湖创业0.344.0.1050.2960.205600393东华实业0.2590.0680.2480.202600053中江地产O.317.0.0570.2650.199000838国兴地产0.295O.167.0.0380.195000546光华控股0.326.0.1120.285O.192000402金融街0.319.0.0960.270O.19041 西安石油大学硕士学位论文600634海鸟发展0.2070.1050.243O.184600648外高桥0.273-0.0260.25l0.183000558莱茵置业0.312.0.1090.257O.180000667名流置业0.270.0.0150.2240.179600732上海新梅0.2490.0140.2390.179600376首开股份0.283.0.0520.2340.177000502绿景地产0.271.0.0390.2430.176600736苏州高新0.281.0.0690.2300.170600675中华企业0.272.0.0680.22lO.164600052浙江广厦0.1870.0900.202O.16260064l万、Ip彳》、Ip0.281.O.08l0.1990.160000150宣华地产0.254—0.0820.247O.156600463空港股份0.2250.0050.189O.155002077大港股份0.237.0.037O.1860.148600533栖霞建设0.240.0.0450.1840.147000042深长城0.231.0.0260.1490.14l000573粤宏远A0.238.O.OOl0.09lO.14l000006深振业A0.242.0.07lO.180O.140000007ST达声0.233.0.064O.1890.139601588北辰实业O.213.0.0150.1680.1380005ll银基发展0.227.0.0420.164O.137600823世茂股份0.244.0.0880.184O.137600684珠江实业O.217.0.0260.164O.137600663陆家嘴0.235.0.072O.1690.134600895张江高科0.226.0.0500.1520.132600639浦东金桥0.226-0.0620.1640.13I600007中国国贸O.214.0.04lO.1540.129600665天地源0.208.0.0300.152O.128000029深深房AO.218.0.05l0.146O.127600638新黄浦0.207.0.04l0.1370.122600576万好万家0.2M.0.0710.1090.122000736ST重实0.179.0.0060.1lO0.112000014沙河股份O.188.0.058O.129O.10642 第五章基于主成分分析的上市房地产公司财务分析模型的构建600767运盛实业0.206.0.0920.1320.106002208合肥城建O.1570.012O.1020.104600603ST兴业0.2070.010.0.0550.100000505珠江控股O.164.0.059O.1040.088600615丰华股份0.141.0.0400.0720.076000628*ST高新0.0460.060.0.0350.0345.6上市房地产公司综合财务分析模型上市公司的财务分析可以从偿债能力、运营能力、获利能力和发展能力四大类进行分析,上文中已将这四大类财务能力进行了主成分分析,通过借助统计分析软件的智能分析工具,本文成功对影响各项财务能力的因素进行了降维,也即提出了每类财务能力的主成分,并计算了每个上市房地产公司的单项财务能力综合得分,并按照降序进行了排列,排名靠前的相应财务能力就比较好,而靠后的就比较差,通过比对我们可以发现,一般ST以及*ST企业都比较靠后。但是这还不能充分、具体表达那一家上市公司四大类财务能力综合能力较强,所以继续使用主成分分析,以每类财务能力的综合得分为数据对象,如表5-26:表5.26四大能力综合得分汇总股票偿债能力营运能力获利能力发展能力代码名称综合得分600240华业地产0.814O.08l0.6ll0.316600634海鸟发展0.5650.0650.4630.184600767运盛实业0.4250.0540.6290.106000628*ST高新O.1790.0270.2160.034000007ST达声0.1550.0540.624O.139000736ST重实0.1450.0840.588O.112600603ST兴业.0.0820.0660.5930.100现在分别以偿债能力、营运能力、获利能力和发展能力综合得分作为四个反映企业财务状况的因素,以此为基础再次进行主成分分析,再次降维。5.6.1KMO检验和Bartlett检验43 西安石油大学硕士学位论文表5.27KMOandBartlett'sTestKaiser··Meyer·-OlkinMeasureofSamplingAdequacy..598Bartlett’sTestofApprox.Chi-Square9.933SphericityDf6Sig。。128本文中的Bartlett检验的F值接近于0.000,表明反映70家上市房地产公司财务状况数据来自正态分布总体。KMO分析观测变量之间简单相关系数和偏相关系数的相对大小,得出KMO=O.598,适合进行因子分析,效果较好。5.6.2主成分的确定表5.28TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceC:umulative%l1.46836.7091.46836.7092。98624.64661.354.98624.64661.3543.81720.43281.787.81720.43281.7874.72918.213100.000.72918.213100.000ExtractionMethod:PrincipalComponentAnalysis.表5.28为全部解释方差表,根据累计贡献率取85%-95%的主成分和选用所有特征根五≥l两条原则,提取主成分l、主成分2和主成分3。并得出主成分方差贡献率矩阵,如下表5.29。表5—29主成分方差贡献率主成分方差贡献率特征根方差贡献率方差贡献率累计主成分11.46836.709主成分2.98624.64661.354主成分3.81720.43281.7875.6.3成分载荷Componentl234营运能力得分.726..035..222..650发展能力得分.681..249..448.524获利能力得分.249.958..071.122偿债能力得分.644..068.750.132 第五章基于主成分分析的上市房地产公司财务分析模型的构建表5.30的成分载荷矩阵给出了主成分载荷系数,每一列载荷值都是各个变量与有关主成分的相关系数。以第一列为例,0.726和0.681实际上分别是营运能力综合得分和发展能力综合得分与第一个主成分的相关系数,将营业能力综合得分和发展能力综合得分与第一主成分得分进行回归,容易算出Rl=O.726和尺2=0.681,这是营业能力综合得分和发展能力综合得分在第一个主成分上的载荷。从主成分载荷矩阵可以看出,营业能力综合得分和发展能力综合得分在第一主成分上的载荷较大,也即与第一主成分的相关系数较高;获利能力综合在第二主成分上的载荷较大;偿债能力综合分在第三主成分上的载荷较大。5.6.4成分得分系数Componentl234偿债能力得分.439..069.918.181营运能力得分.495..036..27l一.892获利能力得分.170.972..087.167发展能力得分.464..253..548.719表5-3l是主成分得分系数矩阵,根据该矩阵以及变量的观测值司‘以计算因子得分:主成分l得分:Yl=0.739xl+0.495x2+O.170x3+0.464x4主成分2得分:Y2=-0.069xI-0.036x2+O.972x3—0.253x4主成分3得分:Y3=0.918xI-0.271x2-0.27lx3—0.548x4式中x。,X:,x,,X。为偿债能力、营运能力、获利能力和发展能力综合得分,有上式计算出主成分Y。、Y:和Y,的各样本得分后,由计算综合得分的公式:F=WlYl-I-W2Y2+w3Y3由前文公式,利用主成分方差贡献率表可以计算得到W。=0.449,W2=0.301,W,=0.250,综合得分计算式为:F=0.449yl+0.301y2+0.250y35.6.5上市房地产公司综合财务状况得分最后通过EXCEL计算成分得分以及综合得分,并将每类财务能力得分和每家上市公司综合财务状况得分汇总,按降序排列如下表5.32:45 西安石油大学硕士学位论文表5.32上市房地产公司财务状况综合得分股票偿债能力营运能力获利能力发展能力财务状况代码名称综合得分600240华业地产0.8140.08l0.6ll03160.569000514渝开发0.2830.1990.5791.0440.492600246万通地产0.2560.2220.6970.5140.392600634海鸟发展0.5650.0650.463O.184O.39l600159大龙地产0.4250.0930.4050.4770.3860007ll天伦置业0.3530.1390.5320.5120.384600767运盛实业0.4250.0540.629O.1060.35700003l中粮地产0.3120.7790.6240.2680.352000046泛海建设0.234O.1840.6720.3500.342600038保利地产0.2560.2530.5280.4260.34060064l万、I【,食、Ip0.3860.1650.544O.1600.337000616亿城股份0.2940.126O.5130.3630.335600383金地集团0.2550.2060.5450.3460.334002133广宇集团0.2740.2080.4820.4130.330002146荣盛发展0.2340.1580.5280.3790.324600663陆家嘴0.2960.3470.657O.1340.322000667名流置业0.287O.1760.5540.1790.318000002万科A0.2430.3lO0.5560.266O.315002244滨江集团0.2080.2050.58l0.3480.313600684珠江实业0.3900.0650.4330.137O.310600638新黄浦0.3640.1350.4950.1220.30960079l京能置业0.2980.2030.4650.2520.309000838国兴地产O.24lO.1130.5540.1950.305000024招商地产0.22l0.1720.5460.3230.305600890ST中房0.aa00.0230.3700-3100.302600533栖霞建设0.2430.1540.4880.147O.30l000006深振业A0.27lO.1530.57IO.1400.300600840新湖创业O.1920.1800.6260.2050.297600675中华企业0.2500.18l0.5830.1640.294000573粤宏远A0.3240.0720.4760.14lO.29I 第五章基于主成分分析的上市房地产公司财务分析模型的构建600325华发股份0.2240.24l0.5120.2760.29l600053中江地产0.2350.1300.5560.1990.287600503华丽家族0.2380.0130.2220.8050.284000402金融街0.223O.105O.57l0.1900.284600748上实发展O.24l0.1500.4880.2440.282600322天房发展0.2780.1000.3850.2790.28l000150宜华地产0.2720.1230.449O.1560.28l000718苏宁环球0.2060.2370.5130.2550.278000608阳光股份0.2290.1260.4930.2330.276002208合肥城建0.234O.1530.5440.1040.273000502绿景地产0.2490.08l0.45l0.1760.2720005ll银基发展0.2680.1000.4780.1370.270600007中国圈贸0.186O.1150.577O.1290.270000014沙河股份0.2780.0650.4830.1060.266600823世茂股份O.23l0.0900.4880.1370.260600576万好万家0.20lO.1260.565O.1220.260600463空港股份O.2ll0.0860.472O.1550.259000007ST达声0.1550.0540.6240.1390.258000546光华控股0.215O.1000.4900.1920.257601588北辰实业0.23lO.1030.465O.1380.254600393东华实业O.2150.2200.4230.2020.253002077大港股份0.2280.1120.3760.148O.25l000090深天健O.2160.0800.3720.2240.250000042深长城0.2190.0730.47l0.14l0.249600266北京城建0.2090.1420.4550.2070.248600639浦东金桥O.1570.1090.5940.13l0.248600736苏州高新0.2040.0660.445O.1700.243600732上海新梅0.2200.0600.4340.1790.242600615丰华股份0.2180.06lO.5170.0760.24l600895张江高科0.178O.1220.5190.1320.24l000558莱茵置业O.185O.1ll0.436O.1800.240000029深深房A0.249O.06lO.3880.1270.239000736ST重实O.1450.0840.5880.1120.23747 西安石油大学硕士学位论文600376首开股份0.199O.16l0.4260.1770.236600665天地源0.22l0.1220.412O.1280.235600052浙江广厦O.1800.1420.440O.1620.230600648外高桥O.2130.0770.343O.183O.22l000505珠江控股O.1790.0530.4120.0880.207000628*ST高新O.1790.0270.2160.0340.153600603ST兴业.0.0820.0660.593O.100O.1365.6.6挖掘结果的知识表达本文首先对反映70家上市房地产公司的偿债能力、运营能力、获利能力和发展能力分别进行主成分分析,计算每类财务能力得分;最后,以每类财务能力得分为数据基础进一步应用主成分分析方法,计算每家上市房地产公司的财务状况综合得分,结果如上表5.32,财务状况综合得分越高,上市公司的综合财务能力也就越高,更具投资价值。(1)单项财务能力得分知识表达从偿债能力得分情况分析得出,华业地产(600240)得分O.814排名第一位,海鸟发展(600634)得分0.565排名第二位,对于关心公司偿债能力的财务信息需求方可以着重参考此类财务能力得分,例如债权人和供应商等。从营运能力得分情况分析得出,中粮地产(000031)得分为0.779排名第一位,陆家嘴(600663)得分为0.347排名第二位,万科A(000002)得分为0.310排名第三位。从营运能力得分总体情况来看,我国房地产公司的资本营运能力普遍偏低,而行业龙头万科A和国家大力支持的中粮地产资本营运情况还是比较满意的,企业本身在进行经济决策以及日常运营中应该重点参考此类能力得分。从获利能力得分情况分析得出,万通地产(600246)得分0.697排名第一,泛海建设(000046)得分0.672排名第二位,比如公司股东在投资是可以考虑参考此类财务能力得分。从发展能力得分情况分析得出,渝开发(000514)得分1.044排名第一,华丽家族(600503)得分0.805排名第二位,供应商甚至企业本身应该着重考虑参考此类财务能力得分。(2)财务状况综合得分知识表达从财务状况综合得分来看,偿债能力、运营能力、获利能力和发展能力得分较高,或者在某类财务能力得分较低但其余各类财务能力得分均衡的上市公司财务状况综合得分明显较高。排在第一位的是华业地产(6001240),这主要是归因于其偿债能力和获利能力得分较高,分别为0.814和0.61l,而对于获利能力得分70家上市房地产公司普遍较高,这也是由我国近几年房地产行业的火爆发展相关联,所以华业地产综合得分较高主要是由于其偿债能力得分较高。华业地产偿债能力第一主成分得分为0.895,根 第五章基于主成分分析的上市房地产公司财务分析模型的构建据表5.4主成分方差贡献率得出其累计方差贡献率为56.167%,进而说明其揭示了偿债能力原始信息的56.167%,这一主成分中速动比率、流动比率、股东权益比率和资产负债率载荷为正且最大,说明其财务风险比较小。排在第二位的是渝开发(000514),其发展能力得分是70家公司中最高的,为1.044,对比其他公司其运营能力得分为0.574也是比较高的,说明该公司具有较强的经营管理能力、主营业务突出,发展潜力巨大。该公司在2007年业务发展较快,在房地产开发与经营、房地产信息咨询、实施土地整治、物业管理以及建筑材料经销等方面获得较快发展。排在最后两位的是*ST高新(000628)和ST兴业(600603)两家公司。这两家公司的四大类财务能力得分均比较低,尤其是获利能力得分。ST是指公司经营连续两年亏损,被特别处理,*ST是指企业亏损满三年的股票,如果在规定期限不能扭亏,就有退市的风险还有,虽然不满三年,但财务状况恶劣的也可以是*ST,总之就是有退市风险的股票。*ST高新主营业务涉及工业、商业、房地产业及投资服务业等多个产业,但盈利的产业并不多,在生产经营管理各方面都不乐观,亏损的主要原因是房地产业毛利减少、核销坏账准备和对担保涉诉事项计提预计负债等。ST兴业亏损是由于公司持续经营能力尚未恢复,期间费用大幅上升等原因。投资者在选择投资对象时,应该尽量避开此类公司。投资者以及相关信息需求者,可以参考表5.32,对比每家上市公司财务状况综合得分以及偿债能力、运营能力、获利能力和发展能力得分,依据投资偏好和公司具体经营情况做出科学合理的经济决策,降低投资风险。49 西安石油大学硕士学位论文第六章利用聚类分析方法验证财务分析模型的有效性6.1聚类分析【481聚类分析是数据挖掘技术中的重要分析技术,是通过数据建模简化数据的一种方法,研究成果主要集中在基于距离和相似度的聚类方法。是将一批样品或变量,按照它们性质上的亲疏程度进行分类,把每个样品看成是m维空间(样本的数量为m)的一个点,在m维坐标中,定义点与点之间的某种距离或相似度,进行分类,自动分成几个群组,使得同一群组的样本距离最小或相似度最大,不同群组的样本反之。在财务分析领域,聚类分析可以帮助财务信息使用者根据关键的财务指标将众多的公司进行聚类,从中发现公司财务状况的异同,从而有力支持了投资决策的制定。聚类分析系统输入的是一组样本和一个度量样本间距离或相似度的标准,输出的是数据集的几个组(类、簇),并对每个类进行综合描述,也可作为其他数据挖掘任务的预处理步骤。6.2聚类分析中的数据类型聚类分析主要针对的数据类型包括标度变量、二元变量、序数型变量、比例标度型变量,以及由这些变量类型构成的复合类型,财务数据既有时效性,又有顺序性,适合数据特点要求。聚类算法通常采用数据矩阵和相异度矩阵两种典型的数据结构。数据矩阵(DataMatrix),设有疗个对象,可以用P个变量(属性)描述每个对象,则以×P矩阵:X11X21X玎lX12X22xn2Xlp‘X2pXnp,(6.1)称为数据矩阵。数据矩阵是对象——变量结构的数据表达方式。相异度矩阵(DissimilarityMatrix),按n个对象两两间的相异度构建n阶矩阵,又因为相异度矩阵是对称的,只需写出上三角或下三角即可:0d(2,1)0d(3,1)d(3,2)0d(n,1)d(n,2)⋯0(6-2)其中d(f,/)表示对象,与/的相异度,它是一个非负的数值。当对象f与_,越相似或“接近” 第六章利用聚类分析方法验证财务分析模型的有效性时,d(f,_,)值越接近0;反之,d(f,/)值越大。相异度矩阵是对象——对象结构的一种数据表达方式。多数聚类算法都是建立在相异度矩阵基础上,如果数据是以数据矩阵形式给出的,就要将数据矩阵转化为相异度矩阵。6.3聚类分析的数学模型设X=扛。,x:,⋯,x。)是待聚类分析的对象的全体,X中的每个对象(称为样本)x,(1≤i≤刀)常用有限个参数值来刻画,每个参数值刻画x,的某个特征。于是对象x,就伴随着一个向(矢)量P(xi):(Xil,xi2,⋯,x砌),其中x,(1≤/≤朋)是x,在第j个特征上的赋值,P(x,)称为‘的特征向量或模式矢量。聚类分析就是分析论域X中的il个样本所对应的模式矢量间的空间距离及分散情况,按照各样本间的距离远近关系把_,x:,⋯,x。划分成k个不相交的模式子集X。,X2,⋯,X々,并要求满足下列条件:X1UX2U⋯Uxk=—Y,xzNxj=a(1≤f,/≤七,i≠/)(6—3)样本x,(1≤J≤玎)对子集(类)X,(1≤i≤k)的隶属关系可用隶属函数表示为:wx,cx/,=Ⅵ,驴={三{二;主娄;;c6-4,其中,隶属函数必须满足条件w盯∈Mhk。也就是说,要求每一个赝本能且只能隶属于某一类,同时要求每个子集(类)都是非空的。Mhk={w{|『1w驴∈(0,1),f三klw扩乩唧<耋1w∥M>(6-5)6.4距离或相似系数的测度将选定的样品进行分类,就需要研究样品之间关系,就需要用一个指标来刻画样品之间的距离或相似程度。目前用得最多的方法有以下两个:一种方法是将一个样品看作P维空间的一个点,并在空间定义距离,距离越近的点归为一类,距离较远的点归为不同的类;另一种方式是用相似系数,性质越接近的样品,它们的相似系数的绝对值越接近l,而彼此无关的样品之间相似系数小的样品归为不同类。距离和相似系数有多种定义,某种距离或相似系数的定义一般只适合某种尺度的变量。距离系数主要有明氏距离和马氏距离,相似系数主要是基于马氏距离,常用的相关 西安石油大学硕士学位论文(1)明氏距离计算公式:d扩cg,=(差.Ix胁一x弘Ig]179c6.6,当q=1时,计算公式如下:勺(1)=∑P.Xia-Xjaiajal即绝对值距离(Block)(6.7)勺(1)=∑.1臣口绝对值距离(6-7’a=1当q=2时,计算公式如下:勺c2,:(差l(xia-x弘,2]Ⅳ2即欧式距离c6一s,勺Q卜【差弘广J即欧式距离饰‘8’当q=oO时,计算公式如下:勺(咖l茹kxjal朔比雪夫距离(6.9)当各变量的测量值相差悬殊时,直接用明氏距离并不合理,需要先对数据进行标准化,然后用标准化后的数据计算距离。(2)马氏距离计算公式:d2(m)=(x厂Xj)’∑一1(鼍一xj)(6-10)其中X,为第f个样品的P个指标组成的向量,即原始资料阵的第衍亍向量。样品X,类似。(3)相似系数——夹角余弦描写样品之间相似程度除了用距离表示外,常用的还有相关系数和夹角余弦,夹角余弦讲任何两个样品X,与X,看成P维空间的两个向量,这两个向量的夹角余弦用cosO,:表示。计算公式如下:52 第六章利用聚类分析方法验证财务分析模型的有效性夹角余弦计算公式:cos%.=cos0U∈(一1,1)(6-11)当cos吃=l时,说明样品X,与x,完全相似;如果cos色接近l,说明样品X,与x/相似密切;如果cos吃20,说明样品x,与x/完全不一样;如果cos吼接近0,说明样品X,与X/差别大。一般变量间的相关系数作为刻划样品之间的相似关系,即第,个样品与第歹个样品之间相关系数计算公式如下:协2协∈(一I,1)(6-12)6.5上市房地产公司聚类分析按照SPSS数据输入格式将偿债能力、营运能力、获利能力和发展能力的综合得分输入数据编辑窗口,点击“Analyze--*Classify---*HierarchicalCluster'’选择层次聚类。无论是凝聚的还是分裂的层次聚类都要遵循一定的距离(或相似度)准则,本文采用最小距离方法,即:‰(c。,Cj)=minp-p’Il,将距离最近的归为一类。在具体操作中,选择‘'Nearestneighbor”即最短距离法,得到相异度矩阵和聚类凝聚过程(由于数据量太大,省略),最终将70家上市房地产公司进行了分类。表6-1ClusterMembership股票代码股票名称6Clusters5Clusters600240华业地产l600634海鸟发展l600767运盛实业2600159大龙地产32600684珠江实业260064l万业企业2肛X口Xp∑仁一0一.脾X×一■一衍@p∑仁 西安石油大学硕士学位论文600638新黄浦20007ll天伦置业32600890ST中房2000573粤宏远A200003l中粮地产260079l京能置业2600663陆家嘴2000616亿城股份2000667名流置业2000514渝开发43600322天房发展2000014沙河股份2002133广字集团2000150宜华地产2000006深振业A20005ll银基发展2600246万通地产32600038保利地产2600383金地集团2600675中华企业2000502绿景地产2000029深深房A2600533栖霞建设2000002万科A2600748上实发展2000838国兴地产2600503华丽家族54600053中江地产2002208合肥城建2002146荣盛发展2000046泛海建设2601588北辰实业2600823世茂股份2 第六章利用聚类分析方法验证财务分析模型的有效性000608阳光股份2002077大港股份2600325华发股份2000402金融街2600665天地源2000024招商地产2600732上海新梅2000042深长城2600615丰华股份2000090深天健2600393东华实业2000546光华控股2600648外高桥2600463空港股份2600266北京城建2002244滨江集团2000718苏宁环球2600736苏州高新2600576万好万家2600376首开股份2600840新湖创业2600007中国国贸2000558莱茵置业2600052浙江广厦2000628*ST高新2000505珠江控股2600895张江高科2600639浦东金桥2000007ST达声2000736ST重实2600603ST兴业65表6.1是最终聚类结果的类成员表,在利用SPSS分析过程中,本文设置分为5"-'6类,从而输出了划分5"6类时每个样本属于某一类的结果。按照人们熟悉的优秀、良好、平 西安石油大学硕士学位论文均、较低和较差,本文选取划分5类时的情况进行分析,其具体分类如上表6.1所示:华业地产(600240)和海鸟发展(600634)分为一类,而其在表5.32中的综合财务能力得分分别为0.569和0.391,虽然海鸟发展综合得分低于华业地产,但是通过四类财务能力得分可知,海鸟发展的偿债能力得分排名第二位,仅次于华业地产,两个公司都属财务风险较小的上市公司。渝开发(000514)单独分为一类,其财务状况综合得分为0.492,排名第二位,但是其发展能力得分为1.044排名第一位,而且明显高于其他上市公司。华丽家族(600503)分为一类,其财务状况综合得分为0.284,排名靠后,但是其发展能力得分为0.805,仅次于渝开发,但是对比渝开发而言,其另外三项财务能力得分都是比较差的。ST兴业(600603)分为一类,其财务状况综合得分为0.136,排名最后,其各项财务能力得分均是最低的,且其偿债能力得分为负数,说明其财务风险较大。除此之外,其余上市公司分为一大类,该类上市公司财务状况综合得分一般,频数分布比较广泛。比对分析后可以发现,基于主成分分析的财务分析模型与聚类分析结果有相似之处,但是前者能用更形象、更易理解的得分来表达研究对象的财务状况,而聚类分析只是简单的将样本进行科学的分类,相比之下,基于主成分分析的财务分析模型更具优势,分析简单,结果易理解。 第七章结论与展望7.1结论7.1.1内容总结本文首先从国内外两方面对数据挖掘技术在财务分析中的应用及实证研究成果进行了综述,在对研究成果进行评价的基础上提出了这些研究对本文的启示;其次论证了数据挖掘技术在财务领域的适用性,利用其方法的优越性可以弥补现行财务分析方法的局限性;接着又介绍了数据挖掘技术的有关原理及挖掘步骤,并通过对比各种数据挖掘方法的优势和劣势,进而确定本文的研究方法,也即主成分分析方法;最后,通过四项原则以及相关理论分析构建本文的财务分析指标体系,避免靠人为和经验选择财务指标的缺陷,统一量纲,区别于以前研究中将各种财务指标同等对待的做法,而是先对偿债能力、运营能力、获利能力和发展能力分别进行主成分分析,计算每项财务能力的综合得分,紧接着就是以每类财务能力综合得分为数据对象再次进行主成分分析,最终计算企业综合财务能力得分,并对结果进行必要的说明、解释,利用聚类分析方法验证研究结果的有效性。本文最终研究结果集中表现在上市房地产公司财务状况综合得分表中,投资者及相关信息需求者可以根据此表进行相关经济决策,但要综合分析财务状况综合得分和四类财务能力得分之间的关系。7.1.2研究方法总结本文之所以取得较好的研究结果,是因为选择了正确的数据挖掘方法,也即主成分分析方法,综合分析研究过程,主成分分析方法的优势在于:主成分分析方法的意义在于简化数据结构,降低数据分析维度,抽取影响财务状况的主要因子,也即主成分;主成分分析方法可以消除各项财务指标之间财务信息的重叠,从而减少重叠指标对财务分析结果的影响,评分结果更加可靠;主成分分析方法以因子方差贡献率为权数进行建模,避免了依靠人为、经验确定权重的不科学因素,使得分析过程更具公平性和客观性,得出科学精确的综合得分。主成分分析不仅能够进行综合财务分析并计算综合得分,还能对财务状况的各个方面进行单项分析并计算得分,有助于进行深入研究、发现问题、解决问题【4引。7.1.3研究结论投资者以及其他信息使用者可以从不同的角度理解、提取上市房地产公司财务状况综合得分表中的信息,以取得对决策有用的信息,除了参考财务状况综合得分外,还应考虑某项或某些项财务能力得分:公司股东可以着重参考获利能力得分,债权人可以着重参考偿债能力得分,供应商可以着重参考发展能力得分和偿债能力得分;企业本身在5'/ 西安石油大学硕士学位论文进行投资决策时,可以着重参考营运能力得分和获利能力得分。在进行融资决策时,应当重点考虑偿债能力得分。在进行日常经济决策时,应当重点参考营运能力得分和获利能力得分。7.2不足之处虽然本文在研究中有所创新,但是仍存在以下不足:(1)本文的研究模型的准确性要受到上市公司发布财务报告数据真实性的影响,而我国部分上市公司仍然在人为操作会计利润,粉饰财务报表的现象,并且我国的资本市场尚不完善,非财务变量没有达到完全有效性,故该模型结论的准确性可能因此而受到一定的影响。(2)本文研究仅局限于同行业上市公司的财务分析,未推广至一般企业,也未全面考虑每一行业的特点。例如本文随机的选择了房地产行业上市公司进行同行业的财务分析,但是并没全面考虑上市房地产行业上市公司特点。(3)本文研究模型只是同行业上市公司间的一种横向财务分析,没有进行每个企业纵向财务分析。7.3展望随着我国对外开放和经济体制改革的深入进行,特别是加入WTO,企业之间竞争日益激烈,如何提供真实、可靠的财务信息对与投资者、债权人和政府管理部门影响深远。因此,我们要充分借鉴和吸收相关学科的发展成果,创新财务分析方法,对企业财务运营全过程进行跟踪、监控,全面分析企业财务指标数据,略去不真实的财务信息,将企业潜在的财务危险告知投资者、债权人和政府相关部门,以减少其决策的失误性。利用数据挖掘技术进行财务分析是一个全新的探索过程,对其研究需要不断深入。通过本文的研究,认为财务分析的进一步研究重点应该集中在以下几个方面:(1)不同时期的宏观经济环境和会计处理方法的不同,使建立模型的财务数据具有鲜明的时效性,从而数据所决定的模型也具有时效性,因此,建立一个动态的纵向和横向财务分析模型对上市公司进行长期的跟踪和监控成为必要性。(2)利用交叉学科的巨大优势和相关研究成果提高模型的判断正确率和预测准确度,综合利用数据挖掘技术的各种方法进行财务分析。(3)要不断扩展财务分析的范围,要综合考虑企业全方位的经营战略信息。(4)目前构造的各种模型已经或多或少的在公司规模和行业适用性等方面具有不同的侧重点。随着研究的深入,会出现两种研究趋势:以普遍适用为目的的通用模型和以行业以及企业规模为特点的专业模型。以主成分分析构建的各种财务管理模型各具优势,提供分析问题的思路具有较强指导意义,尤其是对某行业或某类企业财务状况的整体分析更具指导性;对公司的理财、 第七章结论与展望投资者的投资决策以及相关政府部门的管理也极具参考使用价值,笔者坚信随着会计核算技术以及相关学科的发展,该模型会得到逐步完善,应用前景更加广泛。59 西安石油人学硕士学位论文致谢历时一年有余,我的论文历经数稿后,终于成型。在这里,我要衷心地感谢各位为我传道、授业、解惑的老师以及给予我帮助的同学、朋友们,并对我的导师赵选民教授致以特别的敬意和感谢!本文的完成离不开我敬爱的导师赵选民教授的谆谆教诲、严格要求和督促。从开题到资料的收集,从初稿的完成到数次的反复修改直致最终定稿,无不凝结着他的心血。赵老师为学生付出的一切,我必定铭记在心,在今后的生活和工作中,以他为楷模。在西安石油大学的学习、生活虽然即将告一段落,但这一段经历将使我终生难忘。在今后的工作中,我将努力把所学到的知识用于实践并为社会做出贡献,以此来答谢那些关心和帮助过我的老师和同学们、以此来答谢我敬爱的导师赵选民教授。谢谢160 参考文献【l】RobertEHalsey.UsingtheResidual.IncomeStockPriceValuationModeltoTeachandLeamRationAnalysis.AccountingEdueation.2001,16(2):257—272.[2】Peter.ReturnonEquityandSystematicRatioAnalysis.Commerciallendingreview.1997.【3】WilliamR.DillonandMatthewGokdstein,MultivariateAnalysis:methodandApplication,JohnWiley&Sons,l999.一[4】LynM.Fraser.AileenOrmiston.UnderstandingFinancialStatements.7thEdition.Prentice.HallInc,2004.【5】EugeneF.Brigham,LouisC.Gapenski.IntermediateFinancialManagement.5thEdition.TheDrydenPress,1996【6】(美)J·韩.数据挖掘技术与概念[M】.机械工业出版社,2001年版.[7】李剑锋,李一军,祁威等.数据挖掘在公司财务分析中的应用【J】.计算机工程与应用,2005.【8】林伟林,林有.数据挖掘在上市公司财务状况分析中的应用[J】.市场周刊,2004.【9】李雄飞,李军.数据挖掘与知识发现【M】.高等教育出版社,2003.【10】门可佩,薛亮.电力上市公司财务业绩的综合评价[J】.企业管理,2006.06:173.175.【11】何慧婷,柳建民.构建上市公司财务比率指标评价体系【J】.管理学报,2005.07:49l一494.[12】毛定祥,刘玲.因子分析方法在上市公司综合财务分析方法与评价中应用嗍.系统工程,1997.06.【13】刘晏,罗慧.上市公司财务危机预警分析一基于数据挖掘的研究【J】.数理统计与管理.2004.03.[14】姚靠华,蒋艳辉.企业动态财务预警系统研究阴.湘潭师范学院学报(自然科学版),2005.【15】李爱玲,沈宪章,李豫州.数据挖掘在财务预测中的应用[J】.安阳师范学院学报,2005.[16】刘胜平,张启銮.基于数据挖掘技术的财务实时控制系统研究[J】.财会月刊,2004.【l7】杨春华.数据挖掘OLAP在财务决策中的应用【J】.财会通讯,2002.[18】黄小原.神经网络预警系统[J】.预测,1995,第二期:28.31.【19】李延喜,李宁.财务实时控制系统的框架、内容和应用[D】.管理会计国际研讨论文集,2003.1l:1-2.【20】Michel,T.CombiningvalueandProjectmanagementintoaneffectiveProgrammerManagementmodel[J】.IntemationalJournalProjectManagement,2002(20):221—227.【2l】张雯.零售业上市公司业绩评价及成因分析[D】.浙江大学硕士学位论文,2007.04:6l 西安石油大学硕士学位论文Il—12.【22】陈英,徐力杰.现行财务分析指标体系的缺陷及其改[J].进农场经济管理,2004.【23】周纳.企业财务分析方法完善与发展【J】.经理人课堂,2005年.【24】万如荣.企业内部财务分析存在的若干问题[J】.航天工业管理,2005年.【25】王萍.基于数据挖掘技术的消费者行为研究【D】.吉林大学硕士学位论文,2004.09.【26】陈佐.时间序列相空间重构数据挖掘方法及其在证券市场中的应用【D】.湖南大学博士论文。2007.09.【27】安建华.数据挖掘技术在零售业中的应用研究【D】.东北财经大学硕士论文,2006.12.【28】吕橙,易艳红.数据挖掘在财务分析中应用的理性思考【J】.商场现代化,2006.06.【29】焦李成,刘芳等.智能数据挖掘与知识发现【M】.西安电子科技大学出版社,2006:10.【30】康晓东.基于数据仓库的数据挖掘技术【M】.北京:机械工业出版社,2004.【3l】薛惠锋,张文字等.智能数据挖掘技术【M】.西北工业大学出版社,2005.【32】梁循.数据挖掘算法与应用[M】.北京大学出版社,2006:16.【33】陈莉,焦李成.INTERNET数据挖掘研究现状阴.西安电子科技大学学报,2001:114.119.【34】章文波,陈红艳.实用数据统计分析及SPSSl2.0应用[M】.2006:179.181.【35】邵峰晶,于忠清.数据挖掘原理与算法【M】.中国水利水电出版社,13.15.【36】王晓燕,吴应清.数据挖掘技术分析及应用性评价【J】.办公自动化,2007.03.【37】何晓群.现代统计分析方法与应用【M】.中国人民大学出版社,1998.05.【38】章文波,陈红艳.实用数据统计分析及SPSSl2.0应用【M】.人民邮电出版社,2006:230.250.【39】单惟婷.公司财务分析【M】.上海财经大学出版社,2002.[40】滕宝红.哈佛模式——财务报表与财务分析【M】.港西迪商务出版公司,2003.【4l】葛家澍.财务会计理论、方法、准则探讨[M】.中国财政经济出版社,2002.【42】俞峰.企业财务诊断指标体系初探【J】.中国总会计师,2005年.【43】郭复初.现代财务理论研究【M】.北京:经济科学出版社,1999.【44】熊楚熊.财务报表分析原论【M】.上海:立信会计出版社,2000.[45】欧阳光中,项红周.财务报表分析【M】.上海复旦大学出版社,2000.【46】钱爱民,吴革.企业财务会计报告分析【M】.北京:中国金融出版社,2003.【47】刘妹威.上市公司虚假会计报表识别技术【M】.北京:经济科学出版社,2002.【48】章文波,陈红艳.实用数据统计分析及SPSSl2.0应用【M】.2006:179—181.【49】温素彬.财务状况综合评价的因子模型法【J】.淮海工学院学报,2001.06:68【50】叶剑,陈纪南.企业财务分析诊断的模糊数学模型啪.江苏理工大学学报,2001.62 参考文献【5l】瞿晓龙.企业财务诊断适用方法体系与软件模块设计[D】.南宁广西大学硕士论文,2004.08.【52】DavidWest,Neuralnetworkcreditscoringmodels,Computers&OperationsResearch,2000.27:113l—ll52。【53】袁广.基于模糊数学的财务分析指标体系设计【D】.中南大学硕士论文,2006.【54】张维群.数据挖掘研究和应用的现状与前景[J】.统计与信息论坛,2004. 西安石油大学硕士学位论文攻读学位期间发表的论文1.薛建楼.财务分析内容新解【J】.现代种业,第3期,2008年6月.2.赵选民,薛建楼.利用数据挖掘技术分析上市公司财务状况【J】.中国管理信息化,总第153期,2009年3月.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
大家都在看
近期热门
关闭