基于遗传算法的子空间分类研究及其在个人信用评估中的应用

基于遗传算法的子空间分类研究及其在个人信用评估中的应用

ID:12606412

大小:371.35 KB

页数:51页

时间:2018-07-18

基于遗传算法的子空间分类研究及其在个人信用评估中的应用_第1页
基于遗传算法的子空间分类研究及其在个人信用评估中的应用_第2页
基于遗传算法的子空间分类研究及其在个人信用评估中的应用_第3页
基于遗传算法的子空间分类研究及其在个人信用评估中的应用_第4页
基于遗传算法的子空间分类研究及其在个人信用评估中的应用_第5页
资源描述:

《基于遗传算法的子空间分类研究及其在个人信用评估中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于遗传算法的子空间分类研究及其在个人信用评估中的应用ResearchonGA-basedsubspaceclassificationanditsapplicationtopersonalcreditevaluation学科专业:信息管理与信息系统研究生:蒋华荣指导教师:李敏强教授田津副教授天津大学管理与经济学部学院二零一三年十一月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究

2、所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名:签字日期:年月日我是爱天大的!!学位论文版权使用授权书本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日摘要随着信息技术的发展,银行在个人信用风险评估中面临大规模高维复杂数据的分析和处理,如何通过贷款用

3、户的个人信息、信用记录、历史消费记录等,建立风险等级分类模型,已成为构建个人信用风险评估体系的关键。基于大规模数据分析和建模,时间和空间开销较大,算法效率较低,且建立的模型较复杂。此外,随着数据维度的增加,空间中的数据点越来越稀疏,数据点间距离差异越来越小,可能导致许多基于距离的度量方法失效;且众多属性中可能包含大量无关甚至是噪声的属性,则将直接影响模型的准确率。针对以上问题,本文提出了一种基于遗传算法(GeneticAlgorithm,GA)的SVM子空间分类算法。该算法首先改进样本选择策略,采用基于置信度和凸包的样本选择方法,同时考虑类间距离和样本分布等因素,选择典型代表样本作

4、为SVM的新训练集。然后利用GA进行子空间优化,采用矩阵式混合编码方式,一并获得较小的代表样本特征子空间和较优的SVM分类参数,并根据特征优化后的代表样本,构建SVM分类模型。在UCI的10个数据集上进行的仿真实验结果验证该算法在大部分数据集上均可获得较小的样本规模和特征维数,以及较高的分类精度。此外在典型信用风险评估数据集上的实验验证了该算法在个人信用评估方面具有较好的分类性能,并且可以同时确定对提高分类精度贡献较大的属性。关键词:子空间分类,支持向量机,遗传算法,样本选择,个人信用评估ABSTRACTWiththedevelopmentofinformationtechnolo

5、gy,thebankfacestheproblemofanalyzingandprocessinglarge-scale,high-dimensionalcomplexdatainthepersonalcreditriskassessment.Itiscrucialforpersonalcreditriskassessmentsystemtoestablishagoodriskgradeclassificationmodelbasedontheusers’personalinformation,creditrecordsandconsumptionrecords.However,m

6、odelingbasedonmassivedataneedsmuchtimeandmemory,andtheclassificationmodelisusuallycomplexandlessefficient.Furthermore,datapointsinthesamplespacebecomemuchsparserwhenthefeaturesizeofsampleisincreased,whichresultsintheinvalidationofmanymeasurementmethodsbasedondistance.Inaddition,manyofthesefeat

7、uresareeitherredundantorirrelevanttotheclassificationtargetandmightaffecttheperformanceofthemodel.Tosolveaboveproblems,thisthesispresentsanewGeneticalgorithm-basedSubspaceclassificationalgorithmforSVM(GS-SVM).Amodifiedsampleselectionmet

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。