随机森林个人信用风险评估研究.doc

随机森林个人信用风险评估研究.doc

ID:61742910

大小:34.50 KB

页数:7页

时间:2021-03-16

随机森林个人信用风险评估研究.doc_第1页
随机森林个人信用风险评估研究.doc_第2页
随机森林个人信用风险评估研究.doc_第3页
随机森林个人信用风险评估研究.doc_第4页
随机森林个人信用风险评估研究.doc_第5页
资源描述:

《随机森林个人信用风险评估研究.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、随机森林个人信用风险评估研究一、文献综述7学海无涯随机森林个人信用风险评估研究一、文献综述7学海无涯随机森林个人信用风险评估研究一、文献综述7学海无涯近年来,随着消费金融市场的迅速发展,越来越多的消费金融机构涌入,以蚂蚁花呗、借呗、京东白条为代表的消费金融服务盛行。从受众群体来看,消费贷款的发放对象是个人,还款来源主要为工资、奖金、投资收益、生产经营性收入等。这些来源易受多种外部因素影响,包括宏观经济变化、所在企业经营状况、个人健康及意外等。与此同时,与企业相比个人的流动性和不确定性更高,借款人还款行为易受个体思

2、想观念、态度、行为习惯等主观因素的影响。因此,个人信用风险成为风控的核心,如何把各借款人纷繁复杂的信息数据映射成其自身详细的信用水平成为这一行业亟待解决的问题。在个人信用风险评估领域,国内外的研究主要集中在个人信用风险的指标选取和个人信用风险评估方法及模型构建两个方面,后者居多。信用风险指标的选取,主要基于传统信贷的指标选择和基于消费场景多样性对指标体系的补充优化。BillFair和Earllsaac(2015)提出的FICO信用分模型是个人信用评估领域最早且在银行使用最广泛的。FICO模型根据违约风险来计算客户

3、的信誉,它所选用的指标主要有五类:信用偿还历史、信用账户数、使用信用的年限、正在使用的信用类型以及新开立的信用账户[1]。MariolaChrzanowska(2008)以一家在波兰经营的外资银行中的个人客户贷款为例,通过单一和集成的方法,发现“已偿还贷款的份额”是体现个人信用等级最重要的指标[2]。龙新庭、王晓华(2013)指出德国国际项目咨询IPC公司通过客户的信用历史、贷款申请书信息、个人声誉等方面综合评估其还款意愿[3]。消费场景的多样性使得实践中基于互联网的个人信用风险指标在构成上与传统的金融机构有所不

4、同,在其基础上更多地获取关于个人生活消费的指标。国内首个个人信用评分——阿里巴巴芝麻信用分的评分标准主要由五部分组成:信用历史(35%)、行为偏好(25%)、履约能力(20%)、身份特征(15%)和人脉关系(5%)[4]。不同于阿里巴巴的是,京东与腾讯达成深度合作,将自身的电商数据和腾讯的社交数据结合,所以京东白条能更精确地把握用户的信用信息[5]。信用风险评估方法的实质是将一个数据样本总体按不同特征分为若干组的方法,个人信用评估模型构建主要包括统计和非统计方法。统计方法主要包括判别分析法、Logistic回归、

5、K近邻判别分析法等。何晓群等(2015)认为信用风险评估模型是金融机构开展信贷工作的核心,模型结果则是信用评级的依据来源[6]。李萌(2005)将不良贷款率、T检验、主成分分析相结合,基于Logistic回归建立判断信用风险的评估模型[7]。姚路(2017)在对个人基本信息、信贷担保交易信息等认知的基础上建立多元线性回归模型,间接地对信息主体进行信用评价[8]。姜明辉等(2004)通过确定相应的评估指标体系,建立了基于K近邻判别分析法的个人信用评估模型,并对模型应用中需要注意的问题进行了分析[9]。基于统计方法的

6、信用风险评估模型需要对样本数据进行严格的假设,如线性关系、正态分布等,这些都在一定程度上影响模型的适用性及使用效果[10]。非统计方法主要包括依托计算机技术的人工智能方法,以人工神经网络(ANN)、支持向量机(SVM)、决策树(DT)和随机森林(RF)著名。HussainAliBekhet(2014)设计了两种信用评分模型,并采用人工神经网络方法为约旦商业银行贷款决策提供技术支持,证实人工神经网络的应用将改善信贷决策效率,帮助金融机构节省分析时间和成本[11]。TonyBellottti和JonathanCroo

7、k(2008)运用大型信用卡数据库的信息,将支持向量机与Logistic回归等传统方法进行对比研究,表明支持向量机更具竞争力,还可用作特征选择方法来分辨出决定违约风险大小最重要的特征[12]。姚潇和余乐安(2012)将模糊隶属度引入支持向量机进行实证研究,结论表明模糊近似支持向量机能够显著地提高信用风险分类精度[13]。庞素琳和巩吉璋(2009)以德国银行个人信贷数据为样本,采用C5.0算法(DT模型的一种)构建信用评估模型,并使用了Boosting算法技术提升模型对样本数据的拟合度,最后通过参数调节进一步提高分

8、类精确率[14]。GasparCano等(2017)对不同的数据集用RF算法进行特征选择并用其对数据集分类,结果表明由RF选出相关变量并据此进行分类的性能效果比SVM和ANN更具优势[15]。戴昕琦(2018)把更加适合处理不平衡数据的SMOTE算法改进,再与RF模型结合运用于供应链金融信用风险管理研究中,发现C-SMOTE-RF模型在很大程度上减少了银行的“取伪”概率,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。