个人信用评价影响因素决策分析.pdf

个人信用评价影响因素决策分析.pdf

ID:53024179

大小:276.57 KB

页数:4页

时间:2020-04-12

个人信用评价影响因素决策分析.pdf_第1页
个人信用评价影响因素决策分析.pdf_第2页
个人信用评价影响因素决策分析.pdf_第3页
个人信用评价影响因素决策分析.pdf_第4页
资源描述:

《个人信用评价影响因素决策分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、●2015年第2期征信No.22O15总第193期CREDITREFERENCEserialNO.193【理论研究】个人信用评价影响因素决策分析何晓群,胡小宁(1.西京学院应用统计科学研究中心,陕西西安7101232.中国人民大学应用统计科学研究中心,北京100872)摘要:Logistic模型是个人信用评价分析时常用的模型。基于具体的个人信贷数据,利用RandomOversampling方法克服了数据不平衡性带来的问题,通过共线性诊断后,建立了标准化的logistic回归模型。根据标准化回归系数,计算

2、出决策系数,得出个人特征对信用评价影响大小的顺序。关键词:个人信用评价;logistic模型;不平衡数据;决策分析中图分类号:F832.2文献标识码:A文章编号:1674—747X(2015)02-0011—04一、引言二、数据及预处理个人消费信贷在我国迅速发展,对拉动经济增(一)数据来源长起到了一定的促进作用。但其中也隐藏着很大的本文数据选用的是德国某银行的个人信贷数据潜在风险,即信贷资产不能及时有效地收回。因此,集合]。该数据集中有1000条记录,21个字段。亟须建立完善的个人信用体系,使得商业银行

3、在放其中前20个字段为信贷申请人的个人特征描述(表贷前就能够对贷款申请人的信用做出有效的评估,1),最后1个字段是银行对客户信用级别的定义:0从而降低信贷风险。通过建立数学模型,对申请人为“差客户”,1为“好客户”。数据集中信用差客户的信用进行预测,是常用的一种信用评价方法。目与好客户的数量比为3:7。在信用“差客户”和“好前广泛应用的方法主要有两大类:统计分析方法和客户”中分别随机抽取80%用以建立模型,剩余机器学习方法-lJ。当然,也有学者将多种方法加权20%用来验证。组合进行预测【2J。机器学习方

4、法虽然预测精度较(二)共线性检测高,但稳健性差,且建模过程基本上是一个“黑箱”,拟合logistic模型时,与多元线性回归一样,对模型的解释性不强;统计分析方法则在稳健性和模自变量中存在多元共线性很敏感[6圳。在建立模型型可解释性上有其自身的优势。统计分析方法中,前,首先对数据做共线性诊断,结果(表2)可见,最学者最关注的是logistic模型,其计算简单、预测精大的VIF值为2.299,表明共线性不明显。度高、模型解释能力强J。国内外许多学者对个人(三)数据不平衡处理信用评价方法进行了许多有益的探讨,

5、但对信用评当数据存在不平衡问题时,稀有类的识别率远价影响因素的讨论并不多见。本文将通过logistic远低于大类,使得分析结果具有很大的偏向性J。模型,对影响个人信用评价的因素进行探讨。个人信用评价将信贷申请人评判为“差客户”和“好收稿日期:2014—12—02基金项目:国家社科基金项目(13BTJ004)作者简介:何晓群(1954一),男,陕西西安人,西京学院特聘教授,西京学院应用统计科学研究中心主任,中国人民大学统计学院教授,博士生导师,主要研究方向为统计模型、多元统计分析、六西格玛管理;胡小宁(1

6、986一),男,河南濮阳人,中国人民大学统计学院博士研究生,主要研究方向为应用数理统计。【理论研究】何晓群,胡小宁个人信用评价影响因素决策分析表1个人信贷数据集字段信息g一2·2¨+0·6541—0·ol2变量字段名称变量字段名称+0.359x3—0.O0009x5十0.15x6l现有账户额Xl1目前住址居住时间+0.197x7—0.314x8+0.397x9X2信贷期限XI2资产信贷历史记录XI3年龄—0.166xl2+0.O16x13+0.309x14X4贷款目的X14其他分期付款计划—1.326x

7、20X5贷款金额X[5住房Logistic模型中因变量为log(P/(1一P)),即X6储蓄存款账户额X16本银行信贷记录数’现任工作时间X

8、7工作logit(对数发生比),P为信贷申请人被判别为1(即分期付款金额占X8可支配收入的比率XI8法律规定抚养人数“好客户”)的概率。当logit增大时,P值也相应地增加,即判别为“好客户”的概率加大。对logistic回X9个人身份和性别X19电话注册归系数进行解释时,logit的概念不容易理解,因此通10其他债务人/保证人X20是否外国籍常将logistic

9、模型按照事件发生比(odds,是事件发生表2共线性诊断频数与不发生频数之间的比,即判别为“好客户”与“差客户”的比值)改写为:变量VIF变量VIF11.1061I1.168odds==HX21.945X121.365X31.177XI31.362这样,各项作用之间不再是加法关系,而是乘法关d1.107141.066系,可以解释为:当其他解释变量不变时,增加52.299XI51.341一个单位,发生比所变化的倍数J。当为正值时,X61.098

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。