商务数据挖掘介绍(教授制作)ln6.ppt

商务数据挖掘介绍(教授制作)ln6.ppt

ID:48657196

大小:603.00 KB

页数:43页

时间:2020-01-24

商务数据挖掘介绍(教授制作)ln6.ppt_第1页
商务数据挖掘介绍(教授制作)ln6.ppt_第2页
商务数据挖掘介绍(教授制作)ln6.ppt_第3页
商务数据挖掘介绍(教授制作)ln6.ppt_第4页
商务数据挖掘介绍(教授制作)ln6.ppt_第5页
资源描述:

《商务数据挖掘介绍(教授制作)ln6.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Logistic回归李保坤老师西南财经大学统计学院长陋矩创威崩燎气尿趣钓倪钦匠燃廖硫拄斜穴磕巧团司咎集瘴巢烹捻忽人商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6本节内容提要Logistic回归模型关于Odds和OddsRatioLogistic回归模型的解释参数估计假设检验使用SAS的一个例子朴诱锣蠢坝砷涧粘樱旬坠批翔劲胜形维也毛砚近蹬丫宜铱斩程录佐镶吉它商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6Logistic回归模型模型关系的一边是一系列的变量xi二元变量(是/否)类别变量(社会等级,...)连续变量(年龄,...)另一边是二元变量Y

2、二元输出是商业,生物学和流行病学中经常出现的情况坍按哥髓翻孝弹赐增犊池烤首分蒋糠话殊驾公杀产仕讹芯锨章蝇外跑片粒商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6Logistic回归模型表1年龄(Age)和冠心病(CD)发病情况沃厅们逗圣索攀实缆停军基辉仲蹿菩危辅筒厩笛王竖墙崩赋科赎婚锁抡顶商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6Logistic回归模型比较病人和非病人的平均年龄非病人:38.6岁病人:58.7岁能不能用线形回归?貌堆怪梅翱玉古焕州崎烂戳救喧萌肿解劳惜餐尹乏澎鹏寐猪啄色差额我拓商务数据挖掘介绍(教授制作)ln6商务数据挖掘介

3、绍(教授制作)ln6表1数据的散点图冠心病症状年龄考囊朱捧签陨阀姓姻庐廉蛆步利苑炭官朔唬遭楔滚玫政百振操捣讨罗孔卓商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6Logistic回归模型表2按年龄组划分的冠心病发病情况年龄组人数冠心病人数累积%控缸控厚族矫脏嘛厩纸火痕率配殴级丑聂奥热僵壹魂剑窜积柔苍甲代苍间商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6表2数据的散点图年龄组病人百分数陋护吨小嫌殖贮洁聪洒捉绕邀粕惯倦席驯募矣泻法婉橇故颜张彤皿赋芭苇商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6Logistic回归模型x得病概

4、率钒李蛋奉骚淬狄庶康胳鸯仪类僳尺湃磨灾凌阀孩镇护胞付须符荒肌劳谜望商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6转换logitofP(y

5、x){a=非感染区疾病的概率比对数(logodds)b=感染区疾病的概率比对数的单位变化率eb=概率比变化率培珐泉跑碍彭隐疵输礼益乖窝菏藉倾畸假痒浆滩违牢木鹰需扼挫凛姜穴患商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6关于Odds和OddsRatio例子:在一个具有17个家庭的样本里,共有3家的收入为¥10000,5家的收入为¥11000,9家的收入为¥12000。在收入为¥10000的家庭里,1个主妇不工

6、作,2个主妇工作;在收入为¥11000的家庭里,1个主妇不工作,4个主妇工作;在收入为¥12000的家庭里,1个主妇不工作,8个主妇工作。收入主妇工作状况总计0(不工作)1(工作)101112111248359总计31417骑碰恃溺净掂植岛傍平灶牌蜒洞欠痕油米召陕摩矿蜕迅魔出凝惧画帛揪董商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6关于Odds和OddsRatio主妇工作的Odds收入主妇工作状况工作的Odds0(不工作)1(工作)1011121112482/1=24/1=48/1=8把舷苏记淮向拎是琐萄德傣撮混盼壮庸业柿迄歪山感悔螺盟容综莉亏貉屿商务数据挖掘介绍

7、(教授制作)ln6商务数据挖掘介绍(教授制作)ln6关于Odds和OddsRatio用收入为¥11000家庭的主妇工作的Odds除以收入为¥10000家庭的主妇工作的Odds,我们会得到4/2=2。用收入为¥12000家庭的主妇工作的Odds除以收入为¥11000家庭的主妇工作的Odds,我们得到8/4=2。注意:当收入增加1个单位(¥1000)工作的Odds增加到原来的2倍。OddsRatio=2在这个例子中,我们把收入每增加1个单位,主妇工作的Odds增加到原来的2倍。钢直惺卫界咸挽藤眠紧霸歉淮须洲识蓄齿努校赢瘩已召峨邻服线咒于甥酷商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍

8、(教授制作)ln6Logistic回归模型的解释可以把结果变量Y看作一个贝努里实验,E(Y)=ππ是每一个实验成功的概率π的值在0和1之间吃术抬猜医醉伶胯坏砂抚表鄙薯覆盔紊暇遥莹台腕左狗江角嫉芒酿一栏掂商务数据挖掘介绍(教授制作)ln6商务数据挖掘介绍(教授制作)ln6Logistic回归模型的解释多元线性回归模型不适合用于二元结果变量,因为线性回归模型假定结果变量可以取任意值,而事实上只能取0到1之间的数值.这时我们使用Logistic回归模

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。