类别数据分析第三讲.doc

类别数据分析第三讲.doc

ID:58832247

大小:272.50 KB

页数:31页

时间:2020-09-24

类别数据分析第三讲.doc_第1页
类别数据分析第三讲.doc_第2页
类别数据分析第三讲.doc_第3页
类别数据分析第三讲.doc_第4页
类别数据分析第三讲.doc_第5页
资源描述:

《类别数据分析第三讲.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、I.一般线性模型简介(GeneralizedLinearModels或GLM)一般线性模型GLMs是将回归方程扩展到非常态分布或非线性的样本的一种统计方法。●一般线性模型GLMs的三个要素■随机要素(randomcomponent):假设被指定为应变量Y的随机变量是属于某一种特定的概率分布型态。■系统要素(systematiccomponent):在方程式的右侧设定一组解释变量,属于线性的预测变量:.■连结函数(linkfunction):设定随机要素与系统要素之间的统计关系,也就是将μ=E(Y)透过方程式连结到解释变量上。●一般线性模

2、型GLMs的某些特殊型态■最小二乘法OLS模型随机要素:常态分布与固定标准误的连续变量系统要素:连结函数:g(μ)=μ■logit模型随机要素:Y=1or0,呈二项分布(binomialdistribution).系统要素:连结函数:g(μ)=log[μ/(1-μ)][logit]■泊松回归模型(PoissonRegression)随机要素:泊松分布(Poissondistribution)下的次数频率(countfrequency)系统要素:连结函数:g(μ)=log(μ)在列联表(contingencytables)里的数据也是次数

3、频率,因此,Loglinear模型在一般线性模型GLMs的架构下,实际上是泊松回归的一种。总之,一般线性模型GLMs提供了一种包含了大多数连续与离散变量重要模型的统整模式。●最大可能性(似然)估计(MaximumLikelihoodEstimation或MLE)此一估计所得的参数值与所观察到的数值最为一致:也就是说,运用最大似然法所估计出的参数发生的概率,将比其它的数字发生的概率更大。步骤一:决定一个说明未知参数概率的函数(似然函数likelihoodfunction)。步骤二:找出此一未知参数的观察值,使得此一似然函数达到最大值。例子

4、:运用二项公式(binomialformula)来计算十个被观察对象当中出现四位女性的概率。女性在总体当中出现的实际概率是½.因此可得:现在假设我们不知道总体当中的女性所占比例(π),但是我们的十个观察值当中确实有四位女性,我们由这个样本当中得到总体最可能的π值为何?最大可能性估计MLE,就是推估一个总体的参数值,来使得观察值最可能发生。上述的似然函数就是:数学上,我们希望找出的是参数值p来达到这个似然函数L的最大值,此时p即是π的估计值。在大样本的条件下,最大可能性的估计值会具有下列三个良好的统计性质:i)最有效率(变异的极小化min

5、imumvariance)ii)当样本数增加时,其统计偏误会不断缩小。iii)其分配型态渐近于随机抽样分布。当总体属于随机分布时,对总体平均值的最大可能性估计即是样本的平均值,在满足此一条件下,最小二乘法OLS估计正等于是最大可能性估计MLE(PowersandXieAppendixB)。II.二分法(Binary)Logit模型1.发生比Odds与发生比率OddsRatio(Agrestip.268-270):在处理二分法的变量时,发生比Odds就等于某事件发生的概率除以未发生的概率。此处的p是指事件发生的概率,(1-p)就是事件不发

6、生或失败的概率。因此,我们也可以用发生比Odds倒算出概率:发生比Odds与概率Probability之间的关系概率Probability发生比Odds.10.11.25.33.501.00.753.00.909.00发生比率(Oddsratio)是用来估计不同群体之间事件发生概率的相对比例。同一个事件的概率,用发生比之间的关系来表达就是:让我们参考实际的例子:1996年全国统计数据中有6090个有效样本,依据性别与党员资格来划分,可以得到下列的次数分配表:.tabpartysexcurrent

7、party

8、sexofresponden

9、tmember?

10、MaleFemale

11、Total-----------+----------------------+----------Yes

12、547162

13、709No

14、2,5412,840

15、5,381-----------+----------------------+----------Total

16、3,0883,002

17、6,090男性成为党员的发生比是多少?女性成为党员的发生比是多少?男性对女性成为党员的发生比率又是多少?.tabnsize14partysizeof

18、placeof

19、residence

20、currentpartym

21、ember?at14

22、YesNo

23、Total-----------+----------------------+----------Village

24、3883,697

25、4,085Township

26、51352

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。