应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:

应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:

ID:47533113

大小:142.50 KB

页数:5页

时间:2020-01-13

应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:_第1页
应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:_第2页
应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:_第3页
应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:_第4页
应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:_第5页
资源描述:

《应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、《统计计算》案例1,吕晓玲应用潜在分类泊松回归模型及EM算法分析陈述偏好数据:以网络购物使用次数为例1.问题提出随着网络的兴起,网上购物已经在人们的生活中发挥着越来越重要的作用。网上购物以其方便快捷等特点吸引了很多购物者,但是也有一些人质疑网上购物安全性、不可触摸性等问题。影响人们选择网上购物的因素有很多,不同的人对网上购物也有不同的态度。大学生是网络购物这个群体的很重要的一部分,什么因素影响大学生对网络购物的选择?大学生由于对网络购物的态度取向不同可分为多少潜在的类别?本文应用陈述偏好方法(statedpreferencemethod)收集大学生网上购物的数据,并

2、应用潜在分类泊松回归模型(latentclassPoissonregressionmodel)及EM算法分析数据,回答以上两个问题。2.数据收集源于心理学的陈述偏好调查已经被市场营销中研究消费者行为广泛应用。虽然在进行每个具体研究时操作不尽相同,总的原则是事先设定几个重要因素,每个因素有若干水平,然后提出一些假想情景,每个情景是这些因素不同水平的组合。受访者按照他们的喜好给不同的情景打分或者排序。研究者应用模型分析数据,寻找各因素的重要性。为了确定影响网络购物的重要因素,我们首先开展了预调查,针对购买商品的种类、价格、邮费、卖家信用度、介绍商品详细程度以及网上购物节

3、省时间和到货时间等因素对大学生进行了调查,并应用简单统计分析得到了对网上购物次数影响比较显著的四个因素,分别是购买商品的种类、价格、卖家信誉度以及介绍商品的详细程度。具体因素和因素水平如下所示:种类:服饰,化妆品,文体价格:50元,100元,150元,200元,250元卖家或网站的信誉度:1,2,3,4,5介绍商品的详细程度:1,2,3,4,5若每一种组合都进行调查则共有组合,在这里运用了正交设计的方法进行试验设计,共进行75种不同的组合,将这75种组合分成25组,每组中包含3个场景(分别为3个不同的种类),每一个被调查者将被给定3个不同的场景。每个被调查者回答的问

4、题是在特定的场景能够在十次购物中选择网上购物的可能次数。我们总共访问了197名在京大学生,得到了在588种场景下他们对网络购物的使用情况的有效回答。3.模型介绍市场营销中常用的分析陈述偏好数据的方法是联合分析(conjointanalysis),我们这里使用泊松回归模型,因为:(1)因变量不是受访者对场景的排序,而是使用网络购物的次数,它是一个取值为离散整数的变量,可以假设服从泊松分布;(2)可以对泊松回归模型进一步应用潜在分类模型分析受访者的异质性。我们首先介绍泊松回归模型和潜在分类模型,然后介绍如何应用最大似然法和EM算法估计参数。令为第()个个体在面临第()种

5、场景时的选择,服从参数为的泊松分布。因为从平均的意义上来讲,取值越大意味着受访者越倾向于多次使用5网络购物,所以可理解为该场景的效用(utility),它是这个场景各因素水平和受访者个人特征的函数:,其中:是维协变量,是参数,体现了受访者对协变量变化的反映,如果假设它是常数,则表明受访者是同质的(Homogeneity),但我们知道,不同受访者对不同的协变量的重要程度看法是不一样的,也就是说人群有异质性(Heterogeneity),处理这种问题的办法是假设为一个随机变量,服从概率分布。这里我们可以假设为一个连续的多元密度函数,但由于无法判定哪种形式以及在参数估计的

6、时候很难计算多维积分,所以一般来说我们不采取这种方式,取而代之的是假设是一个离散的多元分布,取值为,相应的概率密度是,的大小以及和的取值均由数据估计得到。我们称这种方法为潜在分类模型或者离散随机系数模型(discreterandom-coefficientmodel)。在上述模型假定下,我们知道第个个体在面临第种场景时,给定参数取值为时,泊松分布的参数。则第个个体的无条件概率密度为:(1)如果使用最大似然法估计参数,样本的似然函数可以写成:(2)4.估计方法可以看到似然函数的形式很复杂,即使使用数值算法,也不容易找到全局最优的最大似然估计。这里我们使用EM算法。引入

7、缺失变量:(3)假定,的分布为独立同分布,密度函数是,则,其中,。完全对数似然函数可写成:(4)(5)5其中,应用EM算法,首先给定初始参数估计值。之后的迭代()过程中,E步就是在给定观测数据和参数估计的情况下,对完全对数似然函数以的分布求期望,因为(5)中完全对数似然函数是的线性函数,所以它的期望也是期望的线性函数。为了求给定观测数据和参数估计的条件期望,我们需要寻找它的条件分布。因为,,所以。则的条件期望是:(6)所以在E步得到的完全对数似然函数的期望是:(7)M步即是最大化(7)式得到更新的。可以看到(7)式右侧第一项仅与有关,并且和式的每一项与一个s对应

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。