基于信念学习模型的虚拟博弈实验研究

基于信念学习模型的虚拟博弈实验研究

ID:27504203

大小:52.00 KB

页数:5页

时间:2018-12-04

基于信念学习模型的虚拟博弈实验研究_第1页
基于信念学习模型的虚拟博弈实验研究_第2页
基于信念学习模型的虚拟博弈实验研究_第3页
基于信念学习模型的虚拟博弈实验研究_第4页
基于信念学习模型的虚拟博弈实验研究_第5页
资源描述:

《基于信念学习模型的虚拟博弈实验研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于信念学习模型的虚拟博弈实验研究摘要:信念学习模型是博弈论的一个前沿热点问题,当前研究多数处于初始阶段,国内鲜少有实验验证该模型。文章将教学问答环节进行博弈化设计,对虚拟博弈信念学习模型进行验证,实验数据分析显示:模型收敛于均衡策略。实验证明了信念学习模型的有效性,并对今后构建该类模型提出有益的建议。中国3/vie  关键词:信念学习实验经济学虚拟博弈  中图分类号:F240文献标识码:A  :1004-4914(2016)09-247-03  一、引言  随着博弈论在各门学科中的广泛使用,个体行为选择在学习中的作用也不断被学者们研究。North(1996)将心理学中个体的认

2、知系统引入到经济模型中,有效解释了决策中信念及偏好的关系,并将两者融合为理性决策的基础,由此得出结论:信念是个人行为的准则,它是影响个人行为选择的重要因素。他人的认知、行动和信念是构建有用模型的先决条件。  随着重复博弈研究的不断加深,经济学家逐步重视学习信念行为,用以解释当重复整个博弈时行为往往变得更为理性的原因。随着实验经济学家对个体在重复博弈中的学习过程进行研究,信念的形成归纳为:自身学习以及外界互动。自身学习指自身经历不断强化使某种行为发生的概率上升,外界互动指通过观察别人行为的收益情况进而指导自身行为决策。在此基础上,ColinF.Camerer(2003)将信念学习

3、模型定义为:“假设参与者根据过去的事件来更新他们认为别人会如何行动的信念,从而根据这些信念来决定哪种策略是最优的。”信念学习模型大致分为三类:信念学习模型,强化学习模型,经历-加权吸引模型(章平,2006)。  信念学习模型以FundenbergandLevine(1998)和CheungandFriedman(1997)的虚拟博弈模型为代表,该理论的基础是:参与人通过观察其他参与人在过去各期内采取的行动概率,由此做出自身预期收益最大化概率的行为。信念学习模型强调参与者始终牢记其他参与者以前的所有行动,并且还要求参与者对每一期对手过去的行动赋予相等的权重,以此来决定自己本轮的行

4、为策略。该模型的观测经历主要来源于其他参与人过去的经历,即外界互动。强化学习模型以Bush-MostellerModle(1997)为代表,该理论基础是:心理学认为一旦一种行动得到了奖赏,那么个人在未来继续做出该行动的概率上升。如果是惩罚则未来做出该行动的概率下降。强化学习模型不强调参与者形成有关其他参与者可能行动的信念,因为参与者更关注自己过往行为的奖赏和惩罚,该模型的观测经历主要来源是自身经历,即自身学习。经历-加权吸引模型以CamererandTeckHo(1999)的Experience-odle为代表,将强化学习模型和信念学习模型相结合,通过将自身奖惩和观察其他参与者

5、的支付情况赋予不同的权重,拟合为吸引力指标,参与者对吸引力越敏感采取该行动的概率越大。  综上,本文通过对教学提问环节进行博弈化设计对信念学习模型进行研究,检验在重复博弈下该模型是否有效?探讨行为博弈、信念形成及制度设计方面的相互关系。  二、理论模型  在序贯二元决策场景的重复博弈下,通常假设对手的行动集合为C(c1,c2・・・ci・・・ck),在t轮博弈之中,参与者对于其他参与者选择行动ci所赋予的信念权重不断更新为:  bt(ci)=bt-1(ci)+1在t期对手选择行动ci,信念权重相应的增加1bt-1(ci)在t期对手选择行动ci,信念权重相应的增加1  则在t期,参

6、与者形成的其对手选择行动ci的概率与信念权重之间的关系:  μt(ci)=  在给定其他参与者选择各种行动的概率的信念下,参与者计算出自己可供选择的每一个纯策略ai(参与者的策略空间为A)的期望支付π(ai/μt),则参与者在t+1期选择纯策略ai的概率为:  P=  同样地,参与者选择具有最大概率值的策略为自己的最优响应。  三、实验设计和实施  (一)实验设计  实验在教学提问环节进行博弈化设计的背景下,通过多次重复博弈使本次回答问题的学生在充分了解其他参与者(之前回答问题的学生)的支付、以及对手(教师)的行动基础上,来决定自己本轮的行为策略。  所谓教学提问环节的博弈化设

7、计是指:将每次课堂提问作为一次博弈局,博弈的参与者是老师和学生,由于课堂提问内容和教学内容息息相关,两个参与者都能够充分掌握背景信息,信息对于两者来说是充分的。实验的行动是教师让学生起来回答问题,教师根据学生的回答质量,依据公开透明量化的考核标准对学生回答进行打分。该分数作为学生的支付,最终体现在期末成绩中占有一定权重。为保证博弈的公平性、有效性,实验过程采用摇号的方式随机选取同学起来回答问题。即,在课堂提问出来之后,教师和学生都不知道谁将起来回答问题。本实验中的行动次序固定为教师先提问然后

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。