效用函数研究.doc

效用函数研究.doc

ID:59363547

大小:140.50 KB

页数:6页

时间:2020-01-29

效用函数研究.doc_第1页
效用函数研究.doc_第2页
效用函数研究.doc_第3页
效用函数研究.doc_第4页
效用函数研究.doc_第5页
资源描述:

《效用函数研究.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、效用函数研究报告003《一种TCP博弈模型的Nash均衡存在性分析与仿真》在TCP博弈中,当网络对任意流没有额外的处罚时,用户i的收益函数表示为:。Y为此时链路的资源使用率,,为用户i采取哪的策略时的效用,为链路上产生拥塞时.对分组的时延和丢弃所造成的拥塞成本。005《P2P环境中基于信号博弈论的资源定价机制》根据需求曲线和供给曲线的交点,即是均衡价格和均衡质量值.所以,可求出局部均衡价格,均衡质量,既均衡解为(,)。在确定信号传递模型时,从卖方以局部均衡价格作为出售价格来分析自身利益最大化的信号.局部均衡价格是卖方卖出资源的可能性最大的价格.所以,提供方在获得局部最优解后,根据自身的效用

2、最大选择质量信号,进行资源定价,卖方也可以根据均衡价格,适当的调低或调高定价,这由卖方的个人喜好而定,资源可靠性为t,信号量为s,在不考虑交易是否成功时的卖方的效用为由于交易并不一定成交,因此在信息不对称的环境下,交易是否成交和价格p,及信号量s的选择有关,假设成交的可能性与价格和信号量的关系为,式中k是常量.当交易成功时,节点获得的收益为u;不成功时获得的收益为0.由此。确立新的卖方效用函数008《一种基于博弈论的P2P内容分发协议》本文通过博弈论的机制来激励节点间进行协作,促使网络中彼此互为邻居的节点同时成为对方的内容下载者与上传者.把该系统建模成一个非协作博弈,博弈主体为接收服务器S

3、所分发数据包的所有节点.每个节点选择一种策略以决定自己如何执行博弈.数据包的下载收益和上传成本这两个因素是节点选择个人博弈策略的主要参考依据.其中,节点可以选择参加系统的协作(CA),贡献带宽和服务;或者不参加系统的协作(UCA),保持自私的行为.性能分析表明,最终每一个节点都不愿意独自偏离依照博弈理论所选定的协作策略即遵守本文设定的激励机制,达到对所有节点均最优的纳什均衡。收益值是节点所收到的分发数据包的数量的具体体现,可以表达成:上式中,Harvsti代表节点i加入系统m个回合后的总收益值,p为内容分发服务器s每回合所分发的数据包数量,Reit表示节点i在第t个回合所接收到数据包数.成

4、本值是节点所发送数据包的数量的具体体现,可以简单地表达成:上式中,Costi代表节点i加入系统m个回合后的总成本值,其他Se分别表示节点i在第t个回合所发送的内容包、谣言/请求包和惩罚包的数量。效用值的表达(0<<1)010《基于重复博弈和惩戒机制的P2P协作激励信誉模型》信誉机制加入到P2P网络后,节点间的博弈行为已不再是简单的单阶段博弈.假设节点将无法知道该博弈到何时终止,由博弈论知识可知,当局中人无法预知博弈终点时,该博弈将是一个无限重复的多阶段博弈.因此,P2P网络中节点交易便成为一种无限重复博弈节点在考虑本次交易所采取的策略时要考虑的标准是它在本阶段的预期收益值.由重复博弈理可知

5、,节点的预期收益是此次交易与所有后续交易中单阶段收益值的贴现值之和,即其中,δ为贴现因子,它可以看成一个节点对后续交易的耐心程度,其取值范围为0<δ<1.δ的值越大,说明节点对后继交易越有耐心;反之,节点越重视当前的交易,它的取值由P2P网络本身的各个因素决定;ui(k)为节点i在第k阶段的收益。020《基于博弈论框架的P2P激励模型》效用函数Ui用于刻画用户对于所得服务质量的以货币为度量的满意程度表现用户需求的异构性有了价值矩阵和差异服务概率函数就可以得到Pi的效用Ui第1项表示加入系统需要付出的代价第2项是可从系统得到的收益。定义无量纲ui,则-di表示Pi加入系统的代价它与Pi贡献的

6、硬盘空间或者带宽的资源成正比Pi的获益取决于其他Peer对系统的贡献dj和这些贡献对于Pi的价值(bij)以及Pi可能从该Peer下载文件的概率由P(0)=0和P()=1可知ui有两个极限可见无限增大贡献di并不能无限地提高效用ui直观地解释就是参与者贡献越大得到的服务质量就越好但是参与者从系统中得到总的收益并不是随着其贡献的增加无限增大的而是有一个最大值前提是有一系统临界值bc.当bi>bc时效用函数才有可能取到最大.024《基于混合战略博弈的P2P激励机制》文献中,把结点行为分为服务(serve)和不服务(don’tserve),两种行为的支付函数分别为:公式3-1公式3-2其中,U和

7、C是结点的效用函数和消耗函数,R是信誉值,由以下式给出公式3-3公式3-4是介于0到1的一个常量,其意义相当于贴现率。如果结点的混合战略Nash均衡为(p,l-p),即以P概率服务,以(1-p)概率拒绝服务,则根据等值法,占优混合战略中大于O分量的纯战略期望支付相等,有公式3-5将公式3-1至3-4代入公式3-5有p关于U、C、的函数关系:公式3-6032《对等网络中的搭便车行为分析与抑制机制综述》效用函数(utilit

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。