马尔科夫决策解决方案

马尔科夫决策解决方案

ID:17193398

大小:28.59 KB

页数:19页

时间:2018-08-28

马尔科夫决策解决方案_第1页
马尔科夫决策解决方案_第2页
马尔科夫决策解决方案_第3页
马尔科夫决策解决方案_第4页
马尔科夫决策解决方案_第5页
资源描述:

《马尔科夫决策解决方案》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、马尔科夫决策解决方案  篇一:马尔可夫决策过程模型  3。马尔可夫决策过程模型  本节介绍了MDP模型来确定相互制约的服务商到客户系统调度策略,分配区分服务器优先级的客户。医药科学的MDP模型作为一个线性规划模型,以至于考虑与约束不可以添加扩展马尔可夫状态空间,从而允许有效的线性规划算法标识最佳相互制约政策。消费者要求达到的服务(病人),都有一个关联的位置和分为高优先级(H)或低优先级(L)。服务器救护车所分化他们的答复和服务时间。我们可以捕捉时间从一个服务器是派去当它到达现场,捕捉的总时间和服务时间为客户服务,包括响应客户时间,对待客户现场,运输一个客户去医院,并返回到服务。目标是

2、确定哪些服务器调度到达客户最大化平均水平.总奖励每阶段给予最低标准股本。回复一个电话的奖励是解释作为高优先级客户的可能性是对一个固定的时间内一个RTT目标函数已经成为最好的效率的性能的措施,在EMS系统(McLay和马约加XX)。在模型中,客户根据到达泊松过程的速度。当一个客户到达时,其位置和优先级评估,和一家派往它可用的服务器。的模型使得几个假设:  1.如果客户和服务器可用,到达服务器必须派遣。  2。只有服务器-服务器位于他们家庭基站可以被派往客户。  3。一个服务器分配给每个客户。  4。然后服务器返回服务客户。  5。服务时间不依赖于客户优先权和指数分布。  6。有一个零长

3、度队列为客户。  我们将讨论如何修改模型  电梯的假设和假设一个强大的影响产生的政策。需要服务器被派往客户如果服务器是可用非理想的政策合理,因为这里的模型是出于EMS体系中,为所有客户提供服务是一个主要的公共服务系统的目标。此外,由于担忧的责任,而不是保留是一种能力,嵌入在EMS调度和政策实践,约束的服务提供者。为了简单起见,所有服务器维修后返回本国驻地客户,当他们说为其他客户服务可用,服务器不能动态改航。在实践中,服务器可以从以外的地点派遣他们家电台,当服务器完整的服务。以允许救护车被派遣本国驻地以外的位置,可以扩大到包括状态空间辅助服务器的位置相对应服务器完成服务(见的讨论状态空

4、间)。同样地,可以将状态空间扩大到包括辅助客户地点,对应一个服务器是谁前往客户允许服务器动态改航,直到它到达服务客户和位置,相对应的服务器正在接近尾声与另一个客户的服务。关于第五假设,尽管它将琐碎包含服务时间依赖于客户优先级,指数提升,因为我们假设是更难了必须扩大状态方程考虑non-Markov模型。我们承认这是一个强烈的假设。  队列长度为零的假设需要更深一层的讨论。请注意,客户只是失去当所有的服务器很忙,因此每种类型的客户丢失的速度相同进入系统。从温顺的角度看来,顾客队列的状态模型变得难以管理和调度,政策可能取决于客户的设置队列中。我们认为,长度为零的假设  篇二:马尔可夫决策规

5、划2  马尔可夫决策规划  第二讲马尔可夫链与马尔可夫过程  马尔可夫链  为书写方便,下面用X表示随机变量(ξ)。  定义:随机变量序列{Xn,n=0,1,2,......}称为是一个马尔科夫(Markov)链,如果等式p{Xm+k=j

6、Xm=i,XkL=iL,......,Xk2=i2,Xk1=i1}=p{Xm+k=j

7、Xm=i}对任意整数k、L、m以及非负整数m>kL>…k2>k1均成立。其中,  Xm=i表示马尔科夫链在第m步(时刻m)位于状态i,状态i的集合S称为状态空间;  p(k)ij(m)=p{Xm+k=j

8、Xm=i}称为在时刻m位于状态i经k步转移到达状态j的k步转

9、移概率,而pij(m)=p(1)ij(m)称为时刻m的1步转移概率;  P(k)(m)=(p(k)ij(m))称为时刻m的k步转移概率矩阵,而P(m)=(p(1)ij(m))=(pij(m))称为时刻m的1步转移概率矩阵。  Markov满足的K-C方程如下:  A.P(k)(m)=P(l)(m)P(k-l)(m+l),其中0≤l≤k约定:P(0)(m)=I  m?k?1  (k)  (m)?  ?P?i?  i?m  m?1i?m  约定:?P?i??I  定义:马尔科夫链{Xn,n=0,1,2,......}称为是齐次的,是指它在时刻m的1步转移概率矩阵P(m)与m无关,它等价于

10、P(k)(m)与m无关。其中,  P(k)=(p(k)ij)称为齐次马氏链的k步转移概率矩阵,而P=(pij)称为齐次马氏链的1步转移概率矩阵。相应地有,  A.K-C方程:P(k)=P(l)P(k-l),其中0≤l≤kB.P(k)=Pk  C.马尔科夫链的概率分布:设{Xn,n=0,1,2,......}为一马尔科夫链,X0的分布列(初始分布)为q0(约定马尔科夫链的概率分布列为行向量),记qn为Xn的分布列或Markov链在时刻n的瞬时分布列,{P(n

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。