基于metlab的多机器人围捕问题的研究

基于metlab的多机器人围捕问题的研究

ID:28160621

大小:68.50 KB

页数:4页

时间:2018-12-08

基于metlab的多机器人围捕问题的研究_第1页
基于metlab的多机器人围捕问题的研究_第2页
基于metlab的多机器人围捕问题的研究_第3页
基于metlab的多机器人围捕问题的研究_第4页
资源描述:

《基于metlab的多机器人围捕问题的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于Metlab的多机器人围捕问题的研宄王申色WANGYan(兰州职业技术学院,兰州730070)(LanzhouVocationalTechnicalCollege,Lanzhou730070,China)摘要:木文将追捕-逃跑问题按空间、时间离散化后转为一个对策模型,并利用Matlab软件,采用栅格建模的方法来模拟仿真环境,对四个追捕机器人追捕一个目标机器人的实例进行了仿真。通过仿真发现了该支付函数的缺陷。基于此原因,重新定义了局中人的支付函数,通过衰减因子滋,在追捕的不同阶段,根据追捕的只体情况灵活地调整距离影响系数和有效围系数的权重,从而提高了追捕的效率。Abstract:

2、Accordingtothediscretizationofspaceandthetime,thispapertransfersthepursuit-evasionproblemintoagamemodel,andusesMatlabsoftwareandgridmodelingmethodtosimulatesimulationenvironment,carriesonsimulationfortheinstanceoffour-pursuitrobotspursueagoal-robot.Thesimulationfoundthedefectsofpaymentfunction

3、.Basedonthisreason,thepaymentfunctionoftheplayersisredefined.Theweightofdistanceinfluencecoefficientandeffectivesurroundedcoefficientcanbeadjustedflexiblyaccordingtothespecificcircumstancesofthechasebytheattenuationfactor”滋"atdifferentstagesofthechase,andtheefficiencyofthepursuitisimproved.关键词

4、:机器人;对策论;追捕-逃跑问题Keywords:robot;gametheory;pursuit-evasionproblem中图分类号院TP242文献标识码院A文章编号院1006-4311(2014)20-0048-020引言多机器人围捕问题是多机器人系统研究中的一个典型问题。它的研究内容包括多机器人控制与协作、对抗策略、实吋动态路径规划以及冲突消解等问题。本文主要研宄的是多个追捕机器人围捕单个0标机器人的情况。研究的重点是追捕团队捕获单个目标机器人时的最优合作追捕策略。首先给出捕获成功的条件,第一个条件就是0标机器人周围的追捕机器人数量达到了捕获成功所规定数值。第二个条件就是

5、0标机器人己经无路可走了。因此,追捕团队完全可以看成是一种具有联合承诺的纯合作性质的团队[1】。1围捕问题对策模型的描述如果将追捕-逃跑双方的动态连续博弈行为按时间t离散化,追捕-逃跑问题就转化成为了一个对策模型。该对策模型具有2个局中人,一个是追捕机器人,一个是0标机器人。而且该对策模型是离散的动态模型。这样,每个吋刻机器人的行为动作决策就可转化为支付矩阵。通过求解支付矩阵,就可以得到最优的策略[2]。智能体集合是指追捕-逃跑问题中的所奋机器人的集合。它分为两大类,一类是追捕机器人,一类是B标机器人。因为追捕机器人团队是一个纯合作性质的团队,所以具冇追求集体利益的最人化的集体理性

6、。因此可以将整个追捕机器人团队看作是一个局中人。环境状态是指全所有机器人的位置信息,而动作集合是指机器人在吋刻t所能运动到的所冇相邻栅格的集合。式(3)中,sum滋i}是指追捕机器人能够控制的范围的总大小,茁是一个常数。由公式可以看出,有效包围系数使得所有追捕机器人更倾向于通过互相合作来围捕目标机器人。同样的道理,由于追捕机器人与B标机器人的B标是相互对立的,所以两者构成的是零和博弈[4】。2围捕问题的对策模型的改进在追逃对策模型中,追捕机器人选择策略的方法是排除法。这种基于悲观原则的保守做法很有可能导致如图1所示的围捕僵持的情况。图1中白色的扇形区域表示了该追捕机器人控制S标机器

7、人的方向范围。由图1可以看出,追捕机器人群体在进行围捕的过程中,由于有效包围系数k兹的存在,追捕机器人群体就有能力对B标机器人形成包围圈,也就是说,追捕机器人群体已经将目标机器人限制在一个固定区域内。但是,基于悲观原则的追捕机器人都不会心存侥幸的采用冒险的策略,这就导致了一种僵持的情况,如图1所示。在原来的对策模型中,定义支付函数卜0〖=棕dks·棕兹k兹,其中棕d、棕兹皆为固定值,在这里,对支付函数hDt进行修改,使其随着吋间的延长而变化,对支付函数重

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。