博弈树的搜索

博弈树的搜索

ID:45658140

大小:176.00 KB

页数:17页

时间:2019-11-15

博弈树的搜索_第1页
博弈树的搜索_第2页
博弈树的搜索_第3页
博弈树的搜索_第4页
博弈树的搜索_第5页
资源描述:

《博弈树的搜索》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、博弈树搜索所谓双人完备信息,就是两位选手对垒,轮流走步,这时每一方不仅都知道对方过去已经走过的棋步,而且还能估计出对方未来可能的走步。对弈的结果是一方赢(另一方则输),或者双方和局。这类博弈的实例有:一字棋、余一棋、西洋跳棋、国际象棋、中国象棋、围棋等。对于带机遇性的任何博弈,因不具有完备信息,不属这里讨论范围,但有些论述可推广到某些机遇博弈中应用。博弈问题可以用产生式系统的形式来描述,例如中国象棋,综合数据库可规定为棋盘上棋子各种位置布局的一种描述,产生式规则是各类棋子合法走步的描述,目标则可规定为将(帅)被吃掉,规则作用于数据库的结果便生

2、成出博弈图或博弈树。下面举一个简单的例子说明博弈问题可用与或图表示,并讨论搜索策略应考虑的实际问题。中国象棋一盘棋平均走50步,总状态数约为10的161次方。假设1毫微秒走一步,约需10的145次方年。结论:不可能穷举。博弈树是与/或树双方都希望自己能够获胜。因此,当任何一方走步时,都是试图选择对自己最为有利,而对另一方最为不利的行动方案。从MAX方的观点看,在博弈过程的每一步,可供自己选择的行动方案之间是“或”的关系,原因在于选择哪个方案完全是由自己决定的;而可供MIN选择的行动方案之间则是“与”的关系,原因是主动权掌握在MIN手里,任何一

3、个方案都有可能被MIN选中,MAX必须防止那种对自己最为不利的情况的发生。这样,从选手的角度看,博弈树就是一棵与或树,其特点是:(l)博弈的初始状态是初始节点;(2)博弈树中的“或”节点和“与”节点逐层交替出现(3)整个博弈过程始终站在某一方的立场上,所有能使自己一方获胜的终局都是本原问题,相应的节点是可解节点;所有使对方获胜的终局都是不可解节点。极小极大搜索过程极小极大搜索策略是考虑双方对弈若干步之后,从可能的走步中选一步相对好棋的走法来走,即在有限的搜索深度范围内进行求解。为此要定义一个静态估计函数f,以便对棋局的势态(节点)作出优劣估值

4、,这个函数可根据势态优劣特征来定义(主要用于对端节点的“价值”进行度量)。一般规定有利于MAX的势态,f(p)取正值,有利于MIN的势态,f(p)取负值,势均力敌的势态,f(p)取0值。若f(p)=+∞,则表示MAX赢,若f(p)=-∞,则表示MIN赢。下面的讨论规定:顶节点深度d=0,MAX代表程序方,MIN代表对手方,MAX先走。极小极大搜索过程极大极小过程步骤:(1)以当前考察的态势P为根节点,生成指定深度的博弈树。(2)根据静态估计函数f计算各叶节点的估计值。(3)自底向上计算各个非叶节点的估计值,计算的方法是MAX节点取其子节点的最

5、大值,MIN节点取其子节点的最小值。(4)将根节点的倒推值对应的策略作为当前的最佳策略。极小极大过程05-333-3022-30-23541-30689-30-33-3-3-21-36-30316011极大极小一字棋游戏设有一个三行三列的棋盘,两个棋手轮流走步,每个棋手走时往空格上摆一个自己的棋子,谁先使自己的棋子成三子一线为赢。设程序方MAX的棋子用(×)表示,对手MIN的棋子用(○)表示,MAX先走。静态估计函数f(p)规定如下:1.若P是MAX的必胜局,则e(P)=+∞;2.若P是MIN的必胜局,则e(P)=-∞;3.若P对MAX、MI

6、N都是胜负未定局,则e(P)=e(+P)-e(-P)其中,e(+P)表示棋局P上有可能使×成三子一线的数目;e(-P)表示棋局P上有可能使○成三子一线的数目。一字棋游戏f(+P)=6f(P)=f(+P)-f(P)=2f(-P)=4例在搜索过程中,具有对称性的棋局认为是同一棋局,以大大减少搜索空间。对称棋局的例子用极大极小搜索方法为MAX寻找第一步棋的走法。(搜索深度为2)α-β剪枝极大极小过程是先生成与/或树,然后再计算各节点的估值,即生成节点和计算估值这两个过程是分离的。在搜索时,需要生成规定深度内的所有节点,因此搜索效率较低。以棋盘为15

7、×15大小的五子棋为例,人机对弈,用极大极小搜索算法,搜索深度为3时,计算机(配置:CUP赛场1.7G,内存DDR266256M)每走1步要用10min,搜索的节点数超过了107个;而搜索深度为4时,每走1步要用10个多小时,搜索节点数超过了2×109个。如果能边生成节点边对节点估值,并根据一定的条件,提前剪去一些没用的分枝,那么就可以有效提高搜索效率。在这种思想的基础上,人们提出了α-β剪枝技术。α-β剪枝技术采用有界深度优先策略,当生成规定深度的节点时,计算叶节点的静态估值,并倒推非端节点的估值。根据倒推结果,在非端节点的向下分枝中,剪掉

8、那些目前未知,但无论如何都不会改变非端节点倒推值的未扩展分枝。用α-β剪枝技术,搜索深度为3时,每走1步不到2min,搜索的节点数小于1.5×106个;而搜索深度为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。