Alpha-beta剪枝算法

作者：cocoaqin 2016年10月30日 0条评论 1,266次阅读

Alpha-beta剪枝

Alpha-beta剪枝是一种搜索算法，用以减少最小-最大算法搜索树的节点数。这是一种对抗性搜索算法，主要应用于机器游玩的二人游戏（如井字棋、象棋、围棋）。当算法评估出某策略的后续走法比之前策略的还差时，就会停止计算该策略的后续发展。该算法和最小-最大算法所得结论相同，但剪去了不影响最终决定的分枝^[1]。

历史

Allen Newell和Herbert A. Simon在1958年，使用了John McCarthy所谓的“近似”alpha-beta算法^[2]，此算法当时“应已重新改造过多次”^[3]。Arthur Samuel有一个早期版本，同时Richards、Hart、Levine和/或Edwards在美国分别独立发现了alpha-beta^[4]。McCarthy在1956年达特默思会议上提出了相似理念，并在1961年建议给他的一群学生，其中包括MIT的Alan Kotok^[5]。Alexander Brudno独立发现了alpha-beta算法，并在1963年发布成果^[6]。Donald Knuth和Ronald W. Moore在1975年优化了算法^[7]^[8]，Judea Pearl在1982年证明了其最优性^[9]。

对原版最小-最大算法的改进

Alpha-beta的优点是减少搜索树的分枝，将搜索时间用在“更有希望”的子树上，继而提升搜索深度。该算法和最小-最大算法一样，都是分支限界类算法。若节点搜索顺序达到最佳优化或近似最佳优化（将最佳选择排在各节点首位），则同样时间内搜索深度可达最小-最大算法的两倍多。

在（平均或恒定）分枝因子为b，搜索深度为d层的情况下，要评估的最大（即招法排序最差时）叶节点数目为O(b*b*…*b) = O(b^d)——即和简单最小-最大搜索一样。若招法排序最优（即始终优先搜索最佳招法），则需要评估的最大叶节点数目按层数奇偶性，分别约为O(b*1*b*1*…*b)和O(b*1*b*1*…*1)（或O(b^d/2) = O(√b^d)）。其中层数为偶数时，搜索因子相当于减少了其平方根，等于能以同深度搜索两次^[10]。b*1*b*1*…意义为，对第一名玩家必须搜索全部招法找到最佳招式，但对于它们，只用将第二名玩家的最佳招法截断——alpha-beta确保无需考虑第二名玩家的其他招法。但因节点生成顺序随机，实际需要评估的节点平均约为O(b^3d/4)^[2]。

一般在alpha-beta中，子树会由先手方优势或后手方优势暂时占据主导。若招式排序错误，这一优势会多次切换，每次让效率下降。随着层数深入，局面数量会呈指数性增长，因此排序早期招式价值很大。尽管改善任意深度的排序，都以能指数性减少总搜索局面，但排序临近根节点深度的全部局面相对经济。在实践中，招法排序常由早期、小型搜索决定，如通过迭代加深。

算法使用两个值alpha和beta，分别代表大分玩家放心的最高分，以及小分玩家放心的最低分。alpha和beta的初始值分别为正负无穷大，即双玩家都以可能的最低分开始游戏。在选择某节点的特定分枝后，可能发生小分玩家放心的最小分小于大分玩家放心的最大分（beta <= alpha）。这种情况下，父节点不应选择这个节点，否则父节点分数会降低，因此该分枝的其他节点没有必要继续探索。

伪代码

下面为一故障弱化版Alpha-beta剪枝的伪代码^[10]：

01 <b>function</b> alphabeta(node, depth, α, β, maximizingPlayer) <i>// node = 节点，depth = 深度，maximizingPlayer = 大分玩家</i>
02      <b>if</b> depth = 0 <b>or</b> node是终端节点
03          <b>return</b> 节点的启发值
04      <b>if</b> maximizingPlayer
05          v := -∞
06          <b>for</b> 每个子节点
07              v := max(v, alphabeta(child, depth - 1, α, β, FALSE)) <i>// child = 子节点</i>
08              α := max(α, v)
09              <b>if</b> β ≤ α
10                  <b>break</b> <i>// β裁剪</i>
11          <b>return</b> v
12      <b>else</b>
13          v := ∞
14          <b>for each</b> 每个子节点
15              v := min(v, alphabeta(child, depth - 1, α, β, TRUE))
16              β := min(β, v)
17              <b>if</b> β ≤ α
18                  <b>break</b> <i>// α裁剪</i>
19          <b>return</b> v

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

01 function alphabeta(node, depth, α, β, maximizingPlayer) // node = 节点，depth = 深度，maximizingPlayer = 大分玩家

02 if depth = 0 or node是终端节点

03 return 节点的启发值

04 if maximizingPlayer

05 v := -∞

06 for 每个子节点

07 v := max(v, alphabeta(child, depth - 1, α, β, FALSE)) // child = 子节点

08 α := max(α, v)

09 if β ≤ α

10 break // β裁剪

11 return v

12 else

13 v := ∞

14 for each 每个子节点

15 v := min(v, alphabeta(child, depth - 1, α, β, TRUE))

16 β := min(β, v)

17 if β ≤ α

18 break // α裁剪

19 return v

<i><b>(* 初始调用 *)</b></i>
alphabeta(origin, depth, -∞, +∞, TRUE) <i>// origin = 初始节点</i>

1 2	<i><b>(* 初始调用 *)</b></i> alphabeta(origin, depth, -∞, +∞, TRUE) <i>// origin = 初始节点</i>

在这个故障弱化的alpha-beta中，当v超出调用参数α和β构成的集合时（v < α或v > β），alphabeta函数返回值v。而与此相对，故障强化的alpha-beta限制函数返回在α与β包括范围中的值。

七克-7ke

知识库

Alpha-beta剪枝算法

Alpha-beta剪枝

历史

对原版最小-最大算法的改进

伪代码

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可

发表评论取消回复

知识库

Alpha-beta剪枝

历史

对原版最小-最大算法的改进

伪代码

本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可

发表评论 取消回复

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可

发表评论取消回复