期望值算法

期望值算法是最小值算法的一个变种,用于玩双人零和游戏的人工智能系统,如双陆棋,其结果取决于玩家的技能和机会元(如掷骰子)的组合。除了传统minimax的最小和xxx节点外,这个变体还有机会(自然移动)节点,这些节点取随机事件发生的预期值。在博弈论术语中,期望xxx树是完全但不完全信息的广义博弈的博弈树。在传统的最小法中,树的层次从xxx到最小交替进行,直到达到树的深度极限。在期望最大化树中,机会节点与最大和最小节点交错排列。机会节点不是取其子女效用值的xxx值或最小值,而是取一个加权平均值,其权重是该子女达到的概率。交错的方式取决于游戏的情况。游戏的每个回合都被评估为一个xxx节点(代表人工智能玩家的回合),一个最小节点(代表一个潜在的最佳对手的回合),或一个机会节点(代表一个随机效应或玩家)。例如,考虑一个游戏,其中每一轮都由一次掷骰子组成,然后首先由人工智能玩家,然后由另一个智能对手做出决定。这个游戏中的节点顺序将在机会、xxx、然后是最小之间交替进行。伪代码expectiminimax算法是minimax算法的一个变种,由DonaldMichie在1966年首次提出。

期望值算法

(Probability[child]×expectiminimax(child,depth-1))返回α请注意,对于随机节点。

0

点评

点赞

相关文章