Rminimax:一种最优化的随机极小极大算法
来源:56doc.com 资料编号:5D24184 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9A5D24184
资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用. 密 保 惠 帮助
资料介绍
Rminimax:一种最优化的随机极小极大算法(中文5200字,英文PDF)
Silvia Garcia Diez, Jerome Laforge和Marco Saerens。
摘要
本文提出了用于零和双人游戏的名为Rminimax算法,这是著名的MINIMAX算法的简单扩展。Rminimax算法通过以最佳方式随机化人工对手的策略来控制其强度。特别是,将人工智能(AI)应用于更糟糕或更好的解决方案,从而控制其强度。换句话说,我们的模型旨在将有限理性引入到极小极大算法中。这个框架通过在探索代价和探索深度中做出最优的选择,来考虑所有最优的选择。与其他的树探测技术相反,这个新算法考虑了树的完整路径,其中给定的熵是分布的。通过简单的递归关系有效地计算最优随机策略,同时保持与原始MINIMAX相同的复杂度。因此,Rminimax以一种原则性的方式为棋盘游戏实现了一个非确定性的强度适应性AI对手,从而避免了完全理性的假设。在两个游戏上的模拟显示,Rminimax的表现与预期相同。
|