关于蒙特卡洛树搜索算法说法正确的是
A: 向下递归选择过程中使用了UBC1算法
B: 模拟过程使用随机策略
C: 反向传播的是终止结点的代价或游戏终局分数
D: 蒙特卡洛树使用了穷尽式枚举法
A: 向下递归选择过程中使用了UBC1算法
B: 模拟过程使用随机策略
C: 反向传播的是终止结点的代价或游戏终局分数
D: 蒙特卡洛树使用了穷尽式枚举法
举一反三
- 除了问题本身的定义之外,使用问题特定知识的搜索策略被认为是( )。 A: 启发式算法 B: 蒙特卡洛树搜索 C: 深度优先搜索 D: 极小极大搜索算法
- 下面对蒙特卡洛树搜索描述不正确的是() A: 是一种基于采样的搜索方法 B: 是将上限置信区间算法(UCB)应用于游戏树的搜索方法 C: 其包含了选举、扩展、模拟和反向传播四个步骤 D: 是一种穷举式枚举的搜索方法
- 下列关于蒙特卡洛树搜索算法的说法中,不正确的是 A: 选择过程体现了探索与利用的平衡 B: 算法进入扩展步骤时,当前结点的所有子结点必然都未被扩展 C: 模拟步骤采取的策略与选择步骤不一定相同 D: 反向传播只需要更新当前路径上已被扩展的结点
- 是第一个使用蒙特卡洛树搜索
- 关于AlphaGo使用的蒙特卡洛树搜索,以下说法不正确的是()