下面哪一种有序组合是蒙特卡洛树搜索中一次正确的迭代步骤( )
A: 选举、扩展、模拟、反向传播
B: 反向传播、选举、扩展、模拟
C: 反向传播、扩展、模拟、选举
D: 扩展、模拟、采样、选举
A: 选举、扩展、模拟、反向传播
B: 反向传播、选举、扩展、模拟
C: 反向传播、扩展、模拟、选举
D: 扩展、模拟、采样、选举
A
举一反三
- 下面对蒙特卡洛树搜索描述不正确的是() A: 是一种基于采样的搜索方法 B: 是将上限置信区间算法(UCB)应用于游戏树的搜索方法 C: 其包含了选举、扩展、模拟和反向传播四个步骤 D: 是一种穷举式枚举的搜索方法
- 下列关于蒙特卡洛树搜索算法的说法中,不正确的是 A: 选择过程体现了探索与利用的平衡 B: 算法进入扩展步骤时,当前结点的所有子结点必然都未被扩展 C: 模拟步骤采取的策略与选择步骤不一定相同 D: 反向传播只需要更新当前路径上已被扩展的结点
- 中国大学MOOC: 下面哪一种有序组合是蒙特卡洛树搜索中一次正确的迭代步骤( )
- 关于蒙特卡洛树搜索算法说法正确的是 A: 向下递归选择过程中使用了UBC1算法 B: 模拟过程使用随机策略 C: 反向传播的是终止结点的代价或游戏终局分数 D: 蒙特卡洛树使用了穷尽式枚举法
- 蒙特卡洛树搜索在模拟步骤中体现了探索与利用
内容
- 0
二极管正向偏置时模拟开关( ),二极管反向偏置时模拟开关( )。
- 1
研究模拟和扩展人脑智能的先进理论与技术是()。
- 2
方差协方差法、历史模拟法和蒙特卡洛模拟法计算VaR值时,能处理收益率分布中存在的“肥尾”现象的是()。 A: 方差协方差法和历史模拟法 B: 历史模拟法和蒙特卡洛模拟法 C: 方差一协方差和蒙特卡洛模拟法 D: 方差协方差、历史模拟法和蒙特卡洛模拟法
- 3
金钱选举是一种坏的选举方式,一定会产生负面的影响。 A: 正确 B: 错误
- 4
金钱选举是一种坏的选举方式,一定会产生负面的影响。