中国大学MOOC: 在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力( )
举一反三
- 在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力( ) A: 贪心策略 B: 蒙特卡洛采样 C: 动态规划 D: Bellman方程
- 中国大学MOOC: 深度强化学习是深度学习与强化学习的结合。在深度强化学习中,神经网络被用来进行哪个函数的学习?
- 中国大学MOOC: 在强化学习中,通过哪两个步骤的迭代,来学习得到最佳策略( )
- 深度强化学习是深度学习与强化学习的结合。在深度强化学习中,神经网络被用来进行哪个函数的学习? A: 贪心策略函数 B: 蒙特卡洛采样函数 C: q函数 D: Bellman方程
- 为什么要在强化学习中引入深度神经网络?() A: 加快算法收敛速度 B: 提高强化学习表达能力 C: 提高算法复杂度 D: 深度神经网络与强化学习方法训练方法一致