中国大学MOOC: 深度强化学习是深度学习与强化学习的结合。在深度强化学习中,神经网络被用来进行哪个函数的学习?
q函数
举一反三
内容
- 0
深度学习与强化学习的区别有哪些() A: 深度学习的训练样本是有标签的,而强化学习没有 B: 深度学习的学习过程是静态的,而强化学习是动态的 C: 深度学习解决的更多是感知问题,强化学习解决的主要是决策问题 D: 深度学习部分有有监督学习和无监督学习之分,强化学习无此分类
- 1
AlphaGo通过深度监督学习+深度强化学习+大数据+TPU进行学习()
- 2
为什么要在强化学习中引入深度神经网络?() A: 加快算法收敛速度 B: 提高强化学习表达能力 C: 提高算法复杂度 D: 深度神经网络与强化学习方法训练方法一致
- 3
下面哪些选项是深度学习的术语 ? A: 卷积神经网络 B: 生成对抗网络 C: 循环神经网络 D: 随机森林 E: 深度强化学习
- 4
强化学习的变体包括( )的强化学习。 A: 阶层强化学习 B: 深度学习 C: 部分可观测系统 D: 逆向强化学习