DQN在解决大规模实时调度问题上展现了广阔的应用前景,以下哪个不是DQN所使用的技术特点?()
A: 计算每个动作的概率
B: 使用深度神经网络
C: 使用经验回放机制
D: 使用端到端学习的结构
A: 计算每个动作的概率
B: 使用深度神经网络
C: 使用经验回放机制
D: 使用端到端学习的结构
举一反三
- DQN是深度信念网络
- 在Q学习算法中,如果( )函数为深度神经网络,则该方法称为深度Q网络(DQN)。 A: 相同 B: 状态 C: 求解 D: 逼近
- 在深紫外曝光中,需要使用()光刻胶。 A: DQN B: CA C: ARC D: PMMA
- 深度学习为主的自然语言理解方法主要使用以下哪种技术? A: 概率统计 B: 句法分析 C: 词法分析 D: 神经网络
- DQN对传统Q-learning做了三处改进:( )。 A: 独立设置了目标网络来单独处理时间差分算法中的TD偏差 B: 利用深度卷积神经网络逼近值函数 C: 利用了经验回放对强化学习的学习过程进行训练 D: 解决了Q-Learning 对价值的过高估计的问题