关于策略梯度的方法说法正确的是 A: 只适用于离散动作空间 B: 适用于连续动作空间 C: 策略梯度的方法与DQN中的目标函数一致 D: 策略梯度的方法通过Q值挑选动作 - 网课答案

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-06-26

关于策略梯度的方法说法正确的是 A: 只适用于离散动作空间 B: 适用于连续动作空间 C: 策略梯度的方法与DQN中的目标函数一致 D: 策略梯度的方法通过Q值挑选动作

关于策略梯度的方法说法正确的是
A: 只适用于离散动作空间
B: 适用于连续动作空间
C: 策略梯度的方法与DQN中的目标函数一致
D: 策略梯度的方法通过Q值挑选动作

答案：

查看

举一反三