Sarsa与Q-learning的区别是？ A: Sarsa是off-policy，而Q-learning是on-policy B: Sarsa是on-policy，而Q-learning是off-policy C: Q-learning在算法更新时，对应的下一个动作并没有执行，而sarsa的下一个动作在这次更新时已经确定了 D: Q-learning是一种保守的算法，sarsa是一种贪婪勇敢的算法

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-07-27

Sarsa与Q-learning的区别是？ A: Sarsa是off-policy，而Q-learning是on-policy B: Sarsa是on-policy，而Q-learning是off-policy C: Q-learning在算法更新时，对应的下一个动作并没有执行，而sarsa的下一个动作在这次更新时已经确定了 D: Q-learning是一种保守的算法，sarsa是一种贪婪勇敢的算法

Sarsa与Q-learning的区别是？
A: Sarsa是off-policy，而Q-learning是on-policy
B: Sarsa是on-policy，而Q-learning是off-policy
C: Q-learning在算法更新时，对应的下一个动作并没有执行，而sarsa的下一个动作在这次更新时已经确定了
D: Q-learning是一种保守的算法，sarsa是一种贪婪勇敢的算法

答案：

查看

举一反三