如果我们的机器（或智能体）每次训练更新的损耗会比较大，我们更倾向于选择哪种算法 A: Sarsa B: Q-learning C: 两者都可以 D: 两者都不行 - 网课答案

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

关注微信公众号《课帮忙》查题

公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！
公告：维护QQ群：833371870，欢迎加入！

2022-07-27

如果我们的机器（或智能体）每次训练更新的损耗会比较大，我们更倾向于选择哪种算法 A: Sarsa B: Q-learning C: 两者都可以 D: 两者都不行

如果我们的机器（或智能体）每次训练更新的损耗会比较大，我们更倾向于选择哪种算法
A: Sarsa
B: Q-learning
C: 两者都可以
D: 两者都不行

答案：

查看

举一反三