• 2022-07-27 问题

    Sarsa与Q-learning的区别是? A: Sarsa是off-policy,而Q-learning是on-policy B: Sarsa是on-policy,而Q-learning是off-policy C: Q-learning在算法更新时,对应的下一个动作并没有执行,而sarsa的下一个动作在这次更新时已经确定了 D: Q-learning是一种保守的算法,sarsa是一种贪婪勇敢的算法

    Sarsa与Q-learning的区别是? A: Sarsa是off-policy,而Q-learning是on-policy B: Sarsa是on-policy,而Q-learning是off-policy C: Q-learning在算法更新时,对应的下一个动作并没有执行,而sarsa的下一个动作在这次更新时已经确定了 D: Q-learning是一种保守的算法,sarsa是一种贪婪勇敢的算法

  • 2022-07-27 问题

    中国大学MOOC: Sarsa与Q-learning的区别是?

    中国大学MOOC: Sarsa与Q-learning的区别是?

  • 2022-07-27 问题

    中国大学MOOC: Q-learning与Sarsa相同的地方是

    中国大学MOOC: Q-learning与Sarsa相同的地方是

  • 2022-07-27 问题

    如果我们的机器(或智能体)每次训练更新的损耗会比较大,我们更倾向于选择哪种算法 A: Sarsa B: Q-learning C: 两者都可以 D: 两者都不行

    如果我们的机器(或智能体)每次训练更新的损耗会比较大,我们更倾向于选择哪种算法 A: Sarsa B: Q-learning C: 两者都可以 D: 两者都不行

  • 2022-07-27 问题

    Q-learning与Sarsa相同的地方是 A: 都使用了[img=83x23]1803de6ee4b6375.png[/img]等策略进行探索 B: 都用q-table存储状态动作对 C: 更新公式相同 D: 两者都可以找到最优的策略

    Q-learning与Sarsa相同的地方是 A: 都使用了[img=83x23]1803de6ee4b6375.png[/img]等策略进行探索 B: 都用q-table存储状态动作对 C: 更新公式相同 D: 两者都可以找到最优的策略

  • 2022-07-27 问题

    COSPAS/SARSA'I'系统是由哪四部分组成()。 A: 低极轨道卫星,陆地用户终端,EPIRB和任务控制中心 B: 静止卫星,陆地用户终端,EPIRB,营救协调中心 C: 低极轨道卫星,陆地用户终端,EPIRB,网络协调站 D: 低极轨道卫星,陆地用户终端,SCC,任务控制中心

    COSPAS/SARSA'I'系统是由哪四部分组成()。 A: 低极轨道卫星,陆地用户终端,EPIRB和任务控制中心 B: 静止卫星,陆地用户终端,EPIRB,营救协调中心 C: 低极轨道卫星,陆地用户终端,EPIRB,网络协调站 D: 低极轨道卫星,陆地用户终端,SCC,任务控制中心

  • 1