• 2021-04-14
    强化学习中,()主要探索未知的动作会产生的效果
  • 探索

    内容

    • 0

      中国大学MOOC: 在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力( )

    • 1

      通过观察别人的行为是否得到强化,也可以产生强化效果。______把由此产生的学习,称为替代学习。 A: 班杜拉 B: 维果茨基 C: 杜威 D: 布鲁纳

    • 2

      在强化学习中,主体和环境之间交互的要素有? 回报|状态|强化|动作

    • 3

      部分强化(间隔强化)程序产生的学习 A: A.与连续强化程序产生的学习的消退速率相同 B: B.并不像连续强化程序产生的学习消退的那样迅速 C: c.比连续强化程序产生的学习消退的更迅速 D: D.不能与连续强化程序产生的学习相比较

    • 4

      强化学习与监督学习的最大区别在于下列的哪一个内容__? A: 如何产生动作 B: 对产生动作的好坏作一评价 C: 外部信息较丰富 D: 有无教师存在