强化学习中,()主要探索未知的动作会产生的效果
探索
举一反三
- 强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略
- 【单选题】强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。 A. 探索 B. 开发 C. 输入 D. 输出
- 强化学习基本要素有哪些? A: 状态、动作、奖励 B: 状态、动作、折扣因子 C: 动作、折扣因子、奖励 D: 状态、奖励、探索策略
- 在强化学习过程中,____表示随机地采取某个动作,以便于尝试各种结果;____表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。? 开发;开发|探索;探索|探索;开发|开发;探索
- 在强化学习过程中,( _______)表示随机地采取某个动作,以便于尝试各种结果;( _______)表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。 A: 探索;探索 B: 利用;利用 C: 探索;利用 D: 利用;探索
内容
- 0
中国大学MOOC: 在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力( )
- 1
通过观察别人的行为是否得到强化,也可以产生强化效果。______把由此产生的学习,称为替代学习。 A: 班杜拉 B: 维果茨基 C: 杜威 D: 布鲁纳
- 2
在强化学习中,主体和环境之间交互的要素有? 回报|状态|强化|动作
- 3
部分强化(间隔强化)程序产生的学习 A: A.与连续强化程序产生的学习的消退速率相同 B: B.并不像连续强化程序产生的学习消退的那样迅速 C: c.比连续强化程序产生的学习消退的更迅速 D: D.不能与连续强化程序产生的学习相比较
- 4
强化学习与监督学习的最大区别在于下列的哪一个内容__? A: 如何产生动作 B: 对产生动作的好坏作一评价 C: 外部信息较丰富 D: 有无教师存在