以下关于强化学习说法正确的是?
A: 强化学习又称为增强学习、加强学习、再励学习或激励学习,是一种从环境状态到行为映射的学习,目的是使动作从环境中获得的累积回报值最大;
B: 强化学习属于无监督学习;
C: 在向用户推荐新闻文章的任务中,强化学习会找到用户先前已经阅读过类似的文章并向他们推荐其一;
D: 强化学习是机器学习分支之一,介于有监督学习和无监督学习之间。
A: 强化学习又称为增强学习、加强学习、再励学习或激励学习,是一种从环境状态到行为映射的学习,目的是使动作从环境中获得的累积回报值最大;
B: 强化学习属于无监督学习;
C: 在向用户推荐新闻文章的任务中,强化学习会找到用户先前已经阅读过类似的文章并向他们推荐其一;
D: 强化学习是机器学习分支之一,介于有监督学习和无监督学习之间。
举一反三
- 机器学习中使用的算法可分为()三类 A: 监督学习,无监督学习和强化学习 B: 监督学习,无监督学习和智能学习 C: 监督学习,控制学习和强化学习 D: 控制学习,无监督学习和智能学习
- 机器学习包括监督学习、无监督学习和强化学习。
- ()就是程序或智能体(agent)通过与环境不断地进行交互学习完成从环境到动作的映射,学习的目标就是使累计回报最大化。 A: 监督学习 B: 非监督学习 C: 强化学习 D: 非强化学习
- 机器从数据中学习的方式包括?() A: 强化学习 B: 监督学习 C: 无监督学习 D: 半监督学习
- 机器学习的任务类型包括() A: 有监督学习 B: 无监督学习 C: 半监督学习 D: 强化学习