强化学习是机器学习中与( )和( )平行的一种学习方法,是智能体自主与外界环境交互任务的重要手段,通过最大化目标函数的学习方法获取从环境状况到行为的映射。
A: 迁移学习
B: 无监督学习
C: 深度学习
D: 监督学习
A: 迁移学习
B: 无监督学习
C: 深度学习
D: 监督学习
举一反三
- ()就是程序或智能体(agent)通过与环境不断地进行交互学习完成从环境到动作的映射,学习的目标就是使累计回报最大化。 A: 监督学习 B: 非监督学习 C: 强化学习 D: 非强化学习
- 强化学习时机器学习算法的一种,就是程序或智能体(agent)通过与环境不断地进行交互学习完成从环境到动作的映射,学习的目标就是使累计回报最大化。
- 从学习方法上来分,机器学习算法可以分为:( )。 A: 监督学习 B: 无监督学习 C: 半监督学习 D: 集成学习 E: 深度学习 F: 强化学习
- 机器学习按学习方法分类可以分为( )。 A: 监督学习 B: 无监督学习 C: 半监督学习 D: 强化学习
- 学习没有标签的数据集的机器学习方法是?() A: 监督学习 B: 无监督学习 C: 半监督学习 D: 强化学习