• 2022-06-03
    监督学习引入了智能体和环境的概念,智能体通过学习和决策,执行最优的动作。( )
  • 内容

    • 0

      人工智能就是研究和设计智能体,智能体不包括()。 A: 感知 B: 思考和决策 C: 动作 D: 心理研究

    • 1

      强化学习的参与方有哪些() A: 智能体 B: 环境状态 C: 决策框架 D: 奖惩

    • 2

      机器学习中使用的算法可分为()三类 A: 监督学习,无监督学习和强化学习 B: 监督学习,无监督学习和智能学习 C: 监督学习,控制学习和强化学习 D: 控制学习,无监督学习和智能学习

    • 3

      强化学习是机器学习中与( )和( )平行的一种学习方法,是智能体自主与外界环境交互任务的重要手段,通过最大化目标函数的学习方法获取从环境状况到行为的映射。 A: 迁移学习 B: 无监督学习 C: 深度学习 D: 监督学习

    • 4

      强化学习时机器学习算法的一种,就是程序或智能体(agent)通过与环境不断地进行交互学习完成从环境到动作的映射,学习的目标就是使累计回报最大化。