• 2021-04-14
    强化学习的框架是智能体()通过观察当前状态作出相应动作。
  • Agent

    内容

    • 0

      2. 在强化学习中,智能体的学习过程是一个反复与环境进行交互,不断试错、不断进步的过程。在这个过程中,智能体在环境中会选择(),环境可能因此改变自身(),同时环境会反馈智能体以()。 A: 动作、状态、奖励 B: 状态、动作、奖励 C: 奖励、状态、动作 D: 动作、奖励、状态

    • 1

      设计强化学习框架主要需要考虑哪些因素?() A: 环境 B: 奖励 C: 智能体 D: 算法运行时间

    • 2

      ‎()就是程序或智能体(agent)通过与环境不断地进行交互学习完成从环境到动作的映射,学习的目标就是使累计回报最大化。 ‏ A: 监督学习 B: 非监督学习 C: 强化学习 D: 非强化学习

    • 3

      强化学习时机器学习算法的一种,就是程序或智能体(agent)通过与环境不断地进行交互学习完成从环境到动作的映射,学习的目标就是使累计回报最大化。

    • 4

      不仅有智能思维,而且能根据思维作出相应动作的机器人有()