智能体具有自主性、主动性、反应能力和社会能力,它在与环境不断的交互过程中形成了一个[状态--动作]对的序列,这个序列称之为当前智能体的历史。
对
举一反三
- 2. 在强化学习中,智能体的学习过程是一个反复与环境进行交互,不断试错、不断进步的过程。在这个过程中,智能体在环境中会选择(),环境可能因此改变自身(),同时环境会反馈智能体以()。 A: 动作、状态、奖励 B: 状态、动作、奖励 C: 奖励、状态、动作 D: 动作、奖励、状态
- 理性智能体指的是有正确行为的智能体,但正确的行为意味着什么?考虑智能体行为的后果,选择下列有关“正确的行为”概念的真实陈述() A: 但若该序列是不期望的,则该智能体对其环境造成破坏。 B: 如果该序列是所期望的,则该智能体表现良好 C: 智能体在某个环境中依据感知生成动作序列 D: 这些动作序列引起环境改变而产生状态序列
- 强化学习的基本框架中,智能体通过()与环境进行交互时,环境会返给智能体一个当前的()
- 智能体具有社会能力,是指它能通过某种通信语言实现和其它智能体(甚至人)的交互。
- 智能体在与环境的交互过程中,智能体不可以完全控制环境,环境也不可以控制智能体,两者相互影响、相互依存。
内容
- 0
智能体在与环境不断的交互过程中,对环境施加作用,则环境会持续不断地发生变化。
- 1
智能体具有反应能力,是指它能感知外界环境,并且及时对外界环境的变化做出相应动作。
- 2
中国大学MOOC: 强化学习的基本框架中,智能体通过()与环境进行交互时,环境会返给智能体一个当前的()。
- 3
智能体具有社会能力,是指它能通过某种通信语言实现和其它智能体(甚至人)的交互。 A: 正确 B: 错误
- 4
智能体有多种实现方式,其中( )结构认为智能体的理性行为是在智能体与环境的交互过程中涌现的。