2. 在强化学习中，智能体的学习过程是一个反复与环境进行交互，不断试错、不断进步的过程。在这个过程中，智能体在环境中会选择（），环境可能因此改变自身（），同时环境会反馈智能体以（）。 A: 动作、状态、奖励 B: 状态、动作、奖励 C: 奖励、状态、动作 D: 动作、奖励、状态

2022-05-27

2. 在强化学习中，智能体的学习过程是一个反复与环境进行交互，不断试错、不断进步的过程。在这个过程中，智能体在环境中会选择（），环境可能因此改变自身（），同时环境会反馈智能体以（）。
A: 动作、状态、奖励
B: 状态、动作、奖励
C: 奖励、状态、动作
D: 动作、奖励、状态

答案：

查看