• 2022-05-27
    2. 在强化学习中,智能体的学习过程是一个反复与环境进行交互,不断试错、不断进步的过程。在这个过程中,智能体在环境中会选择(),环境可能因此改变自身(),同时环境会反馈智能体以()。
    A: 动作、状态、奖励
    B: 状态、动作、奖励
    C: 奖励、状态、动作
    D: 动作、奖励、状态