• 2022-05-30
    强化学习模型包括?()
    A: 可动态变化的状态
    B: 可选取的动作
    C: 可以和决策主体进行交互的环境
    D: 回报规则