• 2022-07-27
    马尔科夫决策过程由哪几个元素来表示
    A: 状态、动作、转移概率、策略、折扣因子
    B: 状态、动作、转移概率、折扣因子、回报函数
    C: 状态、动作、输入、输出、回报函数
    D: 状态、动作、值、策略、回报函数