• 2022-07-27
    以下哪些方面是设计在仓储调度环境中的强化学习算法时需要考虑的?()
    A: 动作空间
    B: 状态空间
    C: 奖励函数
    D: 动作选择策略