决策变量记为xk是所在状态sk的函数
举一反三
- 令动态规划当前状态为Sk,所做的决策为xk,系统将转移到下一阶段的某个状态Sk+1,状态转移方程的一般函数形式为: A: Sk+1=Tk(Sk,xk) B: Sk+1=Tk+1(Sk,xk) C: Sk+1=Tk(Sk+1,xk) D: Sk+1=Tk(Sk,xk+1)
- 中国大学MOOC: 令动态规划当前状态为Sk,所做的决策为xk,系统将转移到下一阶段的某个状态Sk+1,状态转移方程的一般函数形式为:
- 中国大学MOOC: 令动态规划当前状态为Sk,所做的决策为xk,系统将转移到下一阶段的某个状态Sk+1,状态转移方程的一般函数形式为:
- 动态规划问题的决策变量 A: 与当前状态有关 B: 用uk(sk)表示第k阶段在状态sk下的决策 C: 与当前状态无关 D: 以上均不正确
- 常用_____表示第k阶段当状态为sk时的决策变量。在实际问题中,决策变量的取值往往限制在一定范围内,我们称此范围为允许决策集合,常用_____表示第k阶段从状态sk出发的允许决策集合。