第四章 动态规划问题 天马行空官方博客:http:/ ;QQ:1318241189 ;QQ 群:175569632动态规划的概念与模型 l 静态决策 一次性决策 l 动态决策 多阶段决策 决策 x 1 x 2 Z u 输入 决策 输出 决策效应 第一月 x 1 x 2 r 1 u 1 第二月 x 3 r 2 u 2 第三月 x 4 r 3 u 3多段决策过程 T 1 x 1 x 2 r 1 u 1 T 2 x 3 r 2 u 2 T k x k x k+! r k u k T n x n x n+1 r n u n n个决策子问题 K 称为阶段变量 x k 描述k阶段初的状态,称为状态变量 一般把输入状态称为该阶段的阶段状态。 u k 的取值代表k阶段对第k子问题所进行的决策,称为k阶段的决策变量 r k 为k阶段从状况x k 出发,做决策u k 之后的后果,称为k阶段的阶段效应。 具有无后效性的多段决策过程 X k+1 =T k (x k , u k ) 系统从k阶段往后的决策只与k阶段系统的状态x k 有关,而与系 统以前的决策无关,则称为具有无后效性的多段决策过程。 T 1 x