第七章动态规划规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而, 有时我们也会面对决策变量需分期、 分批处理的多阶段决策问题。所谓多阶段决策问题 是指这样一类活动过程:它可以分解为若干个互相联系的阶段,在每一阶段分别对应着一组可供选取的决策集合;即构成过程的每个阶段都需要进行一次决策的决策问题。将各个阶段的决策综合起来构成一个决策序列,称为一个策略。显然,由于各个阶段选取的决策不同,对应整个过程可以有一系列不同的策略。当过程采取某个具体策略时,相应可以得到一个确定的效果,采取不同的策略, 就会得到不同的效果。 多阶段的决策问题, 就是要在所有可能采取的策略中选取一个最优的策略,以便得到最佳的效果。动态规划 ( dynamic programming )同前面介绍过的各种优化方法不同,它不是一种算法, 而是考察问题的一种途径。动态规划是一种求解多阶段决策问题的系统技术,可以说它横跨整个规划领域(线性规划和非线性规划)。当然, 由于动