第四章 第四章 动态 动态 规划 规划 动态规划 动态规划是解决多阶段决策过程最优化问题的一种方法。在二 十世纪五十年代由美国数学家理查德.贝尔曼(RichardBa11man) 首先提出的。它可以把一个 n 维最优化问题转化为 n 个一维最优化 问题来求解。 一个决策问题,往往可以分解成若干个相互联系,又相对独立 的阶段,对于每一个阶段,存在着很多方案可供选择,我们要对每 个阶段作出一个决策。 而各阶段之间又有密切的联系,某一个阶段的不同决策,将会 对其它阶段的决策产生重大的影响,某个阶段局部的较优方案,未 必是整个问题的最好方案,某个阶段局部的不好方案,也未必是整 个问题的不好方案。 我们要寻找的是整个问题,也就是所有阶段总体的一个最优方 案,这就是动态规划所要讨论的问题。一、多阶段决策问题 所谓多阶段决策问题是有这样一类决策过程,它可以划分为若 干个相互联系的阶段,在任一阶段都有若干种方案可供选择,选择 哪一种方案需要作出决策,这样就形成一个决策序列,通常称为一 种策略。不同的策略就产生不同的效果,在所有可能的策略当中, 选择一个效果最好的最优策略,就是解决多阶段决策问题的主要目