动态规划算法.doc-资源下载-文客久久网

动态规划算法.doc

1、动态规划（一）、动态规划的基本思想：动态规划算法通常用于求解具有某种最优性质的问题。在这类问题中，可能会有许多可行解。每一个解都对应于一个值，我们希望找到具有最优值的解。动态规划算法与分治法类似，其基本思想也是将待求解问题分解成若干个子问题，先求解子问题，然后从这些子问题的解得到原问题的解。与分治法不同的是，适合于用动态规划求解的问题，经分解得到子问题往往不是互相独立的。若用分治法来解这类问题，则分解得到的子问题数目太多，有些子问题被重复计算了很多次。如果我们能够保存已解决的子问题的答案，而在需要时再找出已求得的答案，这样就可以避免大量的重复计算，节省时间。我们可以用一个表来记录所有已解的子问

2、题的答案。不管该子问题以后是否被用到，只要它被计算过，就将其结果填入表中。这就是动态规划法的基本思路。具体的动态规划算法多种多样，但它们具有相同的填表格式。二、设计动态规划法的步骤：1、找出最优解的性质，并刻画其结构特征；2、递归地定义最优值（写出动态规划方程）；3、以自底向上的方式计算出最优值；4、根据计算最优值时得到的信息，构造一个最优解。步骤1-3是动态规划算法的基本步骤。在只需要求出最优值的情形，步骤4可以省略，步骤3中记录的信息也较少；若需要求出问题的一个最优解，则必须执行步骤4，步骤3中记录的信息必须足够多以便构造最优解。三、动态规划问题的特征：动态规划算法的有效性依赖于问题本身所

3、具有的两个重要性质：最优子结构性质和子问题重叠性质。1、最优子结构：当问题的最优解包含了其子问题的最优解时，称该问题具有最优子结构性质。2、重叠子问题：在用递归算法自顶向下解问题时，每次产生的子问题并不总是新问题，有些子问题被反复计算多次。动态规划算法正是利用了这种子问题的重叠性质，对每一个子问题只解一次，而后将其解保存在一个表格中，在以后尽可能多地利用这些子问题的解。（二）、动态规划算法的基本步骤设计一个标准的动态规划算法，通常可按以下几个步骤进行： 3. 划分阶段：按照问题的时间或空间特征，把问题分为若干个阶段。注意这若干个阶段一定要是有序的或者是可排序的（即无后向性），否则问题就无法用动

4、态规划求解。 4. 选择状态：将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然，状态的选择要满足无后效性。 5. 确定决策并写出状态转移方程：之所以把这两步放在一起，是因为决策和状态转移有着天然的联系，状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以，如果我们确定了决策，状态转移方程也就写出来了。但事实上，我们常常是反过来做，根据相邻两段的各状态之间的关系来确定决策。 6. 写出规划方程（包括边界条件）：动态规划的基本方程是规划方程的通用形式化表达式。一般说来，只要阶段、状态、决策和状态转移确定了，这一步还是比较简单的。动态规划的主要难点在于理论上的设计，一旦

5、设计完成，实现部分就会非常简单。根据动态规划的基本方程可以直接递归计算最优值，但是一般将其改为递推计算，实现的大体上的框架如下：标准动态规划的基本框架frame1. 对f n+1(xn+1)初始化; 边界条件2. for k:=n downto 1 do 3. for 每一个x kX k do4. for 每一个u kU k(xk) dobegin5. fk(xk):=一个极值; 或6. xk+1:=Tk(xk,uk); 状态转移方程7. t:=(fk+1(xk+1),vk(xk,uk); 基本方程(9)式8. if t比f k(xk)更优 then f k(xk):=t; 计算f k(xk

6、)的最优值end; 9. t:=一个极值; 或10. for 每一个x 1X 1 do11. if f1(x1)比t更优 then t:=f 1(x1); 按照10式求出最优指标12. 输出t;但是，实际应用当中经常不显式地按照上面步骤设计动态规划，而是按以下几个步骤进行： 2. 分析最优解的性质，并刻划其结构特征。 3. 递归地定义最优值。 4. 以自底向上的方式或自顶向下的记忆化方法（备忘录法）计算出最优值。 5. 根据计算最优值时得到的信息，构造一个最优解。步骤(1)-(3)是动态规划算法的基本步骤。在只需要求出最优值的情形，步骤(4)可以省略，若需要求出问题的一个最优解，则必须执行步

7、骤(4)。此时，在步骤(3)中计算最优值时，通常需记录更多的信息，以便在步骤(4)中，根据所记录的信息，快速地构造出一个最优解。（三）、动态规划概述1.基本思想：将问题分解为若干小问题，解子问题，然后从子问题得到原问题的解。 2.特点：将问题分解为子问题，这些子问题往往不相互独立。（如果可以用分治法求解，分解的子问题太多，因此，用分治法时间代价太高，消耗指数时间）3.且某些子问题可能被重复多次计算，因此将计算过的子问题的结果保存。一般，放入表中。4.应用：往往求解具有某种最优性质的问题，此类问题往往具有多个解，我们要找到具有最优值的那个解。5.步骤：找出最优解的性质，刻画其特征；递归地定义最

8、优值；以自底向上的方式计算出最优值；根据计算最优值时得到的信息，构造一个最优解。（四）、动态规划问题中的术语阶段：把所给求解问题的过程恰当地分成若干个相互联系的阶段，以便于求解，过程不同，阶段数就可能不同描述阶段的变量称为阶段变量。在多数情况下，阶段变量是离散的，用k表示。此外，也有阶段变量是连续的情形。如果过程可以在任何时刻作出决策，且在任意两个不同的时刻之间允许有无穷多个决策时，阶段变量就是连续的。在前面的例子中，第一个阶段就是点A，而第二个阶段就是点A到点B，第三个阶段是点B到点C，而第四个阶段是点C到点D。状态：状态表示每个阶段开始面临的自然状况或客观条件，它不以人们的主观意志为转移

9、，也称为不可控因素。在上面的例子中状态就是某阶段的出发位置，它既是该阶段某路的起点，同时又是前一阶段某支路的终点。在前面的例子中，第一个阶段有一个状态即A，而第二个阶段有两个状态B1和B2，第三个阶段是三个状态C1，C2和C3，而第四个阶段又是一个状态D。过程的状态通常可以用一个或一组数来描述，称为状态变量。一般，状态是离散的，但有时为了方便也将状态取成连续的。当然，在现实生活中，由于变量形式的限制，所有的状态都是离散的，但从分析的观点，有时将状态作为连续的处理将会有很大的好处。此外，状态可以有多个分量(多维情形)，因而用向量来代表；而且在每个阶段的状态维数可以不同。当过程按所有可能不同的方式

10、发展时，过程各段的状态变量将在某一确定的范围内取值。状态变量取值的集合称为状态集合。无后效性：我们要求状态具有下面的性质：如果给定某一阶段的状态，则在这一阶段以后过程的发展不受这阶段以前各段状态的影响，所有各阶段都确定时，整个过程也就确定了。换句话说，过程的每一次实现可以用一个状态序列表示，在前面的例子中每阶段的状态是该线路的始点，确定了这些点的序列，整个线路也就完全确定。从某一阶段以后的线路开始，当这段的始点给定时，不受以前线路（所通过的点）的影响。状态的这个性质意味着过程的历史只能通过当前的状态去影响它的未来的发展，这个性质称为无后效性。决策：一个阶段的状态给定以后，从该状态演变到下一阶段

11、某个状态的一种选择（行动）称为决策。在最优控制中，也称为控制。在许多间题中，决策可以自然而然地表示为一个数或一组数。不同的决策对应着不同的数值。描述决策的变量称决策变量，因状态满足无后效性，故在每个阶段选择决策时只需考虑当前的状态而无须考虑过程的历史。决策变量的范围称为允许决策集合。策略：由每个阶段的决策组成的序列称为策略。对于每一个实际的多阶段决策过程，可供选取的策略有一定的范围限制，这个范围称为允许策略集合。允许策略集合中达到最优效果的策略称为最优策略。给定k阶段状态变量x(k)的值后，如果这一阶段的决策变量一经确定，第k+1阶段的状态变量x(k+1)也就完全确定，即x(k+1)的值随x(

12、k)和第k阶段的决策u(k)的值变化而变化，那么可以把这一关系看成(x(k)，u(k)与x(k+1)确定的对应关系，用x(k+1)=Tk(x(k),u(k)表示。这是从k阶段到k+1阶段的状态转移规律，称为状态转移方程。最优性原理:作为整个过程的最优策略，它满足：相对前面决策所形成的状态而言，余下的子策略必然构成“最优子策略” 。最优性原理:实际上是要求问题的最优策略的子策略也是最优。让我们通过对前面的例子再分析来具体说明这一点：从A到D，我们知道，最短路径是AB1C2D，这些点的选择构成了这个例子的最优策略，根据最优性原理，这个策略的每个子策略应是最优：AB1C2是A到C2的最短路径，B1C

13、2D也是B1到D的最短路径事实正是如此，因此我们认为这个例子满足最优性原理的要求。（五）、标号法标号法是一种最佳算法，多用于求图的最短路问题。一、标号法的概念：所谓标号，是指与图的每一个顶点相对应的一个数字。标号法可以说是动态规划，它采用顺推的方法，对图的每一边检测一次，没有重复的回溯搜索，因此标号法是一种最佳算法。二、标号法的算法流程：现有一图G，求从起点Vs到终点Ve的最短距离。设：Sum(j)顶点Vj的标号，代表的是Vs到Vj的最短距离。Vj已标味着Vs到Vj的最短路以及这条路径的长度已求出。 M(i,j)Vi到Vj的非负长度。 H(j)顶点Vj的前趋结点。标号法的算法流程如

15、m:Array 1.100,1.100 of integer;m:Array 1.100,1.100 of integer;h:Array 1.100,1.100,1.2 of byte;f1,f2:text;a,b,x1,y1,x2,y2,n,k,zz:integer;procedure print;vara,b,x,y,x3,y3:integer;c:array 1.100 of integer;flag:boolean;beginflag:=true; a:=1; ca:=mx2,y2;x:=x2; y:=y2;while flag dobegina:=a+1; x3:=x; y3:=y

16、;x:=hx3,y3,1; y:=hx3,y3,2;ca:=mx,y;if (x=x1) and (y=y1) then flag:=false;end; 求出整条路径，放入数组C中writeln (f2,zz, ,sumx2,y2);for b:=a downto 1 dowrite (f2,cb, ); 打印结果writeln (f2);end;procedure add(x,y,i:integer;var l:point);vare,f,g:point;a,b,c:integer;flag:boolean;beginnew (e);e.x:=x; e.y:=y;if i=0 then l

17、.next:=e 加入队列else beginf:=l; g:=f.next; flag:=true;for a:=1 to i dobeginif sumg.x,g.ysumx,y then begine.next:=g; f.next:=e; flag:=false; a:=i; 加入队列end;f:=f.next; g:=f.next;end;if flag then f.next:=e; 加入队列end;end;procedure try(xz,yz:byte);vara,b,c,sj,x,y,x1,y1:integer;e,l,v:point;flag:boolean;beginfi

18、llchar (sum,sizeof (sum),255); 置Sum值为-1sumxz,yz:=0;置起点Sum值为0flag:=true;new (e); e.x:=xz; e.y:=yz;new (l); l.next:=e; 起点进入队列c:=1; 现在队列结点个数while flag dobeginv:=l.next; dispose (l); 取出首结点Vl:=v; c:=c-1;指针下移一位，结点个数减一x:=v.x; y:=v.y;if (x=x2) and (y=y2) then flag:=false; 若为目标结点，则结束计算if flag thenbeginfor a:

19、=1 to 4 do 向四个方向扩展beginx1:=x+fanga,1;y1:=y+fanga,2;if (x10) and (x10) and (y1=n) thenbeginsj:=sumx,y+abs (mx,y-mx1,y1);if (sj sumx1,y1) or (sumx1,y1=-1) then beginsumx1,y1:=sj;hx1,y1,1:=x; hx1,y1,2:=y;记录路径add(x1,y1,c,l); 将新扩展出来的结点进入队列c:=c+1; 结点个数加一end;end;end;end;end;print;打印结果end;Beginassign (f1,gdoi974.dat);assign (f2,gdoi974.out);reset (f1); rewrite (f2);readln (f1,n);for a:=1 to n do beginfor b:=1 to n doread (f1,ma,b);readln (f1);end; 读入数组readln (f1,k);

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？