运筹学-动态规划.ppt
《运筹学-动态规划.ppt》由会员分享,可在线阅读,更多相关《运筹学-动态规划.ppt(66页珍藏版)》请在咨信网上搜索。
1、动动 态态 规规 划划(Dynamic programming)一、引例一、引例二、动态规划的基本思想二、动态规划的基本思想三、应用举例三、应用举例 动态规划作为运筹学的一个重要分支是解决多动态规划作为运筹学的一个重要分支是解决多阶段决策过程最优化的一种非常有效的方法。阶段决策过程最优化的一种非常有效的方法。1951年,年,美国数学家贝尔曼(美国数学家贝尔曼(R.Bellman)等人,根据一类)等人,根据一类多阶段决策问题的特点,把多阶段决策问题变换为一多阶段决策问题的特点,把多阶段决策问题变换为一系列相互联系的单阶段决策问题,然后分阶段逐个加系列相互联系的单阶段决策问题,然后分阶段逐个加以解
2、决。贝尔曼等人在研究和解决了大量实际问题之以解决。贝尔曼等人在研究和解决了大量实际问题之后,提出了解决这类问题的后,提出了解决这类问题的所谓所谓“最优性原理最优性原理”,通常称为,通常称为“贝尔曼最优化原理贝尔曼最优化原理”,从而创建了解决,从而创建了解决最优化问题的一种新的方法最优化问题的一种新的方法 动态规划动态规划(Dynamic Programming )。)。贝尔曼的名著贝尔曼的名著动动态规划态规划于于1957年出版,这成了动态规划的第一本著年出版,这成了动态规划的第一本著作作。一、引例一、引例动态:相对于静态:只考虑一个计划期。动态:相对于静态:只考虑一个计划期。动态规划:考虑多个
3、计划期,多个阶段的优化问题。动态规划:考虑多个计划期,多个阶段的优化问题。研究对象:多阶段决策问题研究对象:多阶段决策问题例例1(时间阶段)某种设备可在高低两种不同的负荷下进行(时间阶段)某种设备可在高低两种不同的负荷下进行生产,设在高负荷下投入生产的设备数量为生产,设在高负荷下投入生产的设备数量为x,产量为,产量为g=10 x,设备年完好率为,设备年完好率为a=0.75;在低负荷下投入生产的;在低负荷下投入生产的设备数量为设备数量为y,产量为,产量为h=8y,年完好率为年完好率为b=0.9。假定开始生。假定开始生产时完好的设备数量产时完好的设备数量s1=1000台。台。制定一个制定一个5年计
4、划,确定每年投入高、低两种负荷下生年计划,确定每年投入高、低两种负荷下生产的设备数量,使产的设备数量,使5年内产品的总数量达到最大。年内产品的总数量达到最大。下图为一个线路网络图,要从下图为一个线路网络图,要从A到到E地铺设一条输油地铺设一条输油管道,各点间连线上的数字表示距离,问应选择什管道,各点间连线上的数字表示距离,问应选择什么路线,可使总距离么路线,可使总距离最短。最短。例例2(空间阶段)(空间阶段)AB2B1B3C1C3D1D2EC252141126101043121113965810521A1234DBCE即在系统发展的不同阶段,根据系统所处的状即在系统发展的不同阶段,根据系统所处
5、的状态,不断地做出决策;态,不断地做出决策;每个阶段都要进行每个阶段都要进行决策决策,目的是使整个过程的决策目的是使整个过程的决策 达到最优效果。达到最优效果。动态决策问题的特点:动态决策问题的特点:系统所处的状态和时刻是进行决策的重要因素;系统所处的状态和时刻是进行决策的重要因素;找到不同时刻的最优决策以及整个过程的最优策略。找到不同时刻的最优决策以及整个过程的最优策略。多阶段决策问题:多阶段决策问题:在多阶段决策过程中在多阶段决策过程中,系统的动态过程可以按照时间系统的动态过程可以按照时间进程分为进程分为状态状态相互相互联系联系而又相互而又相互区别区别的各个的各个阶段阶段;12n状态状态决
6、策决策状态状态决策决策状态状态状态状态决策决策多阶段决策问题的典型例子:多阶段决策问题的典型例子:1.1.生产决策问题生产决策问题:企业在生产过程中,由于需:企业在生产过程中,由于需求是随时间变化的,因此企业为了获得全年的最佳求是随时间变化的,因此企业为了获得全年的最佳生产效益,就要在整个生产过程中逐月或逐季度地生产效益,就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。根据库存和需求决定生产计划。2.2.机机器器负负荷荷分分配配问问题题:某某种种机机器器可可以以在在高高低低两两种种不不同同的的负负荷荷下下进进行行生生产产。在在高高负负荷荷下下进进行行生生产产时时,产品的年产量产品
7、的年产量g和投入生产的机器数量和投入生产的机器数量u1的关系为的关系为g=g(u1)这时,机器的年完好率为这时,机器的年完好率为a,即如果年初完好机即如果年初完好机器的数量为器的数量为u,到年终完好的机器就为到年终完好的机器就为au,0a1。在低负荷下生产时,产品的年产量在低负荷下生产时,产品的年产量h和投入生产和投入生产的机器数量的机器数量u2的关系为的关系为 h=h(u2)假定开始生产时完好的机器数量为假定开始生产时完好的机器数量为s s1 1。要求制要求制定一个五年计划,在定一个五年计划,在每年开始时,决定如何重新每年开始时,决定如何重新分配分配完好的完好的机器在两种不同的负荷下生产的数
8、量机器在两种不同的负荷下生产的数量,使在五年内产品的总产量达到最高。使在五年内产品的总产量达到最高。相应的机器年完好率相应的机器年完好率b b,0,0b b11。3.不包含时间因素的静态决策问题(本质上是不包含时间因素的静态决策问题(本质上是一次决策问题)也可以适当地引入阶段的概念,作一次决策问题)也可以适当地引入阶段的概念,作为多阶段的决策问题用动态规划方法来解决。为多阶段的决策问题用动态规划方法来解决。4 4.线性规划、非线性规划等静态的规划问题也线性规划、非线性规划等静态的规划问题也可以通过适当地引入阶段的概念,应用动态规划方可以通过适当地引入阶段的概念,应用动态规划方法加以解决。法加以
9、解决。(一)基本概念(一)基本概念 1、阶段、阶段 把一个问题的过程,一般根据时间和空间的自然特征把一个问题的过程,一般根据时间和空间的自然特征来恰当地分为若干个来恰当地分为若干个阶段阶段,把问题转化为多阶段求解的,把问题转化为多阶段求解的问题,以便于按一定的次序去求解。问题,以便于按一定的次序去求解。阶段:分段求解的过程。描述阶段的变量称为阶段:分段求解的过程。描述阶段的变量称为阶段变阶段变量量。常用字母。常用字母k表示阶段变量,表示阶段变量,k=1,2,n。2、状态:表示每个、状态:表示每个阶段初阶段初所处的所处的情形或位置情形或位置。通常一个。通常一个阶段初有若干个状态,描述过程状态的变
10、量称为阶段初有若干个状态,描述过程状态的变量称为状态变状态变量量。状态变量常用。状态变量常用sk表示第表示第k阶段的状态变量。状态变量阶段的状态变量。状态变量的取值有一定的允许集合或范围,此集合称为的取值有一定的允许集合或范围,此集合称为状态集合状态集合,用用Sk表示表示。S2=B1,B2,B3,S3=C1,C2,C3 二、动态规划的基本思想二、动态规划的基本思想AB2B1B3C1C3D1D2EC252141126101043121113965810521A1234DBCE 3、决策:表示当过程处于某一阶段的某个状态时,、决策:表示当过程处于某一阶段的某个状态时,可以作出不同的决定(选择),从
11、而确定下一阶段的可以作出不同的决定(选择),从而确定下一阶段的状态,这种决定就称决策。状态,这种决定就称决策。常用常用uk(sk)表示第表示第k阶段当阶段当状态为状态为sk时的决策变量。时的决策变量。从而确定下一阶段的状态从而确定下一阶段的状态。表示决策的变量,称为表示决策的变量,称为决策变量决策变量。决策变量是状态变。决策变量是状态变量的函数。量的函数。在实际问题中决策变量的取值往往在某一范围之内,在实际问题中决策变量的取值往往在某一范围之内,此范围称为此范围称为允许决策集合允许决策集合。常用。常用Dk(sk)表示第表示第k阶段从阶段从状态状态sk出发的允许决策集合,显然出发的允许决策集合,
12、显然AB2B1B3C1C3D1D2EC252141126101043121113965810521A1234DBCED2(B1)=C1,C2,C3D2(B2)=C1,C2,C3 4 4、状态转移方程:是由本阶段的状态转变为下一阶、状态转移方程:是由本阶段的状态转变为下一阶段状态的规律。第段状态的规律。第k+1k+1阶段的状态完全由本阶段的状阶段的状态完全由本阶段的状态和本阶段的决策决定,所以这个规律可以用下面的态和本阶段的决策决定,所以这个规律可以用下面的函数表示为:函数表示为:sk+1=T(sk,uk)状态转移方程:状态转移方程:sk+1=uk(sk)5 5、策略:策略是一个按顺序排列的决策
13、组合的集合,、策略:策略是一个按顺序排列的决策组合的集合,各个阶段的决策求出之后,各个阶段的决策序列就构各个阶段的决策求出之后,各个阶段的决策序列就构成一个策略。即是一个按顺序排列的决策组成的集合。成一个策略。即是一个按顺序排列的决策组成的集合。用用p1,n=u1(s1),u2(s2),un(sn)表示从第一阶段到第表示从第一阶段到第n阶段整个问题的策略。阶段整个问题的策略。pk,n=uk(sk),un(sn)表示表示后部子策略。后部子策略。在实际问题中,可供选择的策略有一定在实际问题中,可供选择的策略有一定的范围,称为的范围,称为允许策略集合允许策略集合。从允许策略集合中找出。从允许策略集合
14、中找出达到最优效果的策略称为达到最优效果的策略称为最优策略最优策略,用,用p1,n*或或pk,n*表示。表示。AB2B1B3C1C3D1D2EC252141126101043121113965810521A1234DBCE 6 6、指标函数和最优值函数:、指标函数和最优值函数:指标函数是指标函数是衡量实现过程优劣的一种数量指标。具衡量实现过程优劣的一种数量指标。具体体含义是不同的,它可能是距离、利润、成本、产量或含义是不同的,它可能是距离、利润、成本、产量或资源消耗等。资源消耗等。阶段指标函数:第阶段指标函数:第k阶段阶段(单个阶段单个阶段),从状态,从状态sk出发,出发,采取决策采取决策uk
15、时的效益,用时的效益,用vk(sk,uk)表示。表示。过程指标函数:各个阶段过程指标函数:各个阶段(多个阶段多个阶段)的总效益。即的总效益。即从第从第k k阶段到第阶段到第n n阶段的总效益,记为阶段的总效益,记为vk,n(sk,pk,n),表,表示初始状态为示初始状态为sk,采用策略采用策略pk,n时从第时从第k阶段到第阶段到第n阶段的阶段的过程指标函数。过程指标函数。最优指标函数记为最优指标函数记为fk(sk),表示从第表示从第k阶段,状态阶段,状态sk采采用最优策略用最优策略pk,n*到过程终止时的最佳效益值,到过程终止时的最佳效益值,fk(sk)与与 vk,n(sk,pk,n)间的关系
16、为间的关系为fk(sk)=vk,n(sk,pk,n*)=当当k=1时,时,f1(s1)就就是从初始状态是从初始状态s1到全到全过程结束的整体最优过程结束的整体最优函数。函数。AB2B1B3C1C3D1D2EC252141126101043121113965810521A1234DBCE过程指标函数过程指标函数Vk,n表示表示在第在第k阶段由点阶段由点sk至终点至终点E的距离。用的距离。用dk(sk,uk)=vk(sk,uk)表示在第表示在第k阶阶段由点段由点sk到点到点sk+1的距离的距离。7 基本方程:基本方程:(1)指标函数为和的形式)指标函数为和的形式(2)指标函数为乘积的形式指标函数为
17、乘积的形式AB2B1B3C1C3D1D2EC252141126101043121113965810521A1234DBCE8、基本方程的原理、基本方程的原理AB2B1B3C1C3D1D2EC252141126101043121113965810521A1234DBCE(二)建立动态规划模型的步骤(二)建立动态规划模型的步骤(逆推法)(逆推法)1、正确、明确地划分阶段正确、明确地划分阶段 k,k=1,2,3,n。依据决策过程的时间和空间的顺序关系。依据决策过程的时间和空间的顺序关系。2、正确选择并确定状态变量正确选择并确定状态变量 sk 及状态集合及状态集合 Sk。状。状态变量的确定有时并非显而
18、易见,要确定它,通常态变量的确定有时并非显而易见,要确定它,通常可对问题作如下分析而帮助确定状态变量可对问题作如下分析而帮助确定状态变量 a.什么关系将各个阶段联系在一起?什么关系将各个阶段联系在一起?b.为了决定今后的最优(子)策略,需要事件为了决定今后的最优(子)策略,需要事件现状的哪些信息?现状的哪些信息?3、确定决策变量确定决策变量 uk 及及决策集合决策集合 Dk(sk)。)。4、写出写出状态转移方程状态转移方程 sk+1=Tk(sk,uk)。)。5、定义阶段指标值(函数)定义阶段指标值(函数)vk(sk,uk)。)。6、定义第定义第 k至至 n 阶段(后部子过程)的最优指标(目标)
19、函阶段(后部子过程)的最优指标(目标)函数数 fk(sk)。)。7、作出动态规划结构图:作出动态规划结构图:sk sk+1=Tk(sk,uk)k阶段阶段fk(sk)k+1阶段阶段fk+1(sk+1)opt(,)vk(sk,uk)uk Dk(sk)8、建立动态规划基本方程:(逆序递推方程)建立动态规划基本方程:(逆序递推方程)fk(sk)=opt vk(sk,uk)+fk+1(sk+1),k=n,2,1uk Dk(sk)fn+1(sn+1)=0或者或者 9、逆序递推求解动态规划基本方程。逆序递推求解动态规划基本方程。求出最优决策序列求出最优决策序列 u*n,u*n-1,u*2,u*110、顺序确
20、定顺序确定最优策略。最优策略。p*1n=u*1,u*2,u*n s1u*1u*2u*nsns2 例、从例、从A 地到地到D 地要铺设一条煤气管道地要铺设一条煤气管道,其中需经其中需经过两级中间站,两点之间的连线上的数字表示距离,过两级中间站,两点之间的连线上的数字表示距离,如图所示。问应该选择什么路线,使总距离最短?如图所示。问应该选择什么路线,使总距离最短?AB1B2C1C2C3D24333321114(一)最短路径问题(一)最短路径问题三、动态规划的应用举例三、动态规划的应用举例 解:整个计算过程分三个阶段,从最后一个阶段开始。解:整个计算过程分三个阶段,从最后一个阶段开始。(1)k=3即
21、(即(C D):):C 有三条路线到终点有三条路线到终点D。AB1B2C1C2C3D24333321114DC1C2C3 当当s3=C1时,时,f3(C1)=mind(C1,D)0=1 ;同样有:;同样有:f3(C2)=3 ;f3(C3)=4 第二阶段第二阶段第三阶段第三阶段第一阶段第一阶段显然有显然有 d(B1,C1)+f3(C1)3+1 f2(B1)=min d(B1,C2)+f3(C2)=min 3+3 d(B1,C3)+f3(C3)1+4 4 =min 6 =4 5(2)k=2(B C):):B 到到C 有六条路线。有六条路线。AB1B2C1C2C3D24333321114DC1C2C
22、3B1B2(最短路线为最短路线为B1C1 D)f3(C1)=1 ;f3(C2)=3 ;f3(C3)=4 d2(B2,C1)+f3(C1)2+1 f2(B2)=min d2(B2,C2)+f3(C2)=min 3+3 d2(B2,C3)+f3(C3)1+4 3 =min 6 =3 5AB1B2C1C2C3D24333321114DC1C2C3B1B2(最短路线为最短路线为B2C1 D)f3(C1)=1 ;f3(C2)=3 ;f3(C3)=4(3)k=1(A B):):A 到到B 有二条路线有二条路线。f1(A)=min =mind1(A,B1)f2(B1)d1(A,B2)f2(B2)(最短路线为
23、最短路线为AB1C1 D)AB1B2C1C2C3D24333321114DC1C2C3B1B2A 6,7=6=min 2+44+3f2(B1)=4 ;f2(B2)=3 AB1B2C1C2C3D24333321114DC1C2C3B1B2A最短路线为最短路线为 AB1C1 D 路长为路长为 6练习练习1:AB1B2C1C2C3C4D1D2D3E1E2E3F1F2G53136876368533842221333525664最优路线为:最优路线为:A B1 C2 D1 E2 F2 G 路长路长18求从求从A到到G的最短路径的最短路径3k=5k=5,出发点出发点E1E1、E2E2、E3E3u5(E1)
24、=F1E1 F1 GAB1B2C1C2C3C4D1D2D3E1E2E3F1F2G531368766835338422123335526643u5(E2)=F2E2 F2 Gu5(E3)=F2E3 F2 Gk=6k=6,F1 G f f6 6(F1)=4(F1)=4F F2 2 G ,f,f6 6(F2)=3(F2)=34k=4,f4(D1)=7 u4(D1)=E2f4(D2)=6 u4(D2)=E2f4(D3)=8 u4(D3)=E2k=2,f2(B1)=13 u2(B1)=C2 f2(B2)=16 u2(B2)=C3f3(C1)=13 u3(C1)=D1f3(C2)=10 u3(C2)=D1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 动态 规划
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。