1、1(一)函数1 凹(凸)函数1.1 凸集凸集:对于任意两点 和 ,且对于每一个 ,当且仅当uSv0,1为真时,集合 为凸集。(1)wuvnR凸集要求集合内两点之间的连线必须也在集合内,即该集合不存在任何孔,它的边缘也不能有缩进。例如,平面中,一条线段就是一个凸集,而一个圆圈则不是。1.2 凹(凸)函数介绍凸集是为了引入凹(凸)函数:不管是凹函数还是凸函数都要求其定义域是凸集。我们可以先举个例子直观感受下凹(凸)函数的特征,比如函数 就是一24yx个凹函数,它在定义域内呈现出峰形;函数 就是一个凸函数,它在定义域24yx内呈现谷底。现在具体给出凹(凸)函数的定义:对于函数 ,其定义域内任意两个不
2、同的点 和 ,当且仅当:fDR12x121(x)(x)()(0)ttffttt时,函数 f 为凹函数。对于函数 ,其定义域内任意两个不同的点 和 ,当且仅当: 1x2121(x)(x)()(0)tftffttt时,函数 f 为凸函数。若将不等号“ ” 和“ ”分别变换成严格不等号“ ”和“ ”,上述定义便成了严格凹函数和严格凸函数的定义。因为凹函数的定义域为凸集,因此点 也一定在函数的定义域内。12x()tt我们可以利用凹(凸)函数和严格凹(凸)函数判断函数极值的情况。凹函数一定存在绝对极大值,但绝对极大值可能不是唯一的,因为如果山峰包含一个平顶,则可能存在多重绝对极大值。仅当我们限定它为严格
3、凹形函数时,绝对值才可能是唯一的。1.3 凹(凸)函数与凸集的关系首先我们必须区别凸集与凸函数的概念。根据定义,可知当“凸的”在描述集合时,它要求该集合不能出现任何孔,边缘也不能有缩进。这不同于之前的凹(凸)函数:当“凸的”在描述函数时,它确定的是一条曲线或曲面是如何弯曲的。但凹(凸)函数确实与凸集有关。除了定义域都要求是凸集之外,它们都可以引致一个凸集。定理是凹函数 是凸集;(x)f(x),(x)AyDfy,Comment z1: 这里有个问题,我的概念有些模糊,二元的效用函数下,介无差异曲线凸向原点也保证其上等值集为凸集,感觉那时上等值集是平面上可以画出来的。但现在这里的上等值集为凸集应该
4、是三维的,两个凸集有关系吗?2是凸函数 是凸集。(x)f(x),()AyDfy,即,由函数上的点以及函数曲线(曲面)之下的点组成的集合若是凸集 该函数为凹函数;由函数上的点以及函数曲线(曲面)之上的点组成的集合若是凸集 该函数为凸函数。2拟凹(拟凸)函数不管是凹(凸)函数还是严格凹(凸)函数,它们对函数都有比较强的设定。但是通常,理论研究的工作之一是为保证获得结果,识别出我们需要对函数进行的最弱的可行设定。拟凹(拟凸)函数则是一个相对而言更弱的条件。拟凹(拟凸)函数的定义如下:对于函数 ,其定义域内任意两个不同的点 和 ,当且仅当:fDR1x2121min(x),()(0,)fftforalt
5、时,函数 f 为拟凹函数。对于函数 ,其定义域内任意两个不同的点 和 ,当且仅当: 12121a(),(x)(,)fftfrlt时,函数 f 为拟凸函数。若将不等号“ ” 和“ ”分别变换成严格不等号“ ”和“ ”,上述定义便适用于严格拟凹函数和严格拟凸函数的定义。我们也可以通过更直观的方法检验函数的拟凹性和拟凸性。设 为函数 在 水平上的上等值集,00()x,()SyDfy(x)f0y为函数 在 水平上的下等值集。I (x)f0定理对于值域内的所有 y值, 都是凸集 是拟凹函数S:fDR对于值域内的所有 y值, 都是凸集 是拟凸函数()I经济学中常假设拟凹的效用函数。根据定理,拟凹的效用函数
6、保证了其上等值集为凸集。3函数间关系(1) 是(严格)凹函数 是(严格)凸函数;(x)f (x)f(2) 是(严格)拟凹函数 是(严格)拟凸函数;(3) 是(严格)凹函数 是(严格)拟凹函数(反之不成立) ;()f()f(4) 是(严格)凸函数 是(严格)拟凸函数(反之不成立) ;xx(5)单调函数既是拟凹函数也是拟凸函数Comment z2: 稳态值是指选择变量的最优解 还是指函数的*12(,.)nx最优解?产生疑问是f因为蒋中一那本书里提到的是稳定值的概念,用的是后一种表述。前一种表述是高微笔记上记的。3(6)凹(凸)函数相加仍为凹(凸)函数,拟凹和拟凸函数则没有类似关系。(二)无约束的最
7、优化问题1一元函数的无约束极值本讲义将讨论的函数范围限定在二次连续可微函数的范围里。给定一个二次连续可微的一元函数, 。易知,它在 处取得极值的一阶()yfx0x必要条件为: 。而该极值究竟是极大值还是极小值得看 的符号:若()0fx()f,则 为唯一的绝对极大值;若 ,则 为唯一的绝对极小值。()f()f0利用上述极值的导数条件,我们可以推导出极值的微分条件,即:极值的一阶必要条件:对于任意非零 ,函数的一阶全微分为()0dyfxdx零;对于任意非零 ,我们也可以通过222()()ffxdfx计算函数的二阶全微分来判断极值的情况。综上,当函数为二次连续可微时,它取得极值的必要条件为:(1)函
8、数在 取得绝对极大值 ,对于任意非零 都成立; *x*22()0yfdxdx(2)函数在 取得绝对极小值 ,对于任意非零 都成立。*22()f在满足必要条件的前提下,函数取得唯一的绝对极值时充分条件为,对于任意非零 都成立 函数在 取得唯一绝对极大值;2*2()0dyfxdx*x,对于任意非零 都成立 函数在 取得唯一绝对极小值。只要将 改为一阶微分向量 ,以上极值的微分条件能直接从单变量的情况推广至两个甚至多个变量的情况。2多元函数的最优化问题2.1一阶条件稳态值: 上的函数 的稳态值 ,在该点处,nR12(,.)nyfx*12(,.)xTnx下面几个等式同时成立: *21*,.0,().,
9、.nnfxComment z3: 最优解能不能这么表示?在 Reny的附录里有表达式*12(,.)(xnfxf4定理如果在点 ,我们可能得到局部最大(小)值,即对于*12(,.)xTnx一个尽可能小的邻域内,所有点 都有 *12(,.)Tn 12(,.)xTnx,那么稳态条件必然满足。*12(,.)nff2.2二阶条件直觉上,多元函数与一元函数一样,在稳态值取得最大值还是最小值与 的符号有关。2dy我们先对 进行微分,可得:dy2*12 *11212 2*1122(x)().(x).()().()xnnnnnnnfdfdffxdffxfd*12*12.()()nTnnfdfff其中, 为海塞矩
10、阵。根据杨格定理:11*2*12.x().x().()nnHfff,因此海塞矩阵为对称矩阵。ijif在判断 的符号之前,我们先正(负)定矩阵及其判定方法。2dy定义若对于所有的 , 始终成立,则称 正定,A 为正定矩阵;x0()=x0TqA(x)q若对于所有的 , 始终成立,则称 负定,A 为负定矩阵;若对于所有的 , 始终成立,则称 半正定,A 为半正定矩阵;()T()若对于所有的 , 始终成立,则称 半负定,A 为半负定矩阵。x0=x0qAxq根据以上定义,若要判断 的符号,我们只需判定与其对应的海塞矩阵的正(负)定。2dyComment z4: 高微笔记里是前主子阵。看以后感觉那里记的概
11、念不准确,就用了金老师上课用的解释,但只有顺序主子式的介绍,不知道适不适合前主子阵。5其实,通过判定海塞矩阵的正(负)定,我们也可以判定函数的凹(凸)性,即对于二次连续可微函数 , 12(,.)nyfx(1)其海塞矩阵 负定 函数为严格凹函数 存在唯一绝对极大值;H(2)其海塞矩阵 正定 函数为严格凸函数 存在唯一绝对极小值。()接下来介绍正负定的判定方法。定义主子阵:对 矩阵 A,由 A 的 k个主对角线元素及其对应的非对角线元素来得到n的矩阵,称为 A的 k阶主子阵;由 A 的 前 k个主对角线元素及其对应的非对角线元素来得到的矩阵,为 k阶前主子阵。主子阵的行列式为主子式;前主子阵的行列
12、式为顺序主子式。我们用 表示 的 k阶顺序主子式(其中 ) ,如:kD(x)H1,23.n,1()f,122()xf。121212().(x).(x).()nknnffDf定理对于二次连续可微函数, 12,.yx(1) 海塞矩阵正定;0(,.)k(2) 海塞矩阵负定。),Dn用 表示海塞矩阵 H的指标(1,2,3,n)的任意排序, 为 的 k阶顺序主 kDH子式,则(3) 海塞矩阵半正定;0,(1,2.)k(4) 海塞矩阵半负定。),从而,我们给出极值的充分条件:已知二次连续可微函数 , 12(,.)(xnyfxf*12(,.)0(,.)infxi6(1)其海塞矩阵 负定 严格凹函数 为函数的
13、唯一绝对极大值;(x)H*(x)f(2)其海塞矩阵 正定 严格凸函数 为函数的唯一绝对极小值。3 举例:二元函数的无约束极值问题有一个二次连续可微函数 ,12(,)yfx可知其海塞矩阵为 ,则21Hf, ,1Df212f,12,f 1212,ff根据之前的判定规则, (1) , 为严格凹函数;10Df22110ff12(,)yfx(2) , 为严格凸函数;2(3) , 为凹函数;12,f211ff12(,)yfx(4) , 为凸函数;0D220若 ,我们就可以根据函数的凹凸性来判定函数在点*121(,)(,)fxfx取得的是绝对极大值还是绝对极小值。*2,7(三)具有约束条件的最优化问题之前的
14、部分只是考虑了无约束条件的最优化问题,这即是说在求极值的过程中,我们没有对选择变量的值进行约束,从而求得的解可能是负值,也可能很大。然而考虑到经济学是建立在稀缺的资源如何配置的问题上的,因而在经济学的最优化求解过程中,我们通常不得不面临资源的稀缺性即对选择变量的值加上约束条件。约束条件大致分三类:等式约束、非负约束以及更普遍的,其它形式的不等式约束。我们将依次介绍对应的求解方法。从现在开始,讨论将以最大化问题为主,在解决最大化问题后会稍微提及解决最小化问题的方法。1 等式约束关于解决等式约束的方法,其实我们已经学过了,就是利用拉格朗日方法求解的过程。现在简要回顾拉格朗日函数。1.1 二元目标函
15、数、一个等式约束的约束最优化条件考虑二元函数下,具有约束条件的最优化问题 12, 12max(,)yfx.stgc其中 c 是一个常数,z 和 g 都是二次连续可微函数。该问题的拉格朗日函数为: 1212(,)(,)Lfxcx一阶条件要求: *12121(,)(,)0fgxx*12122(,)(,)fL*12(,)0cgx求出上述一阶条件,可得 。*12(,)x二阶条件:将拉格朗日乘子也看作是变量,则最大化拉格朗日函数的过程可视为无约束最优化过程。这也就是说,如果解 满足 L 的无约束极值中极大值的二阶条件,我们便可*12(,)x确定 是我们约束最优化问题的解。事实上在二阶条件求导过程中,这里
16、与无约*12(,)x束最优化关键区别在于, 与 的取值不再是任意非零即可,等式约束中 与 的1dx2 1dx2取值有关。对等式约束 两边求一阶全微分,可得:12(,)gc8, 11220gdgxdxd因此等式约束要求 。12x对函数 进行二阶全微分可得:12(,)yf2122 221212121() () dydxddxfffxfdxffdxxd对 进行二阶全微分,化简可得:12(,)gc2211222 1() 0( )gxgxdgxdd将上式代入 ,可得:2y2 21121()dxLgLg而 。2211210xyyxyLggL定义 为加边海塞矩阵, 它是由海塞矩阵和一阶导数(边)构成0xyy
17、xyHgL的矩阵,用 表示,H 上面的- 表示边。 。则0gxyyxyDL221()dg综上,我们可以得到目标为二元函数、仅包含一个等式约束的最优化条件:当 满足拉格朗日函数的一阶条件时, 为约束极小(大)*12(,)x *12()0,)Dx值。91.1.1 严格拟凹(拟凸)函数与约束极值的关系当函数 y 是二次连续可微时,我们还可以用函数的一阶导数和二阶导数(整理成加边行列式)的方法来检验:设 1220fBff(1) z 为严格拟凹函数;0B(2) z 为严格拟凸函数。将 B 与之前的加边海塞矩阵 进行比较,可以发现两个不同之处:H一为 B 中的加边元素是函数 f 而非 g 的一阶偏导数,二
18、为 B 中的其余元素是 f 而非拉格朗日函数 L 的二阶偏导数。然而,在线性等式约束 的特定情1212(,)xxc况下(这类等式约束在经济学中经常遇到) , 可简化为 ,即 。ijLijfijijLf从而,拉格朗日函数为 1212()()Lfxcx从而且 。0iiifijijLf回到“边” ,我们注意到线性约束函数产生一阶导数 ,因而一阶条件可写为iig。因此 B 中的边只不过是 的边被正的标量 乘。通过顺序提取 的横边和纵iifgHH边的公因子,得到 1212200gfLDff结果,在线性约束情况下, 与 总有相同的符号。BD由此可知,在线性约束的条件下,我们可以通过直接判断目标函数的严格拟
19、凹(凸)性去判断约束极值的情况:(1)目标函数为严格拟凹函数 函数在稳态值取得唯一的约束绝对极大值;(2)目标函数为严格拟凸函数 函数在稳态值取得唯一的约束绝对极小值。1.1.2 拟凹(凸)函数与凹(凸)函数的关系平滑、递增、拟凹的效用函数 上等值集为凸集 凸的向下倾斜的无差异曲线。因为等产量曲线的概念几乎与无差异曲线是一致的,我们可以类推:平滑、递增、拟凹的生产函数 上等值集为凸集 凸的向下倾斜的等产量曲线。Comment z5: 自己的总结,逻辑对么?101.2多元目标函数、m 个等式约束的约束最优化条件现在将拉格朗日方法应用于多元函数。面临的最优化问题为: 12,. 12ax(,.)n nyfx122,.(,.)nmmstgcx拉格朗日函数为: 1(,)+(jjLfcg一阶条件: *1(x)()0,2.)jmjii if nx*(),.jjLcgj二阶条件:此时加边海塞矩阵为: 1110.nmnnngHL定义 。1110.,1,.().kmk kkkgDnmLg利用 我们直接给出多元目标函数、 m个等式约束的约束最优化条件:为满足一阶必要条件的解,则*(x,)(1) 函数在点 取得唯一的约束绝对极大值;10(1,2.,)kDn*x