1、第四节 凸函数函数f定义在Rn的子集S上,值域为实数或者.集合|称为f的上图,记为epi f.如果epi f 为Rn+1的子集上的凸集,我们称f为凸函数.S上的凹函数就是凸函数的反面.S上的仿射函数就是具有确定的凸性或者凹性的函数.S上凸函数的有效定义域是f上图到Rn的投影,我们记为dom f ,即dom f=x|=|.这是一个Rn上的凸集,因为它是凸集epi f在线性变化下的像.它的维数叫做f的维数.一般地,f的凸性就取决于dom f到f的约束条件,所有的兴趣就集中在这个约束条件上,S本身没起多大的作用.很显然,为什么我们只考虑有确定有效定义域C的凸函数是有很重要的原因的.两个处理方法可以使
2、用.一个方法是仅仅关注不含的函数,从而使S与dom f相符合(随着f的不同而不同).当然,也可以关注所有Rn上的函数,因为S上的凸函数可以通过补充定义f(x)=(当x),可以扩张成为Rn上的凸函数.第二个处理方法将在本书中阐明.此后,除非特别声明,我们认为凸函数就是指定义在全体实值Rn(包括无穷大)上的凸函数.然而,这个方法会牵涉到+的算术运算,我们给出如下规则:,, =, ()=()=, 0=, ()=()=, 00=0=0=0()=()0, ()=inf =+, sup =由于运算和+没有定义,我们需要避免.在这些原则下,以下的运算法则成立:=,()+=+(+),=,()=(),(+)=+
3、,为了避免需要小心,比如避免除数为0.在实际中,一般假设运算不包括无穷大,所以不会产生矛盾.如果f的上图是非空的并且不包含垂直线就是真凸函数.比如说如果存在x使f(x).因此,f是真凸函数当且仅当凸集C=dom f是非空的.换一种说法,Rn上的真凸函数是从非空凸集C上取有限凸函数,并且f(x)=(xC)扩充到Rn函数.不是真凸函数的凸函数为非真的.真凸函数是我们所要学习的,但是非真凸函数在很多情况下也会由非真凸函数产生,并且考虑它比排除它方便的多.一个不是或的简单的非真凸函数的例子是R上如下定义的函数:凸函数有重要的插值性质.通过定义,S上f是凸函数当且仅当.属于epi f,属于f,0.换言之
4、,存在和.这还可以用多种方法表述,以下两种不同形式的表达最有用:定理 4.1. 设f是凸集C(例如C= R2)到的函数,那么f是C上的凸函数必须且只须 对任何成立.定理 4.2. 设f是Rn到的函数,那么f是凸函数必须且只须 对成立.另外的重要形式可以通过定理 2.2.推出.定理 4.3. 1(Jensen不等式)设f是Rn到上的函数.f是凸函数必须且只须对成立.证明 非常简单,留作练习.当然,在相同条件下,凹函数满足相反的不等式.仿射函数满足上述的等式情形.因此,Rn上的仿射函数是Rn到R的一个仿射变换.定理4.1.中不等式通常被用作凸集C到的函数f的凸性的定义,但是这个方法会带来麻烦.因为
5、当f能取到时会出现的情况.当然,定理4.2.可以用来定义一般情况下的凸函数.但是,这一节开头部分的定义似乎更好,因为它利用了几何知识,而几何是凸分析理论的基础.一些古典凸函数的例子可以从如下定理获得:定理4.4. 设f是开区间上的二阶连续可微实值函数.则f是凸函数必须且只须它的二阶微分在区间非负.证明 首先,假设在非负,则在上是不减的.当,且有由于有两式两边分别乘以和,再相加,有该式左边即通过定理4.1.就证明了的凸性.考虑定理的反面,假设在区间不是非负的,则是某个连续区间是负的.考虑区间有因此从而在就不是凸函数.产生矛盾.定理4.4.将由定理24.1.和定理24.2推广到一般情况.由定理4.
6、4.下列函数是R上的凸函数:1.2.3.4.考虑多维的情形,从定理4.1可知:函数 且 在上显然为凸函数,对于仿射函数在上确实具有这种形式(定理1.5).对于二次型函数:其中Q为n阶的对称矩阵,当且仅当Q为半正定时,即对,时,在上为凸函数. 根据定理4.4该结论显然成立.定理4.52. 设为开凸集,为二次连续性可微函数,那么为凸函数必须且只须其海赛矩阵 对一切的为半正定矩阵. 证明 C上的函数的凸性等价于约束函数的每一部分在凸性,也就是说等价于函数在实开区间, 上的凸性. 简明表示如下: 由定理4.4可知,对 ,为凸函数当且仅当对于 ,都成立. 上的一个有趣凸函数的凸性能被定理4.5证实,这个
7、函数就是几何平均值的相反数.函数表示如下: 于是可得其中, 由于 .故对非负. 上最重要的一个凸函数是欧几里得范数x=.当时为绝对值函数,欧几里得范数的凸性需满足下面两个条件.x+yx+y, = 凸集与凸函数的对等关系是很重要的数学工具,简单的联系到上C的示性函数,其表达式横截面C的半圆柱是示性函数的上图,显然若为凸集必须且只须)在上为凸函数.正如特征函数在分析中所起的作用一样,示性函数在凸分析中也有很重要的作用.对于上的凸集,其承托函数定义为()=supy.度规函数定义为=inf, 距离函数定义为=inf.现在,这些函数的凸性可以直接证明.我们将在下一节给出凸性的一般性原则. 通过一种重要的
8、方法,可以由凸函数产生凸集.定理4.6. 对于任意的凸函数和- +,水平集以及是凸集.证明 严格不等式的结果显然可以从定理4.2.得到.令,当时是凸集的交集,如果用几何学的知识来探讨函数的凸性,可以看做epi的交集在上以及超水平集(x,u)在上的投影.所以可以看作是epi的一个横截面.推论4.6.1 设是R上的凸函数, x是实数且,为一任意指标集,则是一个凸集.证明:类似推论2.1.1若f 是一个满足定理4.6的二次函数,则这些点集满足二次不等式则当Q是半正定的f是凸的,这些点集包括所有的椭圆面,抛物面和特定的球面,如. 定理4.6和推论4.6.1在不等式的非线性系统中有非常重要的意义.且凸性
9、也应用到不等式的其他分析中,许多典型不等式被认为是定理4.3的特许情况.例如 以上例6,一个正数 组成的凸组合,我们有由定理4.3,不等式两边乘以-1,然后去指数得特别的,当,这是在正数范围内著名的算术平均值和几何平均值不等式3.有时一个没有凸性的函数可以通过参数的非线性变换转换成凸函数.下面是一个典型的例子. 当且指数是任意的实数(这个函数在第30节有重要应用),在这一节的特殊函数是,在函数g中得,当 .在下一节我们可以看到h以及其该形式的和式函数是凸的.点集可以通过同样的变量代换转换为一个超平面如果一个函数f在上对任意的x 满足 我们称它为正齐次的. 显然,正齐次在上是一个椎体.一个简单的
10、正齐次凸函数但不是线性函数的例子是.定理4.74 . 设: 为正齐次函数,那么f是凸函数的充分必要条件为 (1)证明 应用定理2.6.推论4.7.1. 设是上的正齐性真凸函数,那么对推论4.7.2设是上的正齐性真凸函数,那么对证明 定理4.8. 设是上的正齐性真凸函数,L是的一个子空间,那么为使是L上的线性函数,必须且只须 (1) 又若是L的基,则式(1)也等价于 (2)证明 只需证明式(2)蕴含在L上的线性,事实上,假设式(2)成立,则,于是对于任意,我们有 . 因此 即在L上是线性的.正齐次凸函数将用来刻画在第13节凸集上的函数和第15节的度规函数的性质,正齐次凸函数还将在推论15.3.1
11、和15.3.2讨论.附:1定理4.3.的证明 只需证明必要性.采用数学归纳法.当m=2时有.假设m=k时成立有对成立.现在证明当m=k+1上式也成立.为此任取不妨假设于是令从的凸性和归纳假设得到 =命题得证.2 定理4.5.证明3 给出算术几何平均值的其他证明方法法二 构造函数=,下面求其在条件=r(r0, i=1,2,)下的最大值.设F()=(r-),对F求偏导并令它们都等于零,则有F=(r-)=0(j=1,2,,n-1),解之可得=,从而函数F()的稳定点是(,).为了判断F(,)=为所求条件下的极大值,考虑其Hesse矩阵,为此计算如下:(i=1,2,n),(r-)(i=1,2,n,j=
12、1,2,n,ij).将稳定点代入可得当i=j时 =-2,当ij时 =-,所以Hesse矩阵为=,由于0,要讨论的正负定性只要讨论A=的正负定性.计算可得,A的r阶主子式有相同的结构为(-1-r)由定理1=(r+1)0所以A为负定矩阵.从而为负定矩阵.由定理3知F(,)=为F的极大值,并且此极大值就是最大值.从而=,即 .法三 要求在条件=r(r0, i=1,2,)下的最大值,问题可转换为在条件=r(r0, i=1,2,)下的最大值。设lagrange函数L=+,对L求偏导数并令它们都等于零,则有L= +(i=1,2,),解出=. 以D记n-1维平面上的开区域():0, , i=1,2, ,则当某个0,即()趋近于D的边界时,因此必在D内部某点取得最大值,这一点只能是(,),所以 =,即 .从上述三种方法的分析看出,方法一(即正文中的方法)得先给出重要不等式,方法二和三得有高等数学函数极值理论作基础,方法二牵涉到矩阵的有关知识,这也体现了数学各方面知识的联系性.当然均值不等式的证明也可以采用初等数学的方法,比如数学归纳法,这里就不予以给出.4 定理4.7的证明证明:首先f是凸函数,于是对于任意的,利用的正齐次凸性得到 反之,设式(1)成立对于任意我们 即是凸函数。- 12 -
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。