1、2012 年诺贝尔经济学获奖理论述评摘要:沙普利、埃尔文罗斯等学者的“G-S 算法”阐述了如何在某些失灵的市场找到可以让市场参与者都能接受的匹配方案。罗斯则运用这种算法,精心设计了各项实验,通过实践验证这种算法的有效性,并取得了非凡的成就,成功地解决了许多市场当前尚未有效解决的问题。本文引用埃尔文罗斯与罗伊德沙普利的经典模型,通过“高校招生”模型说明稳定市场匹配能够实现资源的最优配置。引述沙普利的“联盟博弈”模型,对比帕累托最优的三项必要条件,简要拓展分析稳定匹配理论和市场设计实践与竞争均衡之间的联系,得出市场运行条件更趋于理想化的结论。 关键词:诺贝尔经济学奖;稳定市场匹配;市场设计实践;博
2、弈论 中图分类号:F069.9 文献标识码:A 文章编号:1007-7685(2013)05-0115-05 在现实的市场中,单纯依靠价格机制无法实现资源在买卖双方之间的最优配置。因此,为了形成稳定的市场运行环境,应对种种市场失灵的情况,需要人为地设计一个市场,使这个市场克服信息不完全的缺陷,从而实现资源配置最优的目标。罗伊德沙普利(Lloyd s.Shapley)和埃尔文罗斯(Alvin E.Roth)从稳定匹配理论与市场设计实践相结合的角度出发,针对市场失灵的问题,提出了能够实现资源配置最优的解决方案,并在实际的运用中得到检验,如罗斯设计的纽约高校学生入学申请机制、美国国家住院医师选拔计划
3、(NRMP)的医生供职匹配等等。这两位美国经济学家的研究成果对社会产生了巨大影响,意义深远。正是基于在“稳定市场匹配理论和市场设计实践”研究领域中所作出的杰出贡献,埃尔文罗斯和罗伊德沙普利被授予 2012 年诺贝尔经济学奖。本文引用罗斯与沙普利的经典模型,探讨男女婚配市场的延迟接受算法,即通过不立即作出选择的方式寻找市场中的稳定解,分析这种稳定解除了具有稳定的性质外,是否还具有其他的性质,探究这种稳定解和竞争机制的均衡解是否存在某种联系,并对沙普利的经典模型“联盟博弈”及“雇主工人模型”做出阐释。 一、稳定市场匹配理论和市场设计实践概述 稳定匹配的实质是一种状态,即在这种状态下,分别来自两个集
4、合的个体匹配完成后,不存在其他动机或条件去改变现有的匹配组合。也就是说,在现有匹配组合下,比较其他组合方式下的满意程度而言,每个个体对自身现状的满意程度不会更低,这时就实现了稳定的匹配。倘若在匹配完结后两个集合中出现了新的配对成交意愿,那么现有的匹配组合将不再稳定。在现实中,如男女婚配、学生申请入校、招聘单位与求职者匹配等问题都可以通过稳定市场匹配理论,设计出能够稳定实现接近预设目标的市场机制。在这里,我们仅讨论双向匹配的情况。双向匹配假设市场上有两个相互分离的参与者集合,如买卖双方、学生和学校、婚配中的男方和女方,这两个参与者集合必须能够相互匹配,如此才能发挥这个市场机制的作用。在这种情况下
5、,稳定市场匹配理论的核心思想可以通过以下几种典型的情况加以说明。 (一)男女婚配匹配的解具有稳定性 在求取男女婚配稳定解的过程中,罗斯提到了 G-S 算法(Gale-Shapley Algorithm) 。罗斯假设,在一个社区中,有 n 个男性和 n 个女性,社区中的每一个人都有自己的择偶标准和偏好,并依据这些标准和偏好,对异性集合进行严格的偏好排序。这个实验的目标就是寻找一个男女婚配组合,使得所有的参与者都能够找到伴侣,且能与之形成稳定的婚姻关系。在这里,我们借助男女婚配模型来说明沙普利的延迟接受算法(DeferredAcceptance Algorithm) ,该算法的核心就是不必即时做出
6、选择。因为受到自然条件的限制,每个市场参与者都不可能获得全面的信息,因此就会出现在信息不完全的情况下,市场参与者所选择的配偶并不是他所能够选择的集合中自己最偏好的个体的现象,其直接结果就是不稳定的婚姻关系,并引发相关社会问题。而延迟接受算法能够较好地解决这个问题:第一步,为了更好地择偶,让整个社区的男女自发地把自己的基本信息发送到处理中心,由中心的工作人员收集整理并导人数据库。第二步,把数据库向所有的参与者开放,并让其根据自己的择偶标准对所有的异性做出偏好排序,然后把结果反馈到处理中心,由工作人员整理。第三步,由参与集体中的女性(或男性)集合对所有的偏好结果作出回应。首先,女性将会处理她收到的
7、所有的第一偏好申请,挑选出其中自己最满意的申请者作为自己的正式配偶候选人,其他的申请者予以拒绝。当然,不排除有些女性可能没有收到来自男性的第一申请,这部分女性不必参与上一步。接着,女性将会处理她收到的所有的第二偏好申请,并与上一步的正式配偶候选人进行比较,选择自己最满意的申请者。如果她们发现有比上一步更好的申请者,则保留新的候选人并拒绝原先的候选人。然后,按照上述方法,女性将会处理完自己收到的所有的配对申请。此时,整个实验结束,所有有意愿配对的参与者都能找到自己所能配对的配偶。 接下来,依据罗斯的假设,我们对其进行验证。假设有 A、B、C 三名男性和 a、b、c 三名女性,首先给任意两个异性进
8、行配对组合,并设定异性之间对对方的匹配意愿指数从 3 到 1 依次增加。设:有两个男女配对组合分别为 T1(x11,Y11) 、T2(X22,Y22) ,并假设这两个组合不稳定,而稳定组合为 T3(X12,Y21) 。其中,x 代表该组合中男性对女性的匹配意愿指数,Y 代表该组合中女性对男性的匹配意愿指数。X11、X12分别表示男性 A 对女性 a、b 的匹配意愿指数;Y11、Y21 分别表示女性a、b 对男性 A 的匹配意愿指数;X22 表示男性 B 对女性 b 的匹配意愿指数,Y22 表示女性 b 对男性 B 的匹配意愿指数。 根据之前提到的关于稳定和不稳定的分析,当出现来自不同家庭的两个
9、人“两情相悦”的情况时,这一家庭组合方式将是不稳定的,反之则是稳定的。因此,当上述提到的两个家庭组合不稳定时,如 X11X12 且 Y22Y21,由于匹配意愿指数取值从 1 到 3,因此可以推出 X11、Y22 可以取值的集合是2,3。当 X11=2,Y22=2 时,x12、Y21 的取值均只能为 1,即相对于 T1、T2,稳定组合 T3 为(1,1) 。当 X11=2,Y22=3 时,稳定组合 T3 为(1,2)或(1,1) 。类似的还有当 X11=3,Y22=2 时,或 X11=3,Y22=3 时的情况,相应的稳定组合也可以按上述方法推出。 这个例子可以说明,虽然想找到一个稳定的匹配解并不
10、容易,也许每个人都不能和自己最心仪的人进行配对组合,但是稳定的匹配方案是存在的,并且可以通过这个例子对这个稳定解的求解方法进行探讨。我们也可以假设任意两个男女 A 和 B,这二者在对方的偏好序列上必定处于某个位置。如果 A 最偏好 B,但是之前 A 向 B 求婚时被拒绝了,于是在稳定的匹配中,A 和另一名女性组成家庭,B 和另一名男性组成家庭。这说明 B 对自己现任丈夫的偏好程度高于对 A 的偏好程度,因此也就没有组合新的家庭的动机,证明当前的匹配方式是稳定的。事实上,这种婚配机制的高效是显而易见而且稳定的。罗斯也曾在 2003 年对 G-S 算法做出“合作博弈理论的里程碑”的高度评价,并认为
11、其对博弈理论和市场设计实践具有十分深刻的指导意义。 (二)稳定匹配解是最优且唯一的 通过上述例子我们可以发现,求得一个稳定匹配解是非常困难的,但是对于一个有稳定匹配解的市场来说,稳定匹配解会使市场更加趋于稳定。然而,市场中的主体追求的都是利益最大,那么这个稳定匹配解能否满足这一要求呢?换而言之,这个解是最优解吗? 对于这个问题,我们可以借助“纽约高校学生入学”的例子做出解答和说明,而且需要使用“即刻选择算法” (Immediate selection algofithm) 。与“延迟接受算法”不同, “即刻选择算法”要求参与者面对匹配问题时,必须在限定的时间内直接、一次性做出选择。这种方法在某
12、些领域效率十分低,因为由于没有足够的信息参与者很难针对当前市场情况做出自己满意的选择,所以这种算法并不适应当前的市场状况。以美国为例,某位学生按照自己的偏好递减顺序填写申报志愿,但偏好的趋同性会导致竞争十分激烈,可能使这位学生未被第一志愿学校录取。接着,这位学生的申请会被递交到第二志愿学校,但第二志愿学校的竞争可能也很激烈,或者第一志愿填写该校的学生已经满足全部名额,所以哪怕这位学生的成绩进入第二志愿学校绰绰有余,也同样可能被拒绝。接着,这位学生只能申请按偏好递减顺序排列的其他学校,直到他被录取。很明显,这种录取制度并不合理,不仅会导致学生没有动机去表达自身的真实偏好,使整个报考制度效率低下,
13、而且对学生来说也不公平。罗斯针对这一情况,着手对高校学生录取制度进行重新设计(类似于“男女婚配”问题):所有申报志愿的学生对自己心仪的学校做出从高到低的偏好排列,然后提交到中央信息处理处。各高校首先分别处理收到的学生的第一志愿申请,按自身的招生数量保留符合要求的学生,剩下的拒绝;然后,各高校开始处理收到的学生的第二志愿申请,若有符合自己要求且优于前一批保留下来的学生,则录取该生,并从前一批保留的学生中剔除相应数量的相对较差的学生;接着,开始处理第三批志愿,并依次下去,直到所有的学生志愿都被处理过,整个录取系统运行完毕。这样的录取制度能很好地解决上述各种问题,而且能够维护学校和学生双方的利益,使
14、得每个高中生都能得到一个相对公平的机会。如今美国每年大约有 9 万名高中生通过这一系统进行择校。 在此就罗斯的稳定方案解的最优性和唯一性做出逻辑描述和证明。首先,设定两个命题:(1)在稳定匹配中,被录取的学生达到了学校的标准即学生存在被该校录用的可能性。 (2)被拒绝的学生没到达到录用标准,即该生不可能被这所学校录用。对命题(2)进行逆否:(3)对学生而言存在可能性的学校不会拒绝该学生。综合命题(1)和命题(3)来看:(4)稳定匹配方案中学生被录取后学校不会拒绝该学生。对命题(4)进行逆否:(5)被拒绝的学生是学校在稳定匹配方案中不会录取的学生。综上所述,命题(5)就是结果:稳定匹配方案中,学
15、校录取的是其有意愿且能够录取的学生,即校方已经录取了自己可能录取的全部优质生源。此时的稳定匹配方案不能再做任何改进,即说明这个稳定匹配方案是最优的。至于唯一性问题,假设存在两个不同的最优解,那么至少有一个最优解中的参与者会认为另外一个最优解更好。但是根据最优解的定义:当前方案不可能再做出任何改进,以提升参与者的效益。不难推断,两个或多个最优解的猜想与最优解的定义相悖,因此,最优解就是唯一的。 (三)稳定匹配理论与竞争均衡的联系 沙普利的“联盟博弈”理论认为,在一个市场中,资源累加往往能够创造更多的收益,所以若干参与者为寻求利益最大化,通常会建立合作联盟。沙普利特别指出,由联盟带来的总收益至少不
16、能低于各参与者自身收益的简单加总,这也是稳定匹配的一个必要条件,且由联盟带来的总收益可以在内部通过协商的方式进行分配,不必是平均分配。这里举例说明沙普利做出以上特别说明的理由:假设某一联盟由三名成员A、B、c 组成,联盟形成后的可能最大总收益为 60。A 单独经营的收益为20,B、C 单独经营的收益为 10;如果 A 与 B、C 中任何一位形成联盟,则总收益达到 45;如果 B、C 联盟,则总收益可达 25。显然,最好的结果是 A、B、C 三人联盟,这使资源集中后创造的价值最大化。但是进一步分析可以发现:从 A 的角度来看,是否联盟要看联盟后自己的收益能否比其他的方案更高。在三人联盟中,B、C
17、 至少要获得 25 的收益,否则他们没有意愿和 A 结成联盟。而 A 可以在三人联盟中最多获得 35 的收益。当 A 与任意一人结成两人联盟时,A 最多获得的收益为 32.5。但是,当三人联盟的实际总收益小于 57.5 时,三人联盟中 A 获得的收益可能会比其他匹配方式要低,因此,A 可能会排斥三人联盟,说明这种联盟是不稳定的。因此,沙普利指出,联盟必须能够实现联盟成员收益最大化,只有这样才是稳定的。此时经济剩余最大是否也意味着这是唯一的最优解呢?这就需要与帕累托最优条件进行对比分析。 沙普利指出,在“雇主工人联盟”模型中,会产生利益的两极分化现象。任何一方先发起延迟接受机制,最后匹配的结果就
18、会对该方有利。如,在“雇主工人模型”中雇主发起延迟接受机制时,每个雇主出于自身利益最大化的考虑,开始都给应聘的工人报出最低工资。而对工人而言,都想受聘于开出最高工资的雇主。但在模型中,每个工人最后通过“延迟接受算法”得到的求职结果却是低水平工资。由于整个过程一直都是从实现雇主利益最大化的角度去考虑的,最后的稳定匹配结果便是雇主以工人所能接受的最低工资水平完成整个市场匹配,也就是说,这是雇主最优的稳定匹配。而这对工人也同样适用。在工人主动申请职位的条件下,最后的结果是工人获得雇主所能接受的最高工资水平。但稳定匹配的结果是唯一的,之所以有可能存在某一方占优的情况,是联盟内部对联盟总收益分配的结果。
19、在一个完全竞争市场中,长期均衡即最有效率的配置结束是帕累托最优解,且最优解是唯一的。而在这个模型中,稳定解不但是最优解,而且还是均衡解。因此,在“雇主工人联盟”的模型中,通过以上逻辑推理可以看出,在分配博弈中自由竞争的概念是存在的,稳定匹配理论与竞争均衡之间存在着某种联系。 现在分别对比来看帕累托最优的 3 个条件:(1)没有更好的配置方案可以在不损害他人利益的情况下增加自己的利益。市场在当前资源配置下不存在一种新方法,可以使一部分市场参与者获得的收益得到提升,而不牺牲另一部分人的收益。此时,市场主体间实现稳定的博弈均衡。稳定匹配同样表示当前市场配置是最优的,没有更好的配置方案使参与者有动机去
20、打破当前的市场稳定。 (2)这个经济体必须在自己的生产可能性边界上。也就是说,在这个市场中,总利益要充分发挥到其最大化水平。从“联盟博弈”模型中可以看出,联盟利益最大化是稳定匹配的必要条件,当市场利益没有达到最大化水平时,那么当前的联盟配置也将不是稳定的。 (3)产品混合最优,表示任意两种商品之间的边际替代率和任何生产者在这两种商品之间的边际产品转换率相等,即生产和交换同时达到均衡,没有必要再调整,此时的资源配置效率最优。稳定匹配代表的是一种最优的资源配置方式,同样没有必要再去调整,因为这是博弈双方共同认定的最好结果。在微观经济学的“经济人”假设下,市场参与者必然追寻效用最大化,从这可以看出博
21、弈双方最后共同认定的结果应当是有效率的。 通过以上对比分析可以看出,稳定匹配理论和竞争均衡之间的关系十分密切。在理想的情况下,帕累托最优可以得到实现,这需要现实市场克服信息不对称的问题。事实上,这种问题在现实中几乎不可能通过自然的方式得到解决,从而导致种种市场失灵的情况。为了形成稳定的市场运行环境,需要人为设计一个市场,使这个市场克服信息不完全的缺陷,从而实现资源配置最优的目标。 二、稳定市场匹配理论与市场设计实践的贡献和意义 除去以上所举例子,现实中,罗斯的研究还解决了医生市场的匹配问题。1995 年,NRMP 董事会聘请罗斯针对当地许久未能得到解决的医生就业问题设计新的匹配机制。此举不仅满
22、足了求职者的工作需要,而且还有效解决了夫妻同为医生而共同求职的情况所引发的不稳定问题。据统计,每年有超过 2 万名医生通过该系统实现成功就业。沙普利和罗斯的稳定匹配理论及市场设计实践能够有效解决很多现实问题,提升资源的配置效率,这对我国市场经济建设具有很大的现实指导意义。如,在骨髓匹配问题的研究方面。有报道表明,我国每年三十岁以下的白血病患者高达 3.6 万人,近一半的患者年龄还不到十五岁,对家庭和社会来说都是极大的负担。即使白血病可以通过骨髓移植的方法得到很好的治疗,但要找到能够相匹配的骨髓也十分困难,哪怕是在有血缘关系的亲人中,合适的概率都极低。尤其需要指出的是,当前我国的匹配市场并不能有效帮助患者解决问题。类似的情况同样发生在美国的肾脏移植匹配方面。基于法律和道德的约束,人们不能自由交易肾脏等器官,所以切除和移植手术往往同时进行,效率很低、耗财耗力,不能及时满足患者的需求。于是罗斯提出“搭桥捐赠者” (Bridge Donors)的方案,并被实践证明可以实现移植的非同步性匹配。它要求市场中的患者相互之间签署一个合约:倘若某一方亲属向另一方提供肾脏器官的移植,那么