1、本科毕业论文(20 届)风险规避在解决社会困境中的作用所在学院 专业班级 应用物理 学生姓名 学号 指导教师 职称 完成日期 年 月 风险规避在解决社会困境中的作用摘要自利经常导致从事合作活动的个体去选择不利于合作进行的行为。 “搭便车者”可以侵入合作者的社会,并造成的社会悲剧。这样的社会困境可以通过正或负的激励去克服。即使一种激励制度可以使合作者社会免于“搭便车者”的侵入,但是它始终不能把一个“搭便车者”的社会转变成合作者的社会。在后一种情况下,合作和背叛这两种现象是稳定存在的。为了避免形成完全背叛,在最初合作者必须具有足够众多的数量,那时“搭便车者”的社会就会陷入一种社会陷阱,而且除非在高
2、昂的,几乎令人难以接受的成本支持下,制度才能使其摆脱这种社会陷阱。下面,我们分析由(a)制度提供的激励和(b)自愿参与影响之间的相互作用。我们发现,这样的组合能从根本上提高激励的效率。特别是,非强制的参与能够使惩罚“搭便车者”的制度在一个非常低的成本下去克服社会困境,并促成一个整体稳定的合作机制。这样不仅消除了社会陷阱,而且通过社会学习我们可以知道,不管最初的合作者的数量是多少,当一个合作者的社会不会被“搭便车者”入侵时,从长远来看,它必然会确立的。我们也可以证明相比奖励机制, “轻碰”式的惩罚机制可以以更低的成本去保证充分合作的实现。关键字:惩罚机制 奖励机制 公共物品 社会契约 演化博弈T
3、he take-it-or-leave-it option allows small penalties to overcome social dilemmasABSTRACTSelf-interest frequently causes individuals engaged in joint enterprises to choose actions that are counterproductive. Free-riders can invade a society of cooperators, causing a tragedy of the commons. Such socia
4、l dilemmas can be overcome by positive or negative incentives. Even though an incentive-providing institution may protect a cooperative society from invasion by free-riders, it cannot always convert a society of free-riders to cooperation. In the latter case, both norms, cooperation and defection, a
5、re stable: To avoid a collapse to full defection, cooperators must be sufficiently numerous initially. A society of free-riders is then caught in a social trap, and the institution is unable to provide an escape, except at a high, possibly prohibitive cost. Here, we analyze the interplay of (a) ince
6、ntives provided by institutions and (b) the effects of voluntary participation. We show that this combination fundamentally improves the efficiency of incentives. In particular, optional participation allows institutions punishing free-riders to overcome the social dilemma at a much lower cost, and
7、to promote a globally stable regime of cooperation. This removes the social trap and implies that whenever a society of cooperators cannot be invaded by free-riders, it will necessarily become established in the long run, through social learning, irrespective of the initial number of cooperators. We
8、 also demonstrate that punishing provides a “lighter touch” than rewarding, guaranteeing full cooperation at considerably lower cost.Key Words: Punishment Rwards Public Goods Social Contract Evolutionary Games 目 录第一章 引言 .11.1 研究背景及意义 .11.2 研究现况 .11.3 本论文的研究内容 .2第二章 模型及动力学 .32.1 可选择的公共物品博弈模型 .32.2 激励
9、机制 .32.3 复制者动力学 .3第三章 结果及讨论 .5第四章 结论 .13参考文献 .15天津理工大学 2014 届本科毕业论文1第一章 引言1.1 研究背景及意义在很多物种中,合作行为是通过自然选择逐步形成的。此外,在人类社会中,合作行为的建立也可以通过制度去促成。借用奥斯特罗姆 1的解释,制度可以被看做是提供使人类克服社会困境成为可能的激励的工具。惩罚的威胁或是奖励的承诺可以使”搭便车者”更愿意去支持公共利益,从而远离“搭便车”行为 2-13。1.2 研究现况很容易理解,公共物品博弈的效果取决激励的大小。如果激励太小,它不会起效果而且自利者会通过不对公共利益做贡献来保持背叛(如图 1
10、a) ,从另一方面来看,如果激励十分大,它会强迫所有的玩家通过对公共利益做贡献来促成合作(如图 1d) 。这便是中等利益激励的作用范围,在这里,正的激励和负的激励的方式的作用效果不同。奖励机制会使背叛者和合作者稳定的共存,而且奖励越高,合作者占的比例越大(如图 1b) 。相反,惩罚机制则会导致另一种稳定状态。由于背叛者与合作者之间的竞争,一方或另一方的行为会被确立下来,但不会存在长期的共存(如图 1c) 。无论任何行为,都是最初盛行到形成完全建立。因此,两种行为每一种都可以被看做是一种社会规范:只要一方坚持下去,它就不会发生偏离。特别是,当合作者在最初很少,人们会陷入在自私的社会规范中,所有人
11、都会出现背叛行为。在那种情况下,社会文化不能引领人们进入更有益的合作的规范中。天津理工大学 2014 届本科毕业论文2图 1.1 XXXXFig.1.1 XXXX1.3 本论文的研究内容这里,我们发现放弃合作行为 14-17的选择提供了一种逃脱社会困境的方法。实际上,当“搭便车”行为成为常态时,玩家会远离没有希望的合作行为,这样会导致剥削者人数的下降,进而使合作者重新崛起。如果激励太低,紧接着则是背叛者再度回归,这样就处于一种“石头布剪刀”循环中 18,19 (如图 2a) 。然而,即使是一个适中的惩罚就会打破这种循环并能够使合作规范稳固(如图 2c-g) 。因此,非强制的参与允许永久地逃离社
12、会陷阱。相比之下,我们发现非强制的参与对奖励机制影响不大(如图 2b-d) 。天津理工大学 2014 届本科毕业论文3第二章 模型及动力学2.1 可选择的公共物品博弈模型具体来说,我们将运用演化博弈论 20来研究文化的演变,并基于(a)社会学习(即,优先模仿更成功的策略)和(b) 特殊的探索方法(建立小的和罕见随机微扰模型) 。因为公共利益相互作用和制裁机制的多样性是巨大的,我们首先提出一个典型问题的分析性的科学调查。我们假定有一个巨大的,完全均匀分布的群体。不时的,有一个人数在 n 2 的随机样本,在成本 g 0 下有机会参与到一个公共物品博弈中。我们指出有 m 个玩家愿意参与(0 m n)
13、并假设当有 m 2 个玩家参与时博弈开始。如果博弈开始,则这 m 个玩家中的每一个决定是否贡献出一个固定的金额 c 0,并知道它将乘以 r(1 r n)和均匀分布在所有其他的 m-1 个玩家成员中。如果所有玩家成员投资建设公共水池,每次获得收益 (r 1)c g,我们假设收益是正的。那么社会困境的产生则是因为有玩家可以不贡献固定金额 c 而提高他们的收益。如果所有玩家都这样做,每次获得的负收益是g。如果不参与其中,他们应该获得更好的收益。2.2 激励机制我们现在引入激励。可以很方便的书写出由权威机构规定的总激励的形式 mI,其中 I为人均激励。如果只采用奖励机制,则总奖励将会被玩家中的合作者分
14、享。因此,每个合作者得到的奖励是 mI/mc,其中 mc 表示在 m 个玩家中合作者的数目。如果只采用惩罚机制,则每个背叛者的收益会相似地减少 mI/mD,其中 mD 表示在 m 个玩家中背叛者的数目。我们将看到,在强制情况下存在两种可供选择的中等强度的惩罚机制,特别是,同质的背叛者群体无法从社会陷阱中逃脱(如图 1) 。而在非强制的情况下,文化的演变会导致形成一个稳定的同质型的合作者群体(如图 2e-g) 。因此,自愿参与可以克服一直困扰着强制情况下的社会陷阱。值得注意的是,在强制情况下,这些是在 1/n 的必要成本下可以达到(SI 文本,S2) 。天津理工大学 2014 届本科毕业论文42
15、.3 复制者动力学我们对潜在的演化博弈分析是以复制者动力学(例如,20)为基础的,提出了三个方案:C(合作者) , D(背叛者)和 N(不参与) ,和他们分别出现频率 x,y 和 z。状态空间 是由所有满足 x, y, z 0 和 x + y + z = 1 两个条件的频率坐标(x,y,z)组成的三角形。如果 0 g (r 1)c,在缺少激励的条件下,这三种方案会形成一个 “石头剪刀布”的循环。正如图3.1 说示:D 克制 C,N 克制 D 以及 C 克制 N。在状态空间的内部,所有复制者动力学的轨迹都是从 N 出发并汇聚于 N(z=1) 21。因此,由随机扰动引起合作行为只能短暂的出现。长期
16、的收益都来自于不参与行为(即,0) 。天津理工大学 2014 届本科毕业论文5第三章 结果及讨论如果博弈是强制性的,即所有的 n 个玩家被强制参与其中(z=0) ,结果随着人均激励 I的增加而发生改变(如图 1) 。人均激励 I 很小时,背叛者占据主导地位。这时复制者动力学有两种平衡:一种稳定的平衡(同质的背叛者玩家群体)和另一种不稳定的平衡(同质的合作者玩家群体) 。在奖励机制下,当 I 超过阈值 I- = c/n,平衡点 D 变得不稳定,并产生一个有背叛者玩家和合作者玩家混合的稳定的平衡点 R。如果人均激励 I 继续增加,合作者的比例将越来越大。最后,当人均激励 I 达到阈值 I+ = c
17、,稳定的混合态 R 将融于之前不稳定的平衡点 C,变得稳定。在惩罚机制下,当人均激励 I 超过阈值 I-,不稳定的平衡点 C 变得稳定,并产生一个有背叛者玩家和合作者玩家混合的不稳定的平衡点 R。平衡点 R 从而分隔了点 C 和点 D 平衡的吸引区域。当人均激励 I 继续增加,平衡点 D 的吸引区域越来越小,直到 I 达到 I+时停止变小。这时,不稳定的平衡点 R 融于之前稳定的平衡点 D,变得不稳定。如果 I 值继续增大,所有人都会合作。正如 SI 的 S2 所示,不管我们考虑的是奖励机制还是惩罚机制,I+和 I-的值是一样的。我们接下来探讨(a)激励制度和(b)非强制的参与之间的相互作用。显然,如果公共物品博弈成本太高(即在奖励机制下 g (r 1)c + I 或在惩罚机制下 g (r 1)c) ,玩家将选择不参与。我们也不进一步考虑这个简单的情况。天津理工大学 2014 届本科毕业论文6图 3.1Fig.3.1图 3.2Fig.3.2