1、2005 中国经济学年会论文(管理经济学)技术变迁路径依赖的演化博弈分析找这个写手帮忙,原创包过关! 号是,一六四五一五六九七技术变迁中路径依赖(path dependence)的思想最早见于经济史学家、美国斯坦福大学教授 Paul A. David 于 1975 年出版的技术选择、创新和经济增长 一书,不过当时并未引起重视。八十年代,David 与美国圣达菲研究所的 W.Brian Arthur4 5教授将路径依赖思想系统化,很快使之成为现代经济学中发展最快、应用价值最高的学说之一。David 的路径依赖思想来自于他对打字机史的研究。1936 年,美国发明家 Dvorak 博士历经十余年的研
2、究,发明了一种新的键盘,起名为 ASK 键盘(美式简化键盘,American Simplified Keyboard,后被称为 DSK 键盘) ,声称比打字机发明者、美国人Sholes 1870 年设计的、现在通用的 QWERTY 键盘效率更高。据说,当初 Sholes 在研制打字机时,为了解决打字员打字速度过快造成挤塞的问题,故意打乱了字母排列顺序,而按照直到今天仍通行的QWERTY 顺序排列。不过,ASK 键盘并没有站住脚,慢慢地销声匿迹了,QWERTY 独霸键盘市场。David(1985)认为,QWERTY 键盘之所以能在市场上占统治地位,不是因为它最好,而是因为它最早。这种情况被称为路
3、径依赖。对非理性路径的依赖将旧技术的使用者锁定在过时的技术解决方案中。 在经济史文献中,除了打字机键盘外,学者们发现许多技术存在可能非效率的现象。在19世纪90年代,汽车可以用蒸汽、或汽油、或电池作为动力,核能可以由轻水、或汽冷、或重水、或钠冷反应堆来产生;录象机可以按Betamax或VHS制式来制造、计算机操作系统中的MAC、IBM 以及微软等等。然而最终只有一种技术在技术竞争中占据相对优势地位,技术变迁中普遍存在路径依赖和技术“锁定”效应。这些现象是如何产生以及是否可以改变一直是经济学家关心的问题。David(1985,1987) 6 7指出了三种可能导致技术变迁路径依赖现象的原因:技术的
4、相关性(technical interrelatedness)、投资的准不可逆性(quasi-irreversibility)和正的外部性或规模的报酬递增。Arthur(1989,1994)重点研究了技术变迁中递增报酬与路径依赖的关系。他认为技术通过四种机制显示报酬递增:第一种是用中学:技术被采用的越多,使用它们获得的经验越多,它们被改进的越多,从而被采用的越多;第二种是网络外部性:技术的第一个采用者根据自己的需要和偏好选择技术并把外部性加于下一个采用者,而不是探索最终能给所有人带来更高报酬的有前途的、但成本高昂的技术。第三种是规模经济:大规模组织或固定成本,随着产量的增加会出现单位成本下降的
5、优势。第四种是适应性预期:市场越是流行,人们越是相信它会进一步流行, 实现自我增强的良性循环, 从而在竞争中战胜对手。相反, 一种较之其他技术具有更优良品质的技术可能由于晚一步, 没有得到足够的追随者而陷入恶性循环, 甚至被锁定在某一无效率的状态下, 难以自拔。总之, 细小或偶然的事情和事件通常会把技术发展引入特定的路径, 而不同的路径会导致完全不同的结果。David和Arthur认为技术变迁是一受“正反馈机制“影响的系统,它具有如下几个特征:(1)多重均衡(mutiple equilibria) ,即系统演进的结果不是单一的,而是存在多种选择的方案;(2)闭锁,即一旦偶然性因素使某一方案被采
6、纳,收益递增机制便会阻止它受外部因素的干扰或被其他方案替代;(3)可能非效率,人们对其他方案的利用开发和动态认识被阻止,从而使陷入闭锁状态的方案并非最优;(4)路径依赖,即系统演进的路径决定于系统的初始状态,对初始状态中的偶然性事件十分敏感,系统一旦采纳某方案,该系统的演进路径便会呈现前后连贯、相互依赖的特点。我国学者蒋德鹏和盛昭瀚(2001)8通过建立动态随机系统模型也论证了技术变迁中多重均衡性与锁定现象出现的可能,不过,也有学者反对技术变迁中路径依赖的观点。1990年,美国得克萨斯大学达拉斯分校的Leibowitz和Margolis(1990) 9批评了David关于路径依赖的观点,认为D
7、SK键盘比QWERTY键盘效率更高的断言是由一些有欠缺和值得怀疑的证据支持的,而且,工效学的研究证明,Dvorak的发明并没有太大的、科学上可以信赖的优点。QWERTY键盘只所以存续下来,不过是打字机生产者之间激烈竞争的结果,而不是所谓的路径依赖的结果。Leibowitz和Margolis(1994) 10进一步认为,路径依赖的破除可以通过两种方式达到:提前预见到不同选择的结果和有机会在选择前进行充分沟通。除非经济主体不愿意改变,否则路径依赖并不是不可避免的。我们认为,David和Arthur与Leibowitz和Margolis的观点都有失偏颇。前者忽视了存在路径破解的种种可能,而后者假设经
8、济主体是“超理性”的,具有完全的预见能力,这与现实中人的“有限理性”是相悖的,且信息不完全和交易成本的存在妨碍着事前的充分沟通。我们用非对称复制动态博弈模型证明,在技术变迁中,路径依赖和非路径依赖都是存在的,而且路径依赖在一定条件下是可以破解的。2 技术变迁的非对称复制动态博弈模型演化博弈包含如下的假设:1、采用高得益策略的博弈方与那些采用低得益策略的博弈方相比,更容易重复自己的策略;因而长期来看后者在人群中的比例将会减少;2、博弈方具有模仿其他博弈方的行为,而且得益与模仿的倾向间存在着相关性,这可以理解为博弈方模仿的概率与自己的概率负相关,而与他们要模仿的对方的得益正相关;3、近视眼(myo
9、pia) 。当某个博弈方变更策略时,总是将现在的策略分布作为已知条件,然后变更到与此相对应的一种最佳策略中。在上述假设下,我们首先构造一个非对称复制动态博弈模型来分析技术的变迁过程。这个模型适合分析学习速度较慢的有限理性博弈方的动态策略调整及其稳定性。博弈方的速度较慢表现为向优势策略转变是一个渐进的过程,不是所有博弈方同时调整,策略调整速度可以用生物进化的进化动态方程复制动态公式表示。假设有两类博弈群体,一类是技术的提供者,比如厂商,用 F 表示;另一类是技术的使用者,比如消费者,用 C 表示;市场上有两种技术可被选择,技术提供者的战略空间为:SF=s1,s2,其中, s1 表示技术提供者选取
10、技术 1, s2 表示技术提供者选取技术 2;技术使用者的战略空间为: Sc=s1,s2,其中 s1,s2 的含义同上,由此构造出一个随机配对的博弈矩阵(见图 1) 。这个模型代表了一些现实世界中两种技术选择的例子,比如前面所论述的 QWERTY 键盘和 DSK 键盘之间或者录像机制式 VHS 和 Betamax 之间的选择。技术使用者s1 s2 s1 s2图 1这里我们假定 a、 c 为技术的提供者和使用者都选取技术 1 时所得的收益。 b、 d 为技术的提供者和使用者都选择技术 2 时所得的收益。当博弈各方选取的技术不同时,双方的收益均为 0。另外我们假设技术 2 比技术 1 能带来更高的
11、效率,即 a b/(a+b)时, p*=0 和p*=1 是 p 的两个稳定状态,其中 p*=1 是演化稳定策略;当 q d/(c+d)时, q*=0 和q*=1 是 q 的两个稳定状态,其中 q*=1 是演化稳定策略;当 p d/(c+d)时, q*=0 和 q*=1 仍是 p 的两个稳定状态,其中 q*=0 是演化稳定策略。两个群体类型比例变化复制动态的关系如图 2 所示:图 2从图 2 可以看出,该博弈将收敛于两点(0,0)和(1,1) ,这分别对应于两个演化稳定策略,一是 p*=0 和 q*=0,另一是 p*=1, q*=1,即演化博弈的最终均衡可能有两个,或者所有技术提供者和使用者都选
12、择技术 1,或者所有技术提供者和使用者都选择技术 2。技术 1 是否最终被厂商和消费者选择取决于博弈的初始状态。图 2 中 L1 线和 L2 线将平面图分成了四部分。具体讨论如下:(1)当初始状态落在左下区域时,即博弈开始有少于 d/(c+d)的技术提供者和少于 b/(a+b)的技术使用者采用技术 1 时,博弈将最终收敛于演化稳定策略 p*=0 和 q*=0,技术 1 将最终完全不被采纳;(2)当初始状态落在右上区域时,即博弈开始有多于 d/(c+d)的技术提供者和多于 b/(a+b)的技术使用者采用技术 1 时,博弈将最终收敛于演化稳定策略 p*=1 和 q*=1,技术 1 将最终完全被采纳
13、;(3)当初始状态落在左上和右下区域时,博弈既可能收敛于(0,0)点,也可能收敛于(1,1)点,其最终均衡状态与双方学习调整的速度有关;当在左上区域时,如果演化动态首先穿过 L2 线进入右上区域,则最终均衡为 p*=0 和 q*=0;如果演化动态首先穿过 L1 线进入左下区域,则最终均衡为 p*=1 和 q*=1;初始状态在右下区域情形与左上区域正好相反。 通过以上的模型分析可以看出,博弈初始状况的不同,会导致两种不同的均衡结果,初始采用某一策略的概率的偏爱(bias)使得技术变迁过程趋同于或被锁定于博弈的一个均衡点。技术演化可能存在多种潜在结果,即存在多重均衡,次优的技术有可能得到演化进入均
14、衡状态,并且经济主体没有利益动力去向更好的技术转变,所以演化稳定的结果不一定具有帕累托效率。3 技术锁定破解的博弈分析上面的非对称复制动态博弈模型虽然很好解释了技术变迁中多重均衡和次优技术形成“锁定”的原因,但在针对次优技术的“锁定”是否可以破解及如何破解上,需要对上面的模型进行修改才能得出有益的启示。注意以下三种情形:(一)外来群体的加入:当一个新的采用技术 2 的外来群体加入到原来的技术提供者这一博弈群体时,总的人口数将增大,如果外来群体的侵入使得采用技术 2 的比例超过了 b/(a+b),采用技术 1 的厂商群体将向技术 2 转移。同样地,当一个新的采用技术 2 的外来群体加入到原来的技
15、术使用者这一博弈群体时,如果外来群体的加入使得采用技术 2 的比例超过了 c/(c+d),采用技术 1 的技术使用者群体也将向技术 2 转移。(二)技术的兼容性:如果技术 2 与技术 1 存在兼容性,技术提供者和技术选择者选择技术 2 的得益将不再是 0,我们将图一的矩阵修改为图三所示。这里 UI、 UII都小于 a, UIII、 UIV都小于 c,由于前面假定 ab, cd,因此有 UIab,UIIab, UIIIcd, UIVcd。技术使用者s1 s2 s1 s2图 3 此时技术提供者选取技术 1 的期望收益为 uf1、选取技术 2 的收益为 uf2,平均收益为u f,则:uf1 = q*
16、a + (1-q)* UI = aq + (1-q)UIuf2 = q*UII + (1-q)*b = qUII + b(1-q)uf = p*uf1 +(1-p)*uf2 = apq + p(1-q)UI + (1-p)qUII +b(1-q)技术提供者群体的复制动态方程为:a,c UI,U IIIUII,U IV b,d技术提供者!语法错误, F = p(uf1 -uf ) = p(1-p)(a+b- UI-UII)q+UI-b, dpdt关系图中 L1为: q =( b-UI)/( a-UII)+( b-UI) = 1-( a-UII)/( a-UII)+( b-UI)技术使用者的期望收
17、益分别为:uc1 = p*c + (1-p)* UIV = cp + (1-p)UIVuc2 = p* UIII + (1-q)*d = pUIII +d(1-p)uc = q*uc1 +(1-q)*uc2 = cpq + q(1-p) UIV + (1-q)pUIII +d(1-p)技术使用者群体的复制动态方程为:!语法错误,F = q(uc1-uc ) = q(1-q)(c+d-UIII-UIV)p+UIV-ddqdt关系图中 L2为: p =( d- UIV)/( c-UIII)+( d-UIV) = 1-( c-UIII)/( c-UIII)+( d-UIV)技术 2 与技术 1 兼容
18、性越强,意味着技术提供者选择技术 2 的得益 UII越接近于 a,技术使用者选择技术 2 的得益 UIII越接近于 c,这表现为关系图中线 L1越接近于 q=1,线 L2越接近于 p=1, 此时博弈只需要极少的人采用技术 2 就可能收敛到(0,0)点,即全部采用技术 2。因此当具有帕累托效率的技术 2 与技术 1 越兼容时,越可能替代技术 1 成为均衡结果。(三)具有快速学习能力的少数博弈群体。现实生活中参与者可能并不是与社会的全体成员发生博弈,也就是说,在每个时期,每个参与者只与他相关的群体的参与者或邻里的参与者发生关系。我们通过构造一个局部相互作用结构的博弈模型(如图 4)来说明此情况。这
19、个模型表现了少数有快速学习能力的有限理性博弈方之间的反复博弈和策略演化。在这个模型中,假设全部参与者为 5 人,在每个时期,每个参与者只与他相关的群体的参与者或邻里的参与者发生关系。5 个博弈方分别位于圆周的5 个位置上,每个博弈方都与各自的左右邻居反复博弈。 图 4由于博弈方是有限理性的,在初次博弈时每个位置的博弈方既可能采用技术 1,也可能采用技术2。假设在 t 时期,参与者的策略配置是( s1, s1, s1, s1, s2 ) ,也就是说参与者 1 到 4 选择技术1,而参与者 5 选择技术 2。每个参与者使用简单的策略调整,这一调整是在参与者的邻里给定的策略的分布中进行的。对参与者
20、i 来说,如果一个他的两个邻居都选择策略 s1(或 s2) ,那么在下一时期也选择 s1(或 s2)是有利的。如果邻居的策略分布是给定的(1/2,1/2) ,那么 i 在下一时期将选择s2,因为 s1 的平均收益为 a/2,低于 s2 的平均收益 b/2。显然,在(t+1)时期,上述 t 时期参与者的策略配置变成了( s2, s1, s1, s2, s1 ) 。类似地,我们可以得到(t+2)时期的策略配置为:( s1, s2, s2, s1, s2 ) , (t+3)时期的策略配置为:( s2, s2, s2, s2, s2 ) , (t+4)时期的策略配置为:( s2, s2, s2, s2
21、, s2 ) 。这说明即使几乎全部参与者在 t 时期选择了一种次优的技术,在最接近的邻里的相互作用的参与者中,更好的技术将最终取得优势地位(如图 5 所示) 。s2 s1 s2 s1 s2s1 s1 s2 s2 s1 s1 s2 s2 s2 s2s1 s1 s1 s1 s2 s2 s2 s2 s2 s2图 5事实上,在图 5 中,由于初次博弈每个位置的博弈方既可能采用技术 1,也可能采用技术 2。因此初次博弈总共有 25=32 种可能的情况,这包括全部采用技术 1 的情况和全部采用技术 2 的情况。不难证明,在图 5 中,如果有一个以上博弈方选择技术 2,最终的结果也必然是全部参与者选择技术
22、2。当初始的博弈配置为( s1, s1, s1, s1, s1 )时,这一情形并不特别稳定,一旦有一个参与者背离而采用得益更高的技术,在一个有限时期,参与者就会向更好的技术( s2, s2, s2, s2, s2 )趋同。按照这种理论分析,所有次优的技术最终都会被更有效率的技术所替代。4 小 结技术变迁的非对称复制动态博弈模型是大量博弈方组成的群体中成员之间随机配对的反复博弈,反映了现实经济中对象或伙伴不固定的、多个或大量个体之间的较长期经济关系。这一模型显示,在技术变迁的发展过程中确实存在多重均衡的问题,动态演化的最终结果是技术竞争中的某种技术要么完全占领市场,要么市场占有率为 0,而且哪一
23、种技术成为主导技术或垄断市场在演化前难以预料。博弈的初始状况对博弈的结果有直接的影响,初始采用某一策略的概率的偏爱决定了最终哪种技术将被采用。如果一种合作博弈策略的相对频率“足够的高” ,对单个参与者来说,选择这种策略是更好的。这一模型较好地解释了技术变迁中的路径依赖现象。在次优技术形成锁定后能否被破解的问题上,本文主要讨论了三种情况:外来群体的加入、技术兼容性和具有快速学习能力的少数博弈群体情况。这些情况都表明,在某些特定环境下,次优技术的锁定状态是不稳定的,更有效率的技术最终会取代次优技术。在运用演化博弈进行技术变迁的分析时,不能忽视模型本身对现实世界的假设和简化。现实中,技术提供者和使用
24、者在技术选择和转换中还受到许多因素的影响,这些因素并没有反映在本文的模型中。在技术提供者技术选择的分析中,技术提供者假设仅仅按照得益而做出选择,忽略了沉淀成本与不可还原性投资的影响;在局部相互作用结构模型中,具有快速学习能力的博弈方忽略了转换成本对技术提供者技术选择的影响。技术提供者存在资产的专用性和互补性问题。不可还原性投资和学习效应带来了厂商资产的专用性和互补性,其结果是资产只能以特定的某种方式服务于特定的目的。此外,人们在次等技术上的经验积累、对过去成功的自满和实验风险的厌恶,也可能造成现实世界中的厂商技术选择中惰性(inertia)的存在。总之,从演化博弈的角度看,技术变迁的过程既可能
25、出现非效率技术“锁定”的结果,也可能出现非效率技术被更有效率的技术取代的结果。最终哪个技术取得优势地位受许多因素影响,初始状态、外部环境、技术兼容性、转换成本、有限理性等都将影响到演化的结果。参考文献:1Young,H. Peyton, The Evolution of ConventionsJ. Econometrica,1993,61:5784.2青木昌彦,奥野正宽.经济体制的比较制度分析M.中国发展出版社,1999,257281.3吴炯,彭飞.公司治理结构演进的进化博弈分析J.管理工程学报,2004,2:114116.4Arthur,W. B. Competing Technologie
26、s,Increasing Returns and Lock-in by Historical Events J. The Economic Journal,1989,99:116131.5Arthur,W. B. Increasing Returns and Path Dependence in the Economy M, Ann Arbor: University of Michigan Press, 1994.6David, Paul A. Clio and the Economics of QWERTYJ.American Economic Review,1985,75: 332337
27、.7D David, Paul A. Some New Standards for the Economics of Standardization in the Information Age A. In P. Dasgupta and P. Stoneman (ed.), Economic Policy and Technological PerformanceC, Cambridge, 1987.8蒋德鹏,盛昭瀚.技术的演化与锁定J .管理科学学报,2001,4:5863.9Leibowitz, S., Margolis, S. The Fable of the Keys J. Journal of Law evolutionary game; multiple equilibraJEL Classification: O330; C790