第6讲: 演化博弈论简介 浙江工业大学经贸管理学院 曹柬A在前面的学习中,我们都假设博弈参与人为完全理性的人;但 在现实中,不存在完全理性的人。 A每个人都有学习和改进过错的经历;每个人学习和改进错误的 速度是有差异的。 A具有快速学习能力的小群体成员之间的反复博弈,可以采用“ 最优反应动态”。 A学习速度较慢的成员组成的大群体中的反复博弈,可以采用“ 复制动态”。 第6讲:演化博弈论简介一、最优反应动态 一、最优反应动态 (一)协调博弈 NE: (A,A) , (B,B) ,(11/61,11/61) 其中,(B,B)为pareto最优,但(A,A)为风险上策均衡 第6讲:演化博弈论简介最优反应动态:能根据对方的上期策略调整自己的策略。 5个博弈方,相邻者彼此博弈,初始策略组合为32种。 实际上为8种:无A,1A,相邻2A,不相邻2A,3连A,非3连A,4A,5A 例如: 令x i (t)为t时期博弈方i 的采用策略A的邻居的数量,则x i (t) = 0,1,2. 可知,当x i (t)22/61时,U A U B 在t时期,当2个邻居中只要有1个邻居 采用策略A,则i在t+1时期