2022/12/28魏光兴重庆交通大学11、囚徒困境与占优均衡Il囚徒困境(Prisoners Dilemma)u来源:普林斯顿大学的塔克(tunker)教授杜撰的u故事梗概:两个小偷行窃未果被抓,隔离审讯。“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。坦白否?u六个基本要素分别是什么?u基于收益矩阵(payoff matrix)的模型描述:-8,-80,-10-10,0-1,-1囚徒 A坦白抵赖坦白抵赖囚徒 B2022/12/28魏光兴重庆交通大学21、囚徒困境与占优均衡IIl占优战略/优势策略/上策(dominant strategy)u无论其他局中人如何行动,总是(严格地)优于其他战略的战略,称为(严格)占优战略。而被(严格地)占优的战略称为(严格)劣战略。u博弈局中人一定会选择占优战略,一定不会选择劣战略。l纳什均衡u各博弈方都不再改变自己的行为时的战略组合,因为即使改变也不能提高自己的收益。l占优均衡u其中各战略都是各局中人的占优战略的战略组合u占优均衡并不常见,因为很多时候不存在