囚徒困境
一个经典问题,展示了个体理性如何导致集体的非理性。
收益矩阵
选择你的策略
纳什均衡分析
在囚徒困境中,无论对手选择什么策略,背叛都是你的最佳回应。因此(背叛,背叛)是唯一的纳什均衡。然而,如果双方都合作,每个人都能得到3分,比均衡时的1分更好。这就是一个不充分均衡——系统被困在次优状态中。
猎鹿博弈 - 协调博弈
展示协调问题如何导致次优均衡的博弈。
收益矩阵
选择你的策略
多个纳什均衡
猎鹿博弈有两个纳什均衡:(猎鹿,猎鹿)和(猎兔,猎兔)。前者收益更高(收益优势),但后者风险更低(风险优势)。如果不确定对手会猎鹿,猎兔是更安全的选择。这解释了为什么系统可能被困在次优均衡中。
种群动态
观察策略在重复博弈的种群中如何演化。
策略分布
演化过程
理解不充分均衡
什么是不充分均衡?
不充分均衡是指系统被困在次优状态的情况,因为没有个体有改变行为的动机。即使如果能协调改变,每个人都会变得更好,但个体激励维持了现状。
1. 个体理性 ≠ 集体最优
对每个个体来说是理性的选择可能导致群体的糟糕结果。囚徒困境完美地展示了这一点。
2. 协调问题
即使每个人都想达到更好的均衡,也可能无法协调。猎鹿博弈展示了害怕成为"笨蛋"如何使人们陷入次优选择。
3. 路径依赖
历史性意外可能将系统锁定在不充分均衡中。一旦系统建立,转换成本和网络效应会维持它。
书中的真实世界案例
医院死亡率统计
医院不公布死亡率数据,因为这样做会让它们与其他医院相比显得不好。如果所有人都公布,患者可以做出明智的决定,整体医疗保健也会改善。但没有单个医院有动力先公布可能不利的数据。
学术p值
科学界被锁定使用p < 0.05作为统计显著性的阈值,尽管存在已知的缺陷。有更好的替代方案,但期刊、审稿人和研究人员都有动力维持现状。任何偏离的人都面临发表和职业发展的风险。
"红发企业家"迷信
如果一位成功的企业家恰好是红发,人们可能会错误地将红发与创业成功联系起来。这种迷信持续存在,因为:(1)测试成本高昂(需要很多红发企业家),(2)反例被视为例外,(3)顺应表明你理解"文化"。
QWERTY键盘布局
QWERTY键盘布局的设计是为了防止打字机卡键,而不是为了最佳打字速度。存在更好的布局(如Dvorak),但转换成本和网络效应使QWERTY保持主导地位。键盘制造商、打字教师和打字员都有动力维持现状。
何时遵从专业知识 vs 何时质疑系统
遵从专业知识当:
- 该领域有强大的反馈机制和错误纠正
- 专家有切身利益(犯错会承担个人后果)
- 存在积极的竞争和创新
- 你的知识显著少于专家
- 示例:信任工程师关于桥梁设计的意见
质疑系统当:
- 存在弱反馈机制或长延迟
- 专家面临的激励与结果不同
- 该领域停滞,创新很少
- 你注意到持续存在的系统性失败
- 示例:质疑学术出版实践
如何逃离不充分均衡
1. 协调同时行动
让所有人都同意同时切换。这需要信任和沟通渠道。
2. 改变激励结构
修改收益,使期望的均衡成为个体理性的选择。法规或奖励可以有所帮助。
3. 降低转换成本
使个人更容易尝试替代方案。降低障碍促进探索。
4. 创造临界质量
建立足够的替代方案采用率,使网络效应开始对你有利。
延伸阅读
- "Inadequate Equilibria" by Eliezer Yudkowsky 这些概念的主要来源
- "The Evolution of Cooperation" by Robert Axelrod 关于囚徒困境和以牙还牙的经典著作
- "Thinking Strategically" by Avinash Dixit and Barry Nalebuff 优秀的博弈论入门