零和博弈:匹配便士游戏
在零和博弈中,一方收益必然等于另一方损失。总收益始终为零。
数学公式:
uA + uB = 0
玩家控制
游戏统计
回合:
0
玩家得分:
0
电脑得分:
0
总得分:
0
(应为零)
收益矩阵 (玩家视角)
电脑:正面
电脑:反面
玩家:正面
+1
-1
玩家:反面
-1
+1
玩家赢 (+1)
电脑赢 (-1)
累计得分图
策略分析
出正面频率:
0%
最优策略:
混合策略 (50% 正面, 50% 反面)
纳什均衡:
双方都以 50% 概率随机选择
正和博弈:囚徒困境
在正和博弈中,合作可以创造额外价值,总收益可以大于零。
合作优于背叛:
uA(合作) + uB(合作) > uA(背叛) + uB(背叛)
玩家 A 控制
游戏统计
回合:
0
玩家 A 得分:
0
玩家 B 得分:
0
总得分:
0
(合作时更高)
合作率:
0%
收益矩阵 (玩家视角)
B: 合作
B: 背叛
A: 合作
(3, 3)
(0, 5)
A: 背叛
(5, 0)
(1, 1)
相互合作 (3, 3)
相互背叛 (1, 1)
诱惑 (5, 0)/(0, 5)
累计得分图
策略分析
纳什均衡:
双方都背叛 (1, 1)
帕累托最优:
双方都合作 (3, 3)
困境:
个体理性导致集体非理性
历史记录
零和 vs 正和博弈对比
并排比较两种博弈类型的特征和结果。
零和博弈
正面
反面
正面
+1 / -1
-1 / +1
反面
-1 / +1
+1 / -1
总收益
0
合作价值:
无
性质:
纯粹冲突
正和博弈
合作
背叛
合作
(3, 3)
(0, 5)
背叛
(5, 0)
(1, 1)
总收益
6 (合作时)
合作价值:
显著
性质:
冲突与机会
关键差异
| 特征 | 零和博弈 | 正和博弈 |
|---|---|---|
| 总收益 | 始终为零 | 可以大于零 |
| 合作 | 无益 | 可能有益 |
| 双赢可能 | 不可能 | 可能 |
| 经典例子 | 匹配便士 | 囚徒困境 |
纳什均衡可视化
探索混合策略空间和纳什均衡的概念。
混合策略空间
策略概率
50%
50%
期望收益
玩家 A:
0.00
玩家 B:
0.00
纳什均衡点:
p = 50%, q = 50%
为什么是均衡?
任何一方都无法通过单方面改变策略来提高收益。在零和博弈中,纳什均衡是最大最小策略的解。
最佳反应函数
蓝色线:A 对 B 的最佳反应 | 红色线:B 对 A 的最佳反应 | 交点是纳什均衡
现实应用案例
博弈论在现实世界中的各种应用。
零和博弈应用
体育比赛
竞技体育中的胜负关系,一方胜利意味着另一方失败。
期货交易
短期交易中,买方和卖方的收益总和为零(忽略交易成本)。
扑克牌
玩家之间的筹码转移,总金额守恒。
军备竞赛
相对优势的竞争,一方的优势即另一方的劣势。
正和博弈应用
国际贸易
贸易使双方都能获益,通过比较优势创造价值。
气候变化协议
全球合作可以避免灾难性损失,实现共赢。
企业合资
企业通过合作共享资源,创造更大的市场价值。
裁军谈判
双方减少军备可以节省资源,提高安全。
互动案例:贸易博弈
两个国家决定是否开放贸易。开放贸易可以实现双赢,但保护主义可能带来短期优势。
国家 B: 开放
国家 B: 保护
国家 A: 开放
(4, 4)
双赢
(2, 3)
B 占便宜
国家 A: 保护
(3, 2)
A 占便宜
(1, 1)
双输
在这个博弈中,开放贸易是帕累托最优的选择,但保护主义的诱惑可能导致次优结果。