博弈论:零和与正和博弈

探索博弈论的基本概念:从冲突到合作

零和博弈:匹配便士游戏

在零和博弈中,一方收益必然等于另一方损失。总收益始终为零。

数学公式: uA + uB = 0

玩家控制

游戏统计

回合: 0
玩家得分: 0
电脑得分: 0
总得分: 0 (应为零)

收益矩阵 (玩家视角)

电脑:正面
电脑:反面
玩家:正面
+1
-1
玩家:反面
-1
+1
玩家赢 (+1)
电脑赢 (-1)

累计得分图

策略分析

出正面频率: 0%
最优策略: 混合策略 (50% 正面, 50% 反面)
纳什均衡: 双方都以 50% 概率随机选择

正和博弈:囚徒困境

在正和博弈中,合作可以创造额外价值,总收益可以大于零。

合作优于背叛: uA(合作) + uB(合作) > uA(背叛) + uB(背叛)

玩家 A 控制

游戏统计

回合: 0
玩家 A 得分: 0
玩家 B 得分: 0
总得分: 0 (合作时更高)
合作率: 0%

收益矩阵 (玩家视角)

B: 合作
B: 背叛
A: 合作
(3, 3)
(0, 5)
A: 背叛
(5, 0)
(1, 1)
相互合作 (3, 3)
相互背叛 (1, 1)
诱惑 (5, 0)/(0, 5)

累计得分图

策略分析

纳什均衡: 双方都背叛 (1, 1)
帕累托最优: 双方都合作 (3, 3)
困境: 个体理性导致集体非理性

历史记录

零和 vs 正和博弈对比

并排比较两种博弈类型的特征和结果。

零和博弈

正面
反面
正面
+1 / -1
-1 / +1
反面
-1 / +1
+1 / -1
总收益 0
合作价值:
性质: 纯粹冲突

正和博弈

合作
背叛
合作
(3, 3)
(0, 5)
背叛
(5, 0)
(1, 1)
总收益 6 (合作时)
合作价值: 显著
性质: 冲突与机会

关键差异

特征 零和博弈 正和博弈
总收益 始终为零 可以大于零
合作 无益 可能有益
双赢可能 不可能 可能
经典例子 匹配便士 囚徒困境

纳什均衡可视化

探索混合策略空间和纳什均衡的概念。

混合策略空间

策略概率

50%
50%

期望收益

玩家 A: 0.00
玩家 B: 0.00
纳什均衡点: p = 50%, q = 50%
为什么是均衡?

任何一方都无法通过单方面改变策略来提高收益。在零和博弈中,纳什均衡是最大最小策略的解。

最佳反应函数

蓝色线:A 对 B 的最佳反应 | 红色线:B 对 A 的最佳反应 | 交点是纳什均衡

现实应用案例

博弈论在现实世界中的各种应用。

零和博弈应用

体育比赛

竞技体育中的胜负关系,一方胜利意味着另一方失败。

期货交易

短期交易中,买方和卖方的收益总和为零(忽略交易成本)。

扑克牌

玩家之间的筹码转移,总金额守恒。

军备竞赛

相对优势的竞争,一方的优势即另一方的劣势。

正和博弈应用

国际贸易

贸易使双方都能获益,通过比较优势创造价值。

气候变化协议

全球合作可以避免灾难性损失,实现共赢。

企业合资

企业通过合作共享资源,创造更大的市场价值。

裁军谈判

双方减少军备可以节省资源,提高安全。

互动案例:贸易博弈

两个国家决定是否开放贸易。开放贸易可以实现双赢,但保护主义可能带来短期优势。

国家 B: 开放
国家 B: 保护
国家 A: 开放
(4, 4)
双赢
(2, 3)
B 占便宜
国家 A: 保护
(3, 2)
A 占便宜
(1, 1)
双输

在这个博弈中,开放贸易是帕累托最优的选择,但保护主义的诱惑可能导致次优结果。