不完全信息博弈:贝叶斯纳什均衡与类型空间
1 完全信息与不完全信息的区别
到目前为止,我们分析的博弈均假设所有参与人的收益函数是公共知识(complete information)。现实中,这一假设极为强烈:
- 企业不知道竞争对手的真实成本
- 买家不知道卖家的保留价格
- 雇主不知道求职者的真实能力
- 政府不知道纳税人的真实收入
不完全信息(incomplete information):某些影响决策的参数(收益、类型、偏好)是某参与人的私有信息,其他人不知道(但通常对其分布有信念)。
2 Harsanyi类型空间框架
2.1 类型(type)的引入
Harsanyi(1967–1968) 提出了处理不完全信息的标准框架:将每个参与人的私有信息浓缩为其类型 $\theta_i \in \Theta_i$(type)。类型完整刻画参与人的偏好、信念,及对他人信念的信念……(即信念层级,belief hierarchy)。
收益函数:包含类型的完整形式为 $u_i(a, \theta)$,依赖所有参与人的行动组合 $a$ 和类型组合 $\theta = (\theta_1, \ldots, \theta_n)$。
2.2 先验分布与共同先验假设
设存在联合先验分布 $p(\theta) = p(\theta_1, \ldots, \theta_n)$,所有参与人对此分布的事实是公共知识(共同先验假设,common prior assumption)。
参与人 $i$ 的条件信念:在知道自己类型 $\theta_i$ 后,$i$ 对他人类型 $\theta_{-i}$ 的条件后验为:
$$p(\theta_{-i} | \theta_i) = \frac{p(\theta_i, \theta_{-i})}{p(\theta_i)}$$
2.3 贝叶斯博弈的标准式表述
贝叶斯博弈(Bayesian game)可表示为 $G = \langle N, {\Theta_i}, {A_i}, {u_i}, p \rangle$,其中:
- $\Theta_i$:参与人 $i$ 的类型空间
- $A_i$:行动空间
- $u_i(a, \theta)$:依赖类型的收益函数
- $p(\theta)$:类型的联合先验分布
3 贝叶斯纳什均衡
3.1 策略、期望收益与均衡定义
在贝叶斯博弈中,纯策略 $s_i : \Theta_i \to A_i$ 是类型到行动的映射(随类型而定的策略)。混合策略 $\sigma_i : \Theta_i \to \Delta(A_i)$。
参与人 $i$ 在类型 $\theta_i$ 下的期望收益(给定他人策略 $\sigma_{-i}$):
$$U_i(\sigma_i(\theta_i), \sigma_{-i} | \theta_i) = \mathbb{E}{\theta{-i} | \theta_i}\left[u_i(\sigma_i(\theta_i), \sigma_{-i}(\theta_{-i}), \theta)\right]$$
定义(贝叶斯纳什均衡,BNE):策略组合 $(\sigma_1^, \ldots, \sigma_n^)$ 是贝叶斯纳什均衡,若对所有 $i \in N$,所有 $\theta_i \in \Theta_i$:
$$\sigma_i^(\theta_i) \in \arg\max_{a_i \in A_i} \mathbb{E}{\theta{-i}|\theta_i}\left[u_i(a_i, \sigma_{-i}^(\theta_{-i}), \theta)\right]$$
直觉:每个类型的参与人,在对他人类型的信念下,选择最大化期望收益的行动。BNE是"期望收益最优反应的不动点"。
3.2 与纳什均衡的关系
可将贝叶斯博弈转化为等价的完全信息扩展博弈(Harsanyi的贡献):将"类型 $\theta_i$ 的参与人 $i$" 视为独立的参与人,共 $\sum_i |\Theta_i|$ 个参与人,再对此大博弈求纳什均衡——这等价于原贝叶斯博弈的BNE。
4 计算:一阶价格密封拍卖
4.1 设置
两个投标人,估值 $v_i$ 在 $[0, 1]$ 上独立均匀分布,互相不知。双方同时提交标书 $b_i \geq 0$,出价高者以其出价成交,等价时随机分配。
4.2 对称线性均衡的推导
猜测对称线性均衡:$b^*(v) = \alpha v + \beta$(每个类型的参与人出价是自身估值的线性函数)。
参与人1出价 $b_1$,赢得拍卖当且仅当 $b_1 > b_2 = b^*(v_2)$,即 $v_2 < \frac{b_1 - \beta}{\alpha}$。
参与人1的期望利润(在 $v_2 \sim U[0,1]$ 下):
$$\pi_1(b_1 | v_1) = (v_1 - b_1) \cdot \Pr\left(v_2 < \frac{b_1-\beta}{\alpha}\right) = (v_1 - b_1) \cdot \frac{b_1 - \beta}{\alpha}$$
对 $b_1$ 求导,令一阶条件为零:
$$-(b_1-\beta) + (v_1 - b_1) = 0 \implies 2b_1 = v_1 + \beta \implies b_1 = \frac{v_1 + \beta}{2}$$
与猜测 $b^*(v) = \alpha v + \beta$ 比较,得 $\alpha = \frac{1}{2}$,$\beta = \frac{\beta}{2}$,解得 $\beta = 0$。
对称线性BNE:
$$b^*(v) = \frac{v}{2}$$
含义:每个投标人出价正好是估值的一半——竞争使其无法过高出价,但为赢得拍卖又不能出价太低。
5 贝叶斯博弈中的战略效应
5.1 双边拍卖与贸易无效率(Myerson & Satterthwaite, 1983)
设置:卖方私有保留价格 $c \sim U[0,1]$,买方私有估值 $v \sim U[0,1]$,独立。若 $v > c$,则贸易创造剩余 $v - c > 0$,社会最优是交易。
结论(Myerson-Satterthwaite不可能定理):不存在满足以下条件的机制:(1) 激励相容(个体不愿虚报私有信息);(2) 个体理性(双方自愿参与);(3) 预算平衡(不需外部补贴);(4) 在所有类型对 $(v, c)$ 上实现最优贸易。
意义:私有信息本身就是贸易的障碍!即便潜在贸易是有效率的,信息不对称也可能使其无法完全实现。这是逆向选择问题的核心,也是市场失灵的博弈论基础。
5.2 信贷配给中的信息不对称
**Stiglitz & Weiss(1981)**模型:借款人的投资风险 $\theta$ 是私有信息。银行无区别贷款,利率 $r$ 提高时:
- 低风险借款人(期望收益低)逐渐退出市场(逆向选择)
- 存续借款人投更高风险项目(道德风险)
均衡:存在利率上限 $r^$,超过此水平银行反而降低利润。均衡下银行选择 $r^$ 而非市场出清利率,导致信贷配给——部分合理借款人拿不到贷款,即便愿意支付更高利率。
6 相关均衡:超越纳什均衡
6.1 相关均衡的定义(Aumann, 1974)
相关均衡(correlated equilibrium)弱于贝叶斯/纳什均衡,允许借助公共协调信号:
设存在相关设备发出信号 $s_i$ 给参与人 $i$(各人信号可相关)。收到 $s_i$ 后,参与人选择行动 $a_i$。策略 $\sigma_i : S_i \to A_i$ 形成相关均衡当且仅当:观察 $s_i$ 后,$\sigma_i(s_i)$ 是对他人策略和信号分布的最优反应。
性质:
- 每个纳什均衡都是相关均衡(退化情形)
- 相关均衡集是凸多面体(更易计算)
- 相关均衡可帕累托优于任何纳什均衡
例(鸡博弈/Chicken Game):红绿灯作为协调机制——交通灯随机指示"谁先走",双方遵从即构成相关均衡,其期望收益可高于任何纳什均衡。
7 小结:私有信息的核心影响
| 效应 | 机制 | 经典案例 |
|---|---|---|
| 逆向选择 | 信息不对称导致低质量产品驱逐高质量产品 | 二手车市场(Akerlof, 1970) |
| 道德风险 | 事后行动不可观察,激励扭曲 | 保险、委托-代理 |
| 信息租金 | 高类型享有私有信息带来的额外收益 | 拍卖、机制设计 |
| 贸易障碍 | 私有信息本身妨碍帕累托改进 | Myerson-Satterthwaite |
| 战略信息传递 | 私有信息持有者的披露策略 | 信号博弈(下篇) |
不完全信息博弈从根本上改变了均衡分析——私有信息使均衡策略成为类型的函数,信息结构决定了市场效率、制度设计的可能性边界。
参考文献
- Harsanyi, J. C. (1967–68). Games with incomplete information played by Bayesian players. Management Science, 14(3–5), 159–182, 320–334, 486–502.
- Aumann, R. J. (1974). Subjectivity and correlation in randomized strategies. Journal of Mathematical Economics, 1(1), 67–96.
- Myerson, R., & Satterthwaite, M. (1983). Efficient mechanisms for bilateral trading. Journal of Economic Theory, 29(2), 265–281.
- Stiglitz, J., & Weiss, A. (1981). Credit rationing in markets with imperfect information. American Economic Review, 71(3), 393–410.
- Akerlof, G. (1970). The market for “Lemons”: Quality uncertainty and the market mechanism. Quarterly Journal of Economics, 84(3), 488–500.