Page QiView

第25章 相关策略与相关均衡(曹乾2016)

第25章 相关策略与相关均衡(曹乾2016)

相关策略与相关均衡 从本章开始,我们研究合作博弈论。我们从解概念的讨论入手,因为它们让我们能 描述参与人之间的合作。本章首先讨论伴随合同的博弈(gameswithcontracts),然后 讨论伴随沟通的博弈(gameswithcommunication)。我们介绍了相关策略概念,说明这 些策略如何描述参与人的合作行动。然后,我们定义和说明相关均衡这个概念,并考察 它与纳什均衡的关系。 相关策略与相关均衡 考察合作博弈的动机在于下列事实:在很多博弈中,与某些非均衡结果相比,纳什 均衡的收益不是最优的。下面我们考察囚徒困境问题[1]的修改版本,它的收益矩阵如 图25—1所示。 C2 y2 x1 2,2 0,6 y1 6,0 1,1 图25一1囚徒困境博奔的收益矩阵 注意,在上面的博弈中,唯一均衡(它正好也是一个严格优势策略均衡)为 (yi,y2),该均衡产生的收益为(1,1)。非均衡结果(x1,c2)产生了更高的收益 (2,2)。在这种情形下,参与人可能希望转换(transform)博弈,使其均衡集包括更 好的结果。实现这种转换的方法有下列几种: ·参与人做出承诺,保证协调他们的行动; ·参与人以合同形式表达约定; ·参与人可能进行重复博弈。

25.1伴随合同的博弈 在伴随合同的博弈中,签订合同的参与人必须按照指定的策略行动,这样的策略称 为相关策略。合同将伴随较少合意均衡的博弈转换为伴随更多合意均衡的博弈。我们用 例子说明合同以及相关策略。 例25.1(伴随合同的囚徒困境博弈)在图25一1所示的博弈中,令两个参与人签 署下列合同(称为合同1)。 (1)如果两个参与人都签署合同,那么参与人1选择策略x1,参与人2选择x2。 (2)如果只有参与人1签署合同,那么参与人1将选择y1。 (3)如果只有参与人2签署合同,那么参与人2将选择y2. 将参与人i(i=1,2)签署合同的行动称为ai。现在我们可以将两个参与人的策略 集分别扩展为S={x,yi,a}和S2={x2,y2,a2}。转换后的博弈有图25—2所示 的收益矩阵。 x2 y2 a2 2,2 0,6 0,6 y1 6,0 1,1 1,1 博 a1 6,0 1,1 2,2 奔论与机 图25一2伴随合同的囚徒困境博奔的收益矩阵 这个转换后的博弈有新的均衡(a1,α2),这是一个弱优势策略均衡,它产生的收 制 益为(2,2)。策略组(y,y2)构成了一个均衡,但它不是优势策略均衡。口 设计 例25.2(伴随额外合同的囚徒困境博弈)如果对于上面的博弈,我们除了引人合 同1之外,再引进一个新的合同(称为合同2),那么收益能进一步改进。这个额外合 同让参与人承诺选择相关策略。这个合同(合同2)如下: ·如果两个参与人都签署合同2,那么策略组以掷硬币决定。如果硬币正面向上, 则选择策略组(x1,y2);如果反面向上,则选择(yi,2)。 ●如果只有参与人1签署合同2,那么参与人1选择。 ·如果只有参与人2签署合同2,那么参与人2选择y2。 如果6和b2分别表示参与人1和参与人2签署合同2的行动,那么扩展后的收益 矩阵将如图25一3所示。这个新博弈有下列均衡: C2 y2 a2 b2 2,2 0,6 0,6 0,6 y1 6,0 1,1 1,1 1,1 a 6,0 1,1 2,2 1,1 b 6,0 1,1 1,1 3,3 图25一3伴随合同1和合同2的囚徒困境博弈

●(y1,y2),均衡收益为(1,1); ●(a1,a2),均衡收益为(2,2); ●(b1,b2),均衡收益为(3,3); ()与中·(()(·))· 表示他以的概率选择α,以的概率选择b;参与人2的混合策略 2.1) 3° 可以验证,上面的均衡都不是优势策略均衡。口 25.2相关策略 在博弈中,参与人的纯策略选择可能彼此相关,原因可能在于参与人在做出自已的 选择之前观察到了相同或相关随机事件。相关策略描述了上面这个特征。另外,正如前 面那些例子说明的,相关策略也描述了参与人通过组建联盟进行合作的行为。 定义25.1(相关策略)令T=(N,(S),(u))是一个策略型博弈。参与人集N 的非空子集C(也称为一个联盟)的一个相关策略是一个概率分布,具体地说,是参与 人纯策略组集合上的任一概率分布。 换句话说,给定联盟C,它的一个相关策略tc属于△(Sc),其中 Sc=XecS 相关策略与相关均衡 N称为大联盟(grandcoalition),符号tv表示大联盟的一个相关策略。 例25.3(相关策略)令N={1,2,3};S={x1,y};S2={x2,y2};S3= {c3,y3,23}。如果C={2,3},那么 Sc=S2×S={(x2x3),(x2,y3),(x2,23),(y2x3),(y2y3),(y2,3)} 联盟C的一个相关策略是Sc上的一个概率分布。例如,(↓,↓,,,1,)对 (y2,23)。 注释相关策略tc∈△(×cS:)可以按照下列方法实施。某个可信赖的中介或者 裁判根据tc这个分布,在Sc中随机选择一个纯策略组。裁判要求每个参与人执行这个 纯策略组中的策略。 注释与以前一样,令S表示 S=SN=XiENS 假设α∈△(S)是所有参与人的任一相关策略。令U:(α)表示当α被实施时参与人i的 期望收益。容易看到

U;(a)=∑a(s)u;(s) sES 令U(α)=(U(α),…,U(α))表示当参与人执行α时的期望收益配置(expectedpay offallocation),即他们得到的期望收益。 注释给定集合(U(α):aE△(S))中的任一配置(参见上一个注释),存在着一个 合同使得如果所有参与人签署这个合同,那么他们将得到这个期望收益配置。 注释可以证明由各个可能的期望收益配置组成的集合(U(α):αE△(S))是R”中 的一个闭且凸的子集。在不至于混淆的情形下,我们将用u(α)取代U(α)。 口相关策略与混合策略 理解相关策略与混合策略组的区别很重要。大联盟N的相关策略是△(X(S))的 元素;混合策略组是×(△(S:))的元素。给定所有参与人的任一混合策略组o,我们总 能找到所有参与人的一个相关策略α使得u:(a)=u(o),Vi∈N。然而,给定所有参与 人的一个相关策略α,我们未必总能找到混合策略组o使得u;(o)=u(α),Vi∈N。 口合同信号博弈 由所有可能联盟的相关策略构成的向量,称为合同(contract)。更正式的定义 如下。 定义25.2(合同)考虑向量t=(tc)ccN。注意, 博 tEXo=N(△(XiEcS)) 奔 论 所有联盟的相关策略构成的向量t是一个合同。 与机 注意,联盟CCN的相关策略tc是说,如果联盟C是由签署合同的那些参与人组 制 成的,那么相关策略tc将被联盟C中的成员实施。显然,合同定义了(事实上,诱导 设 计 出了)一个扩展博弈,这个扩展博弈称为合同信号博弈(contractsigninggame)。 例25.4(以相关策略表达合同)前面,我们以因徒困境博弈的修改版本讨论了两 个合同。注意,合同1可以写为(π,t2,t(1.2)),其中π1=(x:0,y:1);t2=(x2: 0,y21);t(1.2)=((x1,x2);1;(x1,y2):0;(y1,x2):0;(y1,y2):0)。图 25一2中的收益矩阵定义了合同1诱导出的合同信号博弈。类似地,合同2可以写为 (t1,t2,t(1,2)),其中t=(x1:0,y1:1);t2=(x2:0,y2:1);t(1,2)=((x1,x2):0; 一起诱导出的合同信号博弈。口 口个体理性概念 显然,参与人可能不愿意签署裁判提出的任何合同。例如,在图25一1所示的修改 版本的囚徒困境博弈中,参与人1不愿意签署要求他们实施策略组(x1,y2)的合同, 因为这个策略组带给参与人1的收益为零。通过不签署任何合同而仅单纯地选择y,参 与人1总能保证自已的收益为1。我们现在考察参与人对什么合同感兴趣。在第6章和 第7章,我们已经考察了参与人的安全水平(securitylevel)或最大最小值(maxmin

value)概念,它的意思是:给定任一参与人i,当其他参与人可自由选择任何策略时, 参与人i能保证自已得到的最小收益。下式给出了安全水平的自然定义: 0;=maxmin u;(ti,SN-i) tE△(S,)N-ESN-i 其中:SN-=Sv{i,SN-i∈SN-i,u(ti,SN-i)为期望效用,它的表达式为 u;(tiSN-i)=t:(si)u;(si,SN-i) 例如,在图25一1所示的囚徒困境博弈中,参与人1和2的安全水平为v=v2=1。 口个体理性的相关策略 参与人i愿意签署合同从而选择相关策略α仅当u:(a)≥u。这称为参与人i的个体 理性或参与约束。由此可得到下列定义。 定义25.3(个体理性的相关策略)给定N中所有参与人的一个相关策略α∈ △(SX··XS),如果 u;(a)≥u;ViEN 那么我们说该相关策略α是个体理性的(individuallyrational)。 使用两人零和博弈对上述情形进行解释,可以证明,安全水平v:也满足 0= minmaxu(si,TN-i) N-E△(SN-)sES; 第 其中:tN-i=tN\i∈△(SN-i);期望效用u(S,tN-i)为 章 u;(SiTN-i)=tN-i(SN-i)u;(SSN-i) 相 SN-iESN-i 关策 安全水平v是当其他参与人使用任何相关策略来对付参与人i时,参与人i能保证自己 略与 得到的最大期望收益。其他参与人(用来对付参与人i)的一个最小最大相关策略 相 (minmaxcorrelatedstrategy),是使得参与人i的收益等于他(参与人i)的最小最大值 关均 ;的任一相关策略tN-iE△(SN-i)。 衡 口合同信号博奔的均衡 假设参与人独立地决定签署哪个合同。于是,下列命题成立。 命题25.1给定任何个体理性相关策略α,存在着伴随tv=α的合同t,使得所有 参与人签署合同是合同信号博弈的一个纳什均衡。 证明:令αE△(S)为一个个体理性的相关策略。也就是说, u;(a)≥u;ViEN 考虑合同t=(tc)ccN使得tN=α以及tN-i是其他参与人针对参与人i的最小最大策略。 所有其他联盟(即除了N,N一1,",N一n之外的联盟)的tc可以任意选择。令 (a1,,a)为这个合同的合同信号策略组。注意,这个合同信号策略组对应着当所 有参与人签署该合同时的情形。现在,

u;(ai,…,an)=u;(α)(因为tN=α) 因此,对于所有证N,我们有 u;(a,"",an)≥Ui 对于任何s∈S:(其中s≠a),注意策略组(s,a-i)对应着参与人选择s而且所有其 他参与人签署合同的情形。我们有 u;(sia-i)=u;(sitN-i)<u 因为tN-是其他参与人对付参与人i的最小最大策略。因此, NASsA(-)n<(-) 因此,(a1,“,an)是合同信号博弈的一个纳什均衡。■ 因此,任何个体理性的相关策略α∈△(S)将产生一个合同,使得所有参与人签署 这个合同是合同信号博弈的一个纳什均衡。它还说明在合同信号博弈的任何纳什均衡 中,参与人的期望收益不会小于各自的安全水平。这是下一个命题的内容。 命题25.2考虑由相关策略α诱导出的合同信号博弈,在它的任何纳什均衡 (s,s;)中都有u;(s,s=;)≥U,Vi∈N。 证明:反证法。考虑合同信号博弈的任一纳什均衡(s,s:),假设对于某个参与 人i,我们有u(s,s;)<v。现在参与人i可以决定不签署这个合同,而是选择能保 证他得到最小最大值的策略。这就产生了矛盾。证毕。■ 博 奔 根据上面的两个命题可知 论 与机 {u(a):aE△(S)而且u;(a)≥U;Vi∈N} 制 正好是当每个参与人有权不签署任何合同而仅选择S:中的策略时,能在合同信号博弈 设 中实现的收益配置集。这个集合也是一个期望收益配置集,它对应于满足个体理性的相 计 关策略。可以证明,这个集合是闭且凸的。 例25.5(囚徒困境的收益配置)考虑图25一1所示的囚徒困境博弈。任一相关策 略中的期望收益都是不同策略组中收益的一个凸组合,因此,由这个博弈的所有收益配 置构成的集合是一个凸集,该凸集的极值点为(0,6),(6,0),以及(1,1)。参见图 25一4。注意,这个集合也是一个闭集,点(2,2)位于这个集合的内部。满足个体理 性的期望收益配置集是以(1,1),(5,1)与(1,5)作为顶点的三角形。这是因为对 于这个例子来说,V=1,V2=1。注意,这个集合也是闭且凸的。 25.3伴随沟通的博弈 我们已经看到,合同如何将伴随较少合意均衡的博弈转化为伴随较多合意均衡的博 弈。然而,在很多情形下,参与人可能不承诺遵守合同。可能的原因有[1]: ·对合同实施者来说,参与人的策略可能不可观知。 ·没有足够的约束力来保证参与人遵守合同。

相关策略下的收益配置 (1,5) 个体理性的相关策略下 的收益配置 (2,2) (5,1) (1,1) 图25一4(囚徒困境问题的)相关策略下的收益配置向量 ·参与人的策略可能涉及不可转让的权利(也就是说,参与人可能不能转移他们的 权利)。 另一方面,在上述这些情形下,参与人可能仍然能够进行沟通以及协作,从而达到 一个伴随合意收益结构的自我实施的均衡。这样的博弈称为伴随沟通的博弈(games withcommunication)。在伴随沟通的博弈中,参与人的策略选择是明确规定的,这与以 前一样;然而现在,参与人能在一定程度上选择相互沟通。伴随沟通的博弈未必存在任 相关策略与相关均衡 何合同。尽管没有合同约束,这样的博弈仍能实现有趣的结果。 例25.6(伴随沟通的博弈)某两人博弈有图25一5所示的收益矩阵。显然,这个 博弈有3个纳什均衡。 ●(x1,x2),它对应的收人为(5,1); ●(y1,y2),它对应的收入为(1,5); ●混合策略纳什均衡((,),(,2)),它对应的收人为(2.5,2.5)。 y2 x1 5,1 0,0 y1 4,4 1,5 图25一5伴随沟通的博弈:一个两人博弈的例子 注意,(y1,x2)不是一个纳什均衡,尽管它明显有合意结果(4,4)。这个结果可 以凭借有约束力的合同而实现。然而,如果不能使用合同,我们就不能肯定我们能实现 结果(4,4),也不能肯定能实现比(2.5,2.5)更好的结果。可以证明,这里存在着 相关策略使我们得到比(2.5,2.5)更好的结果,如下例所示。口

例25.7(相关策略1)令参与人通过掷硬币进行策略选择:他们以1/2的概率选 择(xi,c2),以1/2的概率选择(y1,y2)。这指的是下列相关策略 注意,u(α)=u2(α)=3。为了实施这个相关策略,参与人可以投掷硬币,当硬币正面 向上时选择结果(x1,x2),当硬币反面向上时选择结果(y1,y2)。为了做到这一点, 参与人需要沟通和协作。这个相关策略对应的结果是自我实施的(self-enforcing),这 是因为任何一个参与人单方面偏离这个结果都不会改善自己的收益。 上面相关策略还有一种实施方法,即引人一位公正的裁判。裁判帮助参与人交流和 分享信息:他以概率0.5和0.5随机推荐策略组(x1,x2)和(y1,y2)。假设每个参 与人仅能通过裁判知道裁判推荐给他的策略。 ·如果裁判推荐参与人1选择x,而且参与人1认为裁判推荐参与人2选择2, 那么由于参与人1相信参与人2选择x2,参与人1发现他自已的最优反应是选择x1, 因此,他接受裁判的推荐。 ·如果裁判推荐参与人1选择,而且参与人1认为裁判推荐参与人2选择y2, 那么由于参与人1相信参与人2选择y2,参与人1发现他自己的最优反应是选择y, 因此,他接受裁判的推荐。 ·如果裁判推荐参与人2选择2,而且参与人2认为裁判推荐参与人1选择x1, 那么由于参与人2相信参与人1选择x1,参与人2发现他自已的最优反应是选择x2, 博 奔 因此,他接受裁判的推荐。 论 ·如果裁判推荐参与人2选择y2,而且参与人2认为裁判推荐参与人1选择y, 与 机 那么由于参与人2相信参与人1选择,参与人2发现他自已的最优反应是选择y2, 制 因此,他接受裁判的推荐。 设 计 综上可知,我们的确可以使用裁判机制来实施上面的相关策略。口 例25.8(相关策略2)我们现在考察可用裁判机制实施的另外一个相关策略。考 虑下列相关策略 α=((x1,x2):; 注意,u(α)=u2(α)=10/3。为了实施这个相关策略,裁判分别以概率1/3随机推荐下 列策略组:(x1,x2),(y,c2),(y,y2)。再一次假设每个参与人仅能通过裁判知道 裁判推荐给他的策略。 ·假设裁判推荐参与人1选择x1。于是,参与人1知道裁判推荐参与人2选择x2。 当参与人2(按照裁判的推荐)执行x2时,参与人1的最优反应是执行x1,因此他愿 意执行x1,从而接受裁判的推荐。 ·假设裁判推荐参与人1选择y。于是,参与人1知道裁判向参与人2推荐混合策 略(x2:0.5;y2:0.5)。当参与人2(按照裁判的推荐)执行该混合策略时:若参与 人1执行x1,他得到的收益为2.5;若参与人1执行y,他得到的收益为2.5。因此,参 与人1对x与y无差异,他也会接受裁判的推荐(因为这没有使他的收益变小)。

上面的分析表明,如果参与人1预期参与人2接受裁判的推荐,那么参与人1也愿 意接受裁判的推荐。 类似地,可以证明,如果参与人2预期参与人1接受裁判的推荐,那么参与人2也 愿意接受裁判的推荐。 上面的分析说明,如果裁判推荐相关策略 ;(x1,y2):0;((yx2):; (yy2):) 那么两个参与人可以达成自我实施的约定:接受裁判的建议。 换句话说,尽管裁判的推荐对这两个参与人没有约束力,但他们发现接受建议符合 他们自己的最大利益。因此,即使不存在合同,伴随沟通的博弈也存在着纳什均衡。这 正是下一节介绍的相关均衡背后的思想。口 25.4相关均衡 考虑下列伴随沟通的博弈的架构。令T=(N,(S),(u))为任何有限策略型博 弈。假设裁判根据概率分布α∈△(S)选择了一个纯策略组(si,·,sn),在这里,概 率分布α是参与人的共同知识。裁判向参与人i(i=1,",n)推荐纯策略s,但不会 向参与人i报告其他人的策略s-i。参与人i可以接受这个推荐,也可以选择策略集S 第 中的任何其他策略。令0:S一S描述了裁判机制下参与人i的策略选择。也就是说, 当裁判向参与人i推荐策略s;时,参与人选择的策略为o(s)。注意,0(s)=s的意思 章 是说,当裁判向参与人i推荐策略s:时,他接受这个策略。 相 关策 定义25.4(相关均衡)给定有限策略型博弈T=(N,(S),(u)>,以及裁判推荐 的相关策略αE△(S),如果 略与相 u;(a)≥∑a(sis-:)u;(o;(si),s-i)8i:S;→SVi∈N (25.1) (s;)ES 关均衡 那么我们说相关策略α是一个相关均衡(correlatedequilibrium)。 注意,当裁判推荐相关均衡时,每个参与人发现他自已的最优反应就是接受裁判推 荐的策略。因此,相关均衡是参与人的任一相关策略,在裁判的帮助下,这个相关策略 可以自我实施,尽管裁判的推荐没有约束力。 口计算相关均衡 可以证明,不等式(25.1)等价于下列不等式 ∑a(s)[u;(sis-i)-u;(s,s-i)]≥0si∈S;Vs∈Si;Vi∈N(25.2) ES 上述等价性的证明方法为:固定s,展开式(25.1)。我们将其留作习题。式(25.2) 断言,对于任何参与人i,当裁判向他推荐策略s时,他无法期望通过使用其他策略 (比如s)来增加自已的期望收益。约束条件式(25.2)称为策略激励约束(strategic

incentiveconstraints)。也就是说,为了保证所有参与人(理性地)接受裁判的建议, 裁判推荐的相关策略必须满足式(25.2)。我们还能注意到 a(s)≥0,sES ∑α(s)=1 sES 注释可以证明,在有限博弈的相关均衡下,由所有收益配置(即收益组)构成的 集合是一个紧且凸的集合。回忆一下,在相关策略下,由所有收益配置构成的集合也是 一个紧且凸的集合;在个体理性的相关策略下,由所有收益配置构成的集合也是一个紧 且凸的集合。 我们考察下列线性规划问题: maxu;(α) iEN s.t. a(s)[u;(ss-)-u(ss-i)]≥OVi∈N;Vs∈S;Vs∈S a(s)≥0,sES ∑a(s)=1 SES 这个线性规划的任何可行解都给出了一个相关均衡。这个线性规划的最优解将给出一个 博奔论与机制设计 使得社会福利最大的相关均衡。 例25.9(计算相关均衡)考虑图25一5所示的博弈。在这里,相应的线性规划问 题为 max6a(xx2)+0a(x1,y2)+8a(y1,x2)+6a(y1,y2) s.t. (5-4)a(x1,x2)+(0-1)a(x1,y2)≥0 (4-5)a(y,x2)+(1-0)a(yiy2)≥0 (1-0)a(x1,x2)+(4-5)a(y1x2)≥0 (0-1)a(x1,y2)+(5-4)a(y1,y2)≥0 a(x,x2)+a(x1,y2)+a(y1x2)+a(y1,y2)=1 它的解为 a(x1,x2)= 这表明,上面的相关策略带给两个参与人的总收益最大。这也表明,在没有约束力的裁 判沟通情形下,期望收益之和不可能大于6 3° 对于这个例子,图25一6分别画出了下列三种情形下的所有收益组(即收益配置) 构成的集合:一是在相关策略下,由所有收益组构成的集合是顶点在(0,0),(1,5), (5,1),(4,4)的凸包;二是在个体理性的相关策略下,这个集合是顶点在(1,1),

(1,5),(5,1),(4,4)的凸包;三是在相关均衡下,这个集合是顶点在(1,5), (5,1),(3,3), u个 相关策略下 由所有收益配置构成的集合 (1,5) (10/3,10/3) 相关均衡下 由所有收益配置构成的集合 个体理性的相关策略下 由所有收益配置构成的集合 (5,1) (3,3) (1,1) 图25一6相关策略下的收益配置以及相关均衡下的收益配置 我们现在可以问个问题:在上面的那些集合中,我们能否选择若干个(可能一个) 合意的或最优的结果?对于两人博弈,这个问题的答案是肯定的,当我们在下一章(即 第26章)讨论纳什议价定理时就能看清这一点。对于多人博弈(含两人博弈),学者们 相关策略与相关均衡 发展出了多种解概念:核、夏普利值、议价集、核仁等。我们将在以后章节学习这些 内容。 25.5小结与参考文献 本章的主要知识点有: ·伴随合同的博弈以及伴随沟通的博弈,对参与人之间的合作提供了两种不同的模 拟方法。合同与沟通将伴随较少合意均衡的博弈转换为伴随较多合意均衡的博弈。相关 策略为伴随合同的博弈与伴随沟通的博弈提供了架构。 ·给定参与人组成的联盟,这个联盟的一个相关策略是该联盟成员策略组(strate gyprofiles)空间上的概率分布。相关策略描述了联盟成员之间的合作。相关策略也表 明,参与人对纯策略的选择可能彼此相关,这是因为他们在决定选择哪些纯策略时可能 观察到相同或类似随机事件。 ·给定大联盟的相关策略,如果在这个相关策略下,每个参与人的期望收益不小于 他的安全水平(即最小最大值),那么我们说这个相关策略是个体理性的。在合同信号 博弈中,个体理性的相关策略诱导出了纳什均衡。

·相关均衡是大联盟的一个相关策略,我们可以将这个相关策略视为裁判向参与人 推荐策略,而且每个参与人自我实施该策略。 ·由所有相关均衡组成的集合可以视为线性规划的可行解。利用这个线性规划,我 们也可以计算使得社会福利最大的相关均衡。 ·下列情形下的收益配置集都是凸且闭的:(1)相关策略下的所有收益配置构成的 集合;(2)个体理性的相关策略下的所有收益配置构成的集合,这个集合与合同信号博 弈的纳什均衡下的收益配置集相同;(3)相关均衡下的所有收益配置构成的集合。 本章讨论的材料基本来自Myerson[1]。相关均衡的概念归功于RobertAumann[2]。 近期涌现了很多关于相关均衡计算的有效率的算法。读者可以参考Chalkiadakis,El- kind,andWooldridgeL3]。至于相关策略和相关均衡的详细处理,读者可以参考Peleg and Sudholter[4],Maschler, Solan, and Zamir[5]。 口参考文献 [1]Roger B.Myerson.Game Theory:Analysis of Conflict.Harvard University Press,Cambridge,Massachusetts,USA,1997. [2]Robert J.Aumann.“Subjectivity and correlation in randomized strategies”.In: JournalofMathematicalEconomics1(1974),pp.67-95. [3]Georgios Chalkiadakis,Edith Elkind,and Michael Wooldridge.Computation- alAspectsofCooperativeGameTheory.Morgan&Claypool,2011. 博奔论与机制 [4]B.PelegandP.Sudholter.IntroductiontotheTheoryofCooperativeGames. Kluwer Academic,Boston,USA,2003. [5]Michael Maschler,EilonSolan,and ShmuelZamir.GameTheory.Cambridge 制 UniversityPress,2013. 设 计 25.6习题 (1)给定策略型博弈以及混合策略组o,求满足u;(α)=u;(o),Vi∈N的相关策略。 (2)假设(o,,o)是策略型博弈T=(N,(S),(u))的一个混合策略纳 什均衡。将这个均衡诱导出的相关策略定义为 a(s1,·,Sn)=o(s)·.·o(sn);Vs;∈S;Vi=1,.·,n 证明这样的相关策略是一个相关均衡。 (3)如果α是策略型博弈的一个相关均衡,证明对于每个参与人i=1,",n, u;(a)等于参与人i的最大最小值。 (4)如果α是矩阵博弈的一个相关均衡,证明u(α)等于该博弈的混合策略中的值。 (5)(举例说明)给出一个策略型博弈,使得混合策略组下的所有收益组构成的集 合与相关策略下所有收益组构成的集合相同。 (6)(举例说明)给出一个策略型博弈,使得混合策略组下的所有收益组构成的集

合是相关策略下所有收益组构成的集合的一个严格真子集。 (7)给定策略型博弈,将相关策略下的最小最大值定义为 U= min maxu;(si,TN-i) N-E△(SN-ES; 利用两人零和博弈情形证明值也满足 U=max min u;(Ti,SN-i) t;E△(S)N-ESNi 其中 ui(tiSN-i)=∑t:(s)u;(Si,SN-i) ss’s (8)给定一个有限策略型博弈,证明下列集合是闭且凸的。 ·相关策略下的所有收益配置构成的集合; ·个体理性的相关策略下的所有收益配置构成的集合; ·相关均衡下的所有收益配置构成的集合。 (9)证明式(25.2)中的不等式等价于式(25.1)中的不等式。 (10)计算下列博弈的所有相关均衡。 C2 y2 C2 y2 x1 2,2 0,6 x1 2,2 0,0 第 25章 y1 6,0 1,1 y1 0,0 1,1 (11)考虑下列两人博弈。 相关策略与相关均衡 A B A 5,5 1,1 B 1,1 3,3 ·分别计算下列两种情形下的所有收益组:(a)相关策略;(b)个体理性的相关 策略。 ·计算使得两人效用之和最大的所有相关均衡。 (12)考虑下列两人博弈。 A B A 4,1 0,0 B 3,3 1,4 计算: ●混合策略组下所有收益配置构成的集合; ●混合策略纳什均衡下所有收益配置构成的集合; ·相关策略下所有收益配置构成的集合; ·个体理性的相关策略下所有收益配置构成的集合;

●相关均衡下所有收益配置构成的集合。 (13)假设o*=(o,,o)是策略型博弈的一个混合策略纳什均衡。考虑由 α*(s1,·",Sn)=o(s1)X·..Xo(sn) 定义的相关策略α。∈△(S)。证明这个相关策略是一个相关均衡。 (14)(编程题)计算有限策略型博弈的相关均衡是一个重要的计算问题。我们已经 证明了这些均衡可以视为线性规划的可行解。编程计算相关均衡以及使得福利最大的相 关均衡。另外,分别计算相关策略下所有收益配置构成的集合、个体理性的相关策略下 所有收益配置构成的集合以及相关均衡下所有收益配置构成的集合。