第5章优势策略均衡（曹乾2016）

优势策略均衡在上一章，我们提供了一些策略型博弈的例子，但未进行分析。自本章起，我们开始分析策略型博弈。我们将定义以下术语：劣势策略，优势策略，优势策略均衡。我们考察三类优（劣）势：强、弱以及极弱。我们将用囚徒困境、布雷斯悖论和第二价格密封拍卖说明这些概念。我们首先介绍强优（劣）势，然后介绍它的弱版本和更弱版本的概念。 5.1强优（劣）势定义5.1（强劣势策略）给定策略型博弈T=（N，（S），（u）），以及参与人i的两个不同策略sES;和sES，若 u;（si，s-;）>u;（siS-i）对于所有s-i∈S-i 则相对于策略s来说s：是强劣势的（stronglydominated），或说，s:强劣于si。我们也说s强优于Si 容易看出，参与人总是偏爱选择策略s而不是si。定义5.2（强优势策略）给定参与人i的一个策略s∈S;，若s强优于此人的每个其他策略s∈S，即若对于所有s≠s，都有 u;（s，s-）>u;（siS-i）对于所有s-i∈S-i 则称s是参与人i的强优势策略（stronglydominantstrategy）。定义5.3（强优势策略均衡）给定博弈T=（N，（S:），（u））及其一个策略组

（s，，s），若对于所有i=1，2，"，n，策略s都是参与人i的强优势策略，则称（s”，，s）为该博弈的强优势策略均衡（stronglydominantstrategyequilibrium）。例5.1回忆一下，在囚徒困境问题中，N={1，2}，Si=S2={C，NC}，收益矩阵为 NC C NC -2，-2 -10，-1 C -1，-10 -5，-5 注意，对于参与人1，策略NC强劣于C，这是因为 u(C,NC)>u(NC,NC) u(C,C)>u(NC,C) 类似地，对于参与人2，策略NC强劣于C，原因在于 u(NC,C)>u2(NC,NC) u(C,C)>u(C,NC) 因此，对于参与人1和2，C都是强优势策略。因此，（C，C）是这个博弈的强优势策略均衡。口注意，如果（理性）参与人有强优势策略，那么我们应该预期他选择该策略。另一方面，如果参与人有强劣势策略，那么我们应该预期他不选择这个策略。优势策略均衡 5.2弱优（劣）势定义5.4（弱劣势策略）给定策略型博弈T=（N，（S：），（u）），以及参与人i的两个不同策略s:ES和sES，若 u;（si，s-i）≥u;（s，s-i）对于所有s-∈S-i 且 ui（si，S-i）>u;（si，S-i）对于某个s-i∈S-i 则相对于策略s来说s：是弱劣势的（weaklydominated），或说，s:弱劣于si。我们也说，s弱优于si。注意到，这里要求严格不等式至少对一个s-：成立。定义5.5（弱优势策略）给定参与人i的一个策略，如果s弱优于此人的每个其他策略s:ES;，则称s为参与人i的弱优势策略（weaklydominantstrategy）。定义5.6（弱优势策略均衡）给定博弈T=（N，（S），（u））及其一个策略组（s，"，s），若对于所有i=1，2，…，n，策略s都是参与人i的弱优势策略，则称（s*，"，s）为该博弈的弱优势策略均衡（weaklydominantstrategyequilibrium）。例5.2将囚徒困境问题稍微修改，得到下列收益矩阵

NC C NC -2，-2 -10，-2 C —2，-10 -5，-5 容易看出，对于参与人1和2，C都是一个弱优势策略。因此，策略组（C，C）是一个弱优势策略均衡。口 5.3极弱优（劣）势定义5.7（极弱劣势策略）给定策略型博弈T=（N，（S），（u;）），以及参与人i 的两个不同策略sES和sES，若 u;（si，s-）≥u;（sS-i）对于所有s-i∈S-i 则相对于策略s来说s:是极弱劣势的（veryweaklydominated)，或者说，s:极弱劣于si。我们也说，s极弱优于si。注意，与弱劣势策略不同，这里不要求严格不等式对至少一个s-：成立。定义5.8（极弱优势策略）给定参与人i的一个策略，如果s极弱优于此人的每个其他策略s:ES;，则称s为参与人i的极弱优势策略（veryweaklydominantstrategy）。定义5.9（极弱优势策略均衡）给定博弈T=（N，（S），（u:））及其一个策略组（s，"，s），若对于所有i=1，2，"，n，策略s都是参与人i的极弱优势策略，则称（s*，，s）为该博弈的极弱优势策略均衡（veryweaklydominantstrategye- quilibrium)。注意，每个弱优势策略均衡都是一个极弱优势策略均衡。在机制设计中，我们经常使用极弱优（劣）势概念。特别地，这个概念通常被用于定义优势策略激励相容（dominantstrategyincentivecompatibility），我们将在本书第2部分学习激励相容。例5.3稍微修改一下囚徒困境问题，得到下列收益矩阵 NC C NC -2，-2 -5，-2 C -2，-10 -5，-10 容易看出，对于参与人1和2，策略C和NC都是极弱优势策略。因此，这四个策略组中的每一个都是极弱优势策略均衡。口 5.4优势策略均衡的例子例5.4（公地悲剧）我们考察第4章讨论过的公地悲剧。回忆一下，在这个博弈中，

N={1，2，，N}为参与人（农民）集合 S=S2=·=S={0，1} 策略1对应着养一只羊，策略0对应着不养羊。养一只羊的收益为1，但它对环境的破坏（代价）为5。这个代价由所有农民均摊。对于i=1，2，"，n，我们有 ·情形1：n<5。给定任何s-iES-i u;(0,s-)=-∑s; n#i u;(1,si）=（n-5）由于n<5，（n5)<0，因此，对于所有s-;∈S-，u;(0，s-i)>u;(1，s-i）。明显可以看出，（0，0，“，0）是一个强优势策略均衡。也就是，任何农民都没有激励养羊。 ●情形2：n=5。在这里我们看到 nj≠i 因此，对于所有s-i∈S-i，u;（0，s-）=u;（1，S-i）。容易看到，在这里，任何一个策略都不是弱优势策略或强优势策略。另一方面，对于每个参与人来说，每个策略显然都是一个极弱优势策略。因此，在这里，每个策略组都是一个极弱优势策略均衡。优势策略均衡 ●情形3：n>5。在这里， u(0,s-:) =-∑s; ni u;(1,s-;)=n-5_5 由于n>5，（n=5)>0，因此，对于所有 s-:∈S-i，u;(0，s-:)<u;(1，s-i）。因此，（1，1，“，1）是一个强优势策略均衡。因此，如果n>5，每个农民都会养一只羊。现在，如果政府决定对每只羊征收5单位的污染税，我们有 -sg-s=（s.s) 在这里注意： nj≠i

这意味着不管n的值为多少，（0，0，"，0）是一个强优势策略均衡。这的确是农民的悲剧。口例5.5（布雷斯论博奔）回忆一下第4章的布雷斯论博弈，其中从A到B的单向道路被打通。在这个博弈中，可以证明，对于每个参与人i， ui（AB，s-i)>u;（A，s-i）对于所有s-iES-i ui（AB，s-i）>u;（B，s-i）对于所有s-iES-i 这表明（AB，AB，·，AB）是一个强优势策略均衡。注意，上面的均衡策略导致每辆车的总交通时间为40分钟。另一方面，如果500辆车使用策略A，另外500辆车使用策略 B，那么每辆车的总交通时间为35分钟。这里的论在于打通道路AB后使得策略AB强加在每辆车上（AB为每辆车的强优势策略），从而导致交通时间比非均衡策略多。口例5.6（第二价格密封拍卖）考虑第4章的价格密封拍卖，拍卖物只有一件。令 b1，b2，，6n为报价（策略），我们将把策略组记为6=（b1，b2，…，bn）。假设， b:∈（0，∞），i=1，2，""，n。回忆一下，拍卖物获得者为出价最高者中标号最小的（以防有多个出价最高者的情形），配置函数的定义为： y;（b1，.…，bn)=1若b;>b;，j=1,2，.,i—1 bi≥b;，j=i+1，.….,n =0其他情形每个报价人的收益为博 ui(b1，·..,bn)=yi(b1,·..,bn)（ui—t;(b1，·..,bn)) 奔论上其中t（b，，bn）是参与人i支付的钱数（若他中标）。由于这是第二价格密封拍卖，与机中标者仅支付次高的报价。现在我们知道策略组（b，“，6）=（，"，n）是这个博制弈的弱优势策略均衡。设计为了说明这一点，考虑报价人1。他对拍卖物的评价为v，报价为b。其他参与人的报价为b2，…，bn，评价为v2，…，Un。我们考虑下面情形。情形1：u≥max（b2，，bn）。这里又有两种情形：一是b≥max（b2，*…，bn），二是b<max（b2，….，bn）。情形2：u1<max（b2，“，bn）。这里也有两种情形：一是b≥max（b2，“"，bn），二是b<max（b2，…，bn）。下面我们分别分析这几种情形。情形1：U≥max（b2，，bn）。我们考察下列情形。 ·令b≥max（b2，“，b）。这意味着报价人1（即参与人1）中标，这意味着 u=u—max（b2，，bn）≥0。 ●令b<max（b2，"，bn）。这意味着参与人1没有中标，又意味着u=0。 ·令b=u，于是由于u≥max（b2，，bn），我们有u=u-max（b2，，bn）。因此，如果b=v，那么效用u等于参与人1能得到的最大效用。因此，不管 b2，，6的数值为多少，参与人1的最优反应是选择报价。因此，b=v是参与人1的极弱优势策略。

情形2：u<max（b2，，bn）。与前面类似，我们考察下面的情形。 ·令b≥max（b2，，bn）。这意味着参与人1中标，他的收益为：u=u max(b2，.，,bn)<0。 ·令b<max（b2，，bn）。这意味着参与人1没有中标。因此u=0。 ·如果b=v，那么参与人1没有中标，因此u=0。根据上面的分析可知，b=v在情形2下也是参与人1的最优反应策略。综合对情形1和情形2的分析，我们有 u1（u，b2,..,bn)≥u1（b1，b2,….,bn）对于所有6∈S 对于所有（b2，…，bn）∈S2×·.·XS 另外，我们可以证明（留作习题），对于任何6≠u，我们总能找到b∈S2，b∈Ss， b∈Sn，使得 u(,b2,…,bn)≥u(b²,b2,…,bn) 因此，6=是参与人1的弱优势策略。使用类似的论证，我们可以证明6=v是参与人 i的弱优势策略，其中i=2，3，，n。因此，（v，，n）是一个弱优势策略均衡。口 5.5小结与参考文献在本章，我们介绍了优势策略和优势策略均衡的概念。我们介绍了这个概念的三个不同版本：强、弱以及极弱。需要注意以下几点。优势策略均衡 ·参与人的强优势策略表示当他选择该策略时，这个策略比其他任何策略严格好，不管所有其他参与人选择什么策略。 ·参与人的极弱优势策略表示当他选择该策略时，这个策略至少与任何其他策略一样好，不管其他参与人选择什么策略。 ·参与人的弱优势策略表示当他选择该策略时，这个策略至少与任何其他策略一样好，不管其他参与人选择什么策略。另外，对于其他参与人选择的至少一个策略组，该策略严格比他的其他每个策略好。 ·优势策略可能存在，也可能不存在。对于严格优势策略来说，若存在，则唯一。 ·如果优势策略（尤其是严格优势策略）存在，参与人将乐意选择它。 ●任何优势策略均衡都是一个纯策略纳什均衡（参见第6章）。本章讨论的材料主要来自Myerson[1]；Mas-Colell，Whinston，andGreen[2]； Shoham and Leyton-Brown[3] 。口参考文献 [1]Roger B.Myerson.Game Theory:Analysis of Conflict.Harvard University Press,Cambridge,Massachusetts,USA,1997. [2]AndreuMas-Colell,Michael D.Whinston,andJerryR.Green.Microeconomic

Theory.Oxford University Press,1995. [3]YoamShohamandKevinLeyton-Brown.MultiagentSystems:Algorithmic, GameTheoretic,andLogical Foundations.CambridgeUniversityPress,NewYork, USA,2009,2009. 5.6习题（1）证明：对于策略型博弈的一个参与人来说，如果存在强优势策略，那么它是唯一的。这适用于弱优势策略吗？适用于极弱优势策略吗？（2）考虑下面囚徒困境问题的例子。 NC C NC -4，-4 -2，-x C —x，-2 -x，-x 分别找出下列情形下的值：（a）策略组（C，C）是一个强优势策略均衡。（b）策略组（C，C）是一个弱优势策略均衡，但不是一个强优势策略均衡。（c）策略组（C，C）甚至不是弱优势策略均衡。对于每种情形，说明是否存在值。验证每种情况的答案。（3）第一价格密封拍卖。假设两个报价人对拍卖物的评价分别为和v2。他们的报价是某个单位的整数部（即为离散的）。谁报价高，谁中标，中标者按自已的报价付款。如果两人报价相同，那么每人以1/2的概率得到拍卖物。在这个博弈中，（a）存在强劣势策略吗？（b）存在弱劣势策略吗？（c）存在极弱劣势策略吗？（4）第二价格密封拍卖。我们已经看到在第二价格密封拍卖中如实报价（即报价等于各自对拍卖物的评价）是一个极弱优势策略均衡。证明：如实报价事实上是一个弱优势策略均衡。（5）在例5.5中的布雷斯博弈中，计算当数25被换成20的情形下的强优势策略均衡或弱优势策略均衡。（6）某组织有n个部门。每个部门能够说服该组织的中央当局分配一定预算给它。如果h是部门i做出提议需要花费的时间，令c=wh是该行为的成本，其中w：是一个常数。当各部门为提议所花费的时间为（hu，h2，“，h）时，分配给所有部门的总预算为 ∑h+βIhi i=】其中α和β都是常数。把各个部门同时且独立决定花费的时间作为一个博弈。证明强优势策略均衡存在当且仅当β=0。算出这个均衡。