Page QiView

第5章 优势策略均衡(曹乾2016)

第5章 优势策略均衡(曹乾2016)

优势策略均衡 在上一章,我们提供了一些策略型博弈的例子,但未进行分析。自本章起,我们开 始分析策略型博弈。我们将定义以下术语:劣势策略,优势策略,优势策略均衡。我们 考察三类优(劣)势:强、弱以及极弱。我们将用囚徒困境、布雷斯悖论和第二价格密 封拍卖说明这些概念。 我们首先介绍强优(劣)势,然后介绍它的弱版本和更弱版本的概念。 5.1强优(劣)势 定义5.1(强劣势策略)给定策略型博弈T=(N,(S),(u)),以及参与人i的 两个不同策略sES;和sES,若 u;(si,s-;)>u;(siS-i)对于所有s-i∈S-i 则相对于策略s来说s:是强劣势的(stronglydominated),或说,s:强劣于si。我们也 说s强优于Si 容易看出,参与人总是偏爱选择策略s而不是si。 定义5.2(强优势策略)给定参与人i的一个策略s∈S;,若s强优于此人的每 个其他策略s∈S,即若对于所有s≠s,都有 u;(s,s-)>u;(siS-i)对于所有s-i∈S-i 则称s是参与人i的强优势策略(stronglydominantstrategy)。 定义5.3(强优势策略均衡)给定博弈T=(N,(S:),(u))及其一个策略组

(s,,s),若对于所有i=1,2,",n,策略s都是参与人i的强优势策略,则称 (s”,,s)为该博弈的强优势策略均衡(stronglydominantstrategyequilibrium)。 例5.1回忆一下,在囚徒困境问题中,N={1,2},Si=S2={C,NC},收益矩 阵为 NC C NC -2,-2 -10,-1 C -1,-10 -5,-5 注意,对于参与人1,策略NC强劣于C,这是因为 u(C,NC)>u(NC,NC) u(C,C)>u(NC,C) 类似地,对于参与人2,策略NC强劣于C,原因在于 u(NC,C)>u2(NC,NC) u(C,C)>u(C,NC) 因此,对于参与人1和2,C都是强优势策略。因此,(C,C)是这个博弈的强优势策 略均衡。口 注意,如果(理性)参与人有强优势策略,那么我们应该预期他选择该策略。另一 方面,如果参与人有强劣势策略,那么我们应该预期他不选择这个策略。 优势策略均衡 5.2弱优(劣)势 定义5.4(弱劣势策略)给定策略型博弈T=(N,(S:),(u)),以及参与人i的 两个不同策略s:ES和sES,若 u;(si,s-i)≥u;(s,s-i)对于所有s-∈S-i 且 ui(si,S-i)>u;(si,S-i)对于某个s-i∈S-i 则相对于策略s来说s:是弱劣势的(weaklydominated),或说,s:弱劣于si。我们也 说,s弱优于si。 注意到,这里要求严格不等式至少对一个s-:成立。 定义5.5(弱优势策略)给定参与人i的一个策略,如果s弱优于此人的每个其 他策略s:ES;,则称s为参与人i的弱优势策略(weaklydominantstrategy)。 定义5.6(弱优势策略均衡)给定博弈T=(N,(S),(u))及其一个策略组 (s,",s),若对于所有i=1,2,…,n,策略s都是参与人i的弱优势策略,则 称(s*,",s)为该博弈的弱优势策略均衡(weaklydominantstrategyequilibrium)。 例5.2将囚徒困境问题稍微修改,得到下列收益矩阵

NC C NC -2,-2 -10,-2 C —2,-10 -5,-5 容易看出,对于参与人1和2,C都是一个弱优势策略。因此,策略组(C,C)是一个 弱优势策略均衡。口 5.3极弱优(劣)势 定义5.7(极弱劣势策略)给定策略型博弈T=(N,(S),(u;)),以及参与人i 的两个不同策略sES和sES,若 u;(si,s-)≥u;(sS-i)对于所有s-i∈S-i 则相对于策略s来说s:是极弱劣势的(veryweaklydominated),或者说,s:极弱劣于si。 我们也说,s极弱优于si。 注意,与弱劣势策略不同,这里不要求严格不等式对至少一个s-:成立。 定义5.8(极弱优势策略)给定参与人i的一个策略,如果s极弱优于此人的每 个其他策略s:ES;,则称s为参与人i的极弱优势策略(veryweaklydominantstrategy)。 定义5.9(极弱优势策略均衡)给定博弈T=(N,(S),(u:))及其一个策略组 (s,",s),若对于所有i=1,2,",n,策略s都是参与人i的极弱优势策略, 则称(s*,,s)为该博弈的极弱优势策略均衡(veryweaklydominantstrategye- quilibrium)。 注意,每个弱优势策略均衡都是一个极弱优势策略均衡。在机制设计中,我们经常 使用极弱优(劣)势概念。特别地,这个概念通常被用于定义优势策略激励相容 (dominantstrategyincentivecompatibility),我们将在本书第2部分学习激励相容。 例5.3稍微修改一下囚徒困境问题,得到下列收益矩阵 NC C NC -2,-2 -5,-2 C -2,-10 -5,-10 容易看出,对于参与人1和2,策略C和NC都是极弱优势策略。因此,这四个策略组 中的每一个都是极弱优势策略均衡。口 5.4优势策略均衡的例子 例5.4(公地悲剧)我们考察第4章讨论过的公地悲剧。回忆一下,在这个博弈中,

N={1,2,,N}为参与人(农民)集合 S=S2=·=S={0,1} 策略1对应着养一只羊,策略0对应着不养羊。养一只羊的收益为1,但它对环境的破 坏(代价)为5。这个代价由所有农民均摊。对于i=1,2,",n,我们有 ·情形1:n<5。给定任何s-iES-i u;(0,s-)=-∑s; n#i u;(1,si)=(n-5) 由于n<5,(n5)<0,因此,对于所有s-;∈S-,u;(0,s-i)>u;(1,s-i)。明显可以 看出,(0,0,“,0)是一个强优势策略均衡。也就是,任何农民都没有激励养羊。 ●情形2:n=5。在这里我们看到 nj≠i 因此,对于所有s-i∈S-i,u;(0,s-)=u;(1,S-i)。 容易看到,在这里,任何一个策略都不是弱优势策略或强优势策略。另一方面,对 于每个参与人来说,每个策略显然都是一个极弱优势策略。因此,在这里,每个策略组 都是一个极弱优势策略均衡。 优势策略均衡 ●情形3:n>5。在这里, u(0,s-:) =-∑s; ni u;(1,s-;)=n-5_5 由于n>5,(n=5)>0,因此,对于所有 s-:∈S-i,u;(0,s-:)<u;(1,s-i)。因此, (1,1,“,1)是一个强优势策略均衡。因此,如果n>5,每个农民都会养一只羊。 现在,如果政府决定对每只羊征收5单位的污染税,我们有 -sg-s=(s.s) 在这里注意: nj≠i

这意味着不管n的值为多少,(0,0,",0)是一个强优势策略均衡。这的确是农 民的悲剧。口 例5.5(布雷斯论博奔)回忆一下第4章的布雷斯论博弈,其中从A到B的 单向道路被打通。在这个博弈中,可以证明,对于每个参与人i, ui(AB,s-i)>u;(A,s-i)对于所有s-iES-i ui(AB,s-i)>u;(B,s-i)对于所有s-iES-i 这表明(AB,AB,·,AB)是一个强优势策略均衡。注意,上面的均衡策略导致每辆车 的总交通时间为40分钟。另一方面,如果500辆车使用策略A,另外500辆车使用策略 B,那么每辆车的总交通时间为35分钟。这里的论在于打通道路AB后使得策略AB强 加在每辆车上(AB为每辆车的强优势策略),从而导致交通时间比非均衡策略多。口 例5.6(第二价格密封拍卖)考虑第4章的价格密封拍卖,拍卖物只有一件。令 b1,b2,,6n为报价(策略),我们将把策略组记为6=(b1,b2,…,bn)。假设, b:∈(0,∞),i=1,2,"",n。回忆一下,拍卖物获得者为出价最高者中标号最小的 (以防有多个出价最高者的情形),配置函数的定义为: y;(b1,.…,bn)=1若b;>b;,j=1,2,.,i—1 bi≥b;,j=i+1,.….,n =0其他情形 每个报价人的收益为 博 ui(b1,·..,bn)=yi(b1,·..,bn)(ui—t;(b1,·..,bn)) 奔论上 其中t(b,,bn)是参与人i支付的钱数(若他中标)。由于这是第二价格密封拍卖, 与机 中标者仅支付次高的报价。现在我们知道策略组(b,“,6)=(,",n)是这个博 制 弈的弱优势策略均衡。 设 计 为了说明这一点,考虑报价人1。他对拍卖物的评价为v,报价为b。其他参与人 的报价为b2,…,bn,评价为v2,…,Un。我们考虑下面情形。 情形1:u≥max(b2,,bn)。这里又有两种情形:一是b≥max(b2,*…,bn), 二是b<max(b2,….,bn)。 情形2:u1<max(b2,“,bn)。这里也有两种情形:一是b≥max(b2,“",bn), 二是b<max(b2,…,bn)。 下面我们分别分析这几种情形。 情形1:U≥max(b2,,bn)。 我们考察下列情形。 ·令b≥max(b2,“,b)。这意味着报价人1(即参与人1)中标,这意味着 u=u—max(b2,,bn)≥0。 ●令b<max(b2,",bn)。这意味着参与人1没有中标,又意味着u=0。 ·令b=u,于是由于u≥max(b2,,bn),我们有u=u-max(b2,,bn)。 因此,如果b=v,那么效用u等于参与人1能得到的最大效用。因此,不管 b2,,6的数值为多少,参与人1的最优反应是选择报价。因此,b=v是参与 人1的极弱优势策略。

情形2:u<max(b2,,bn)。 与前面类似,我们考察下面的情形。 ·令b≥max(b2,,bn)。这意味着参与人1中标,他的收益为:u=u max(b2,.,,bn)<0。 ·令b<max(b2,,bn)。这意味着参与人1没有中标。因此u=0。 ·如果b=v,那么参与人1没有中标,因此u=0。 根据上面的分析可知,b=v在情形2下也是参与人1的最优反应策略。综合对情 形1和情形2的分析,我们有 u1(u,b2,..,bn)≥u1(b1,b2,….,bn)对于所有6∈S 对于所有(b2,…,bn)∈S2×·.·XS 另外,我们可以证明(留作习题),对于任何6≠u,我们总能找到b∈S2,b∈Ss, b∈Sn,使得 u(,b2,…,bn)≥u(b²,b2,…,bn) 因此,6=是参与人1的弱优势策略。使用类似的论证,我们可以证明6=v是参与人 i的弱优势策略,其中i=2,3,,n。因此,(v,,n)是一个弱优势策略均衡。口 5.5小结与参考文献 在本章,我们介绍了优势策略和优势策略均衡的概念。我们介绍了这个概念的三个 不同版本:强、弱以及极弱。需要注意以下几点。 优势策略均衡 ·参与人的强优势策略表示当他选择该策略时,这个策略比其他任何策略严格好, 不管所有其他参与人选择什么策略。 ·参与人的极弱优势策略表示当他选择该策略时,这个策略至少与任何其他策略一 样好,不管其他参与人选择什么策略。 ·参与人的弱优势策略表示当他选择该策略时,这个策略至少与任何其他策略一样 好,不管其他参与人选择什么策略。另外,对于其他参与人选择的至少一个策略组,该 策略严格比他的其他每个策略好。 ·优势策略可能存在,也可能不存在。对于严格优势策略来说,若存在,则唯一。 ·如果优势策略(尤其是严格优势策略)存在,参与人将乐意选择它。 ●任何优势策略均衡都是一个纯策略纳什均衡(参见第6章)。 本章讨论的材料主要来自Myerson[1];Mas-Colell,Whinston,andGreen[2]; Shoham and Leyton-Brown[3] 。 口参考文献 [1]Roger B.Myerson.Game Theory:Analysis of Conflict.Harvard University Press,Cambridge,Massachusetts,USA,1997. [2]AndreuMas-Colell,Michael D.Whinston,andJerryR.Green.Microeconomic

Theory.Oxford University Press,1995. [3]YoamShohamandKevinLeyton-Brown.MultiagentSystems:Algorithmic, GameTheoretic,andLogical Foundations.CambridgeUniversityPress,NewYork, USA,2009,2009. 5.6习题 (1)证明:对于策略型博弈的一个参与人来说,如果存在强优势策略,那么它是唯 一的。这适用于弱优势策略吗?适用于极弱优势策略吗? (2)考虑下面囚徒困境问题的例子。 NC C NC -4,-4 -2,-x C —x,-2 -x,-x 分别找出下列情形下的值: (a)策略组(C,C)是一个强优势策略均衡。 (b)策略组(C,C)是一个弱优势策略均衡,但不是一个强优势策略均衡。 (c)策略组(C,C)甚至不是弱优势策略均衡。 对于每种情形,说明是否存在值。验证每种情况的答案。 (3)第一价格密封拍卖。假设两个报价人对拍卖物的评价分别为和v2。他们的 报价是某个单位的整数部(即为离散的)。谁报价高,谁中标,中标者按自已的报价付 款。如果两人报价相同,那么每人以1/2的概率得到拍卖物。在这个博弈中, (a)存在强劣势策略吗? (b)存在弱劣势策略吗? (c)存在极弱劣势策略吗? (4)第二价格密封拍卖。我们已经看到在第二价格密封拍卖中如实报价(即报价等 于各自对拍卖物的评价)是一个极弱优势策略均衡。证明:如实报价事实上是一个弱优 势策略均衡。 (5)在例5.5中的布雷斯博弈中,计算当数25被换成20的情形下的强优势策略均 衡或弱优势策略均衡。 (6)某组织有n个部门。每个部门能够说服该组织的中央当局分配一定预算给它。如 果h是部门i做出提议需要花费的时间,令c=wh是该行为的成本,其中w:是一个常 数。当各部门为提议所花费的时间为(hu,h2,“,h)时,分配给所有部门的总预算为 ∑h+βIhi i=】 其中α和β都是常数。把各个部门同时且独立决定花费的时间作为一个博弈。证明强优 势策略均衡存在当且仅当β=0。算出这个均衡。