Page QiView

第16章 激励相容与显示原理(曹乾2016)

第16章 激励相容与显示原理(曹乾2016)

激励相容与显示原理 在机制设计中,激励相容这个概念非常重要,显示原理是一个核心结果。本章首先 正式给出了优势策略激励相容(DSIC)和贝叶斯激励相容(BIC)的定义。然后,本章 研究优势策略均衡显示原理和贝叶斯纳什均衡显示原理。最后,我们描述了社会选择函 数的两个重要性质:事后效率(ex-postefficiency)和非独裁性(non-dictatorship)。社 会计划者可能关注这些性质。 16.1激励相容 我们已经看到机制设计涉及偏好诱导问题以及偏好加总问题。偏好诱导问题试图从 智能体身上收集关于他们类型的真实信息。为了诱导出真实信息,社会计划者要使得理 性且智能的个体愿意如实显示自已的类型,也就是说,使得如实显示成为智能体的最优 反应。提供激励是实现这一目的的一种方法;激励相容(incentivecompatibility)在本 质上就是指提供正确的激励使得智能体如实显示自己的类型。激励相容有两类:(1)如 是每个智能体的最优反应,但这取决于其他智能体如何报告自己的类型。(也就是说, 给定所有其他智能体是如实报告的,那么你的最优反应也是如实报告。)第一种类型称 为优势策略激励相容,第二种称为贝叶斯纳什激励相容。由于如实显示总是涉及类型的 显示,因此当我们形式化激励相容概念时,只使用直接显示机制就足够了。激励相容概 念由莱昂尼德·赫维奇(LeonidHurwicz)首先提出。[1] 定义16.1(激励相容)给定社会选择函数f:0××O→X以及直接显示机制

=((O;)∈N,f(·)),如果の诱导出的贝叶斯博弈有纯策略均衡s*(·)=(s(·),", s(·)),其中s(0)=0,V0∈,Vi∈N,那么我们说社会选择函数f是激励相容的 (incentivecompatible),或说可如实实施的(truthfullyimplementable)。 也就是说,每个智能体的如实显示,构成了9诱导出的博弈的一个均衡。容易推 知:如果社会选择函数f(·)是激励相容的,那么直接显示机制の=((O)∈N,f(·)) 能够实施它。这意味着通过让智能体报告他们的类型并且使用f(·)中的类型信息来 确定社会结果,社会计划者就能实现社会选择函数f(·)。 我们再次强调,诱导贝叶斯博弈可能没有均衡、恰好有一个均衡或有两个以及两个 以上的均衡。上面的定义要求至少存在着一个均衡使得它诱导的结果与社会选择函数的 结果相同。因此,上面的定义假设,如果存在多个均衡,那么智能体将选择社会计划者 (机制设计者)想要的那个均衡。 根据相关均衡类型,激励相容可分为两类:优势策略激励相容和贝叶斯激励相容。 口优势策略激励相容 定义16.2(优势策略激励相容)给定社会选择函数f:0×·×O→X以及直接 显示机制の=((O)i∈N,f(·)),如果D诱导出的博弈有弱优势策略均衡s*(·)= (s*(·),,s(·)),其中s(0)=0,Vθ∈,Vi∈N,那么我们说社会选择函 数f是优势策略激励相容的(DSIC),或说可在优势策略中如实实施。 也就是说,每个智能体的如实显示构成了9诱导出的博弈的一个弱优势策略均衡。 第 在一些文献中,DSIC也被称为防策略的(strategy-proof)、防欺骗的(cheat-proof)、 坦率的(straightforward)、如实的(truthful),等等。在一些情形下,弱优势策略均衡 章 也是强优势策略均衡。另外,在很多情形下,更方便的做法是将弱优势策略均衡放松为 激 极弱优势策略均衡。 励 相 例16.1(SCF2的优势策略激励相容)在上一章我们已经看到,直接机制可在优 容与显示原 势策略中实施社会选择函数SCF2。因此,可以证明,对于每个0=(0,,0)∈, 类型组(0,“,0)是诱导贝叶斯博弈的一个(弱)优势策略均衡。这意味着SCF2 是优势策略激励相容的(DSIC)。另外,SCF2可由第二价格拍卖(这是一种间接机制) 理 在优势策略均衡中实施。口 DSIC的必要和充分条件 f(·)是优势策略激励相容的(DSCI)当且仅当 u;(f(0i,0-i),0i)≥u;(f(0,0-i),0) 0EO,0EO,0-EO-iViEN (16.1) 上面的条件是说社会选择函数f(·)是DSIC当且仅当每个智能体i(i=1,",n)报告 自己的真实类型0总是他自已的最优反应,不管其他智能体如何报告。 口贝叶斯激励相容 定义16.3(贝叶斯激励相容)给定社会选择函数f:0××O→X以及直接显

示机制の=((O)∈N,f(·)),如果の诱导出的博弈有贝叶斯纳什均衡s*(·)= (s(·),",s(·)),其中s(0)=0,V0;∈,Vi∈N,那么我们说社会选择函 数f是贝叶斯激励相容的(BIC),或说可在贝叶斯纳什均衡中如实实施。 也就是说,每个智能体的如实显示构成了9诱导出的博弈的一个贝叶斯纳什均衡。 例16.2(SCF3的贝叶斯激励相容)在上一章,我们已经看到,直接机制可在贝叶 斯纳什意义上实施社会选择函数SCF3。因此,可以证明,对于每个0=(6,,0)∈, 类型组(6,“,6)是诱导贝叶斯博弈的一个贝叶斯纳什均衡。这意味着SCF3是贝叶 斯激励相容的。另外,第一价格密封拍卖(这是一种间接机制)可在贝叶斯纳什均衡中实 施SCF3。口 BIC的必要和充分条件 利用贝叶斯博弈的贝叶斯纳什均衡定义(参见第14章),可知社会选择函数f(·) 是贝叶斯激励相容的(BIC)当且仅当 E0_[u;(f(0,0-),0:)丨0]≥E[ui(f(0,0-i),0;)∣0] OEO,OEO,iEN (16.2) 其中期望取自所有其他智能体的类型组的分布。回忆一下,我们在第14章用p:O→ △(O-:)表示智能体i关于其余智能体类型组的信念概率分布。也就是说,p:(0)表示 当智能体i的类型为6:时,他对所有其他智能体类型组的信念的概率分布。另外,我们 也已经知道,p(·)是从共同的先验概率分布P∈△(O)推导出来的。 博 上面的条件是说,社会选择函数f(·)是贝叶斯激励相容的当且仅当对于每个智 弈论与机 能体i(i=1,2,",n),每当所有其他智能体如实报告他们的类型时,智能体i的最 优反应也是如实报告自己的类型0。 注释如果社会选择函数f(·)是优势策略激励相容的,那么它也是贝叶斯激励 制 设 相容的。这个结论的证明很简单,因为弱优势策略均衡显然也是贝叶斯纳什均衡。 计 16.2优势策略均衡的显示原理 显示原理说明对于给定的社会选择函数f(·),间接机制《与直接机制有什么关 系。这个结果表明我们仅考察直接显示类机制对社会选择函数的可实施性就足够了。 定理16.1给定社会选择函数f(·),假设存在着能在优势策略均衡中实施f(·) 的间接机制μ=(Si,",Sn,g(·)),那么f(·)是优势策略激励相容的。 证明:由于μ=(S1,,Sn,g(·))可在优势策略中实施社会选择函数f(·), 因此潜在的贝叶斯博弈存在着弱优势策略均衡s*(·)=(s(·),",s(·))使得 g(s²(0),·…·,s(0n))=f(01,·…,0n)(01,·..,0n)∈ (16.3) 上面的均衡条件意味着 ui(g(s(0;),s-i(0-i)),0;)≥u;(g(aiS-;((0-i)),0;) VaiES,0:EO,V0-iEO-i,Vs-i(·)ES-i,ViEN (16.4)

特别地,条件式(16.4)意味着 u;(g(s²(0;),s=(0-)),0;)≥u;(g(s²(0),s=;(0-)),0;) EO,0EO,0-EO-,VEN (16.5) 条件式(16.3)与式(16.5)一起意味着 u;(f(0,0-;),0;)≥u;(f(0,0-),0;) EO,0.EO,O-:EO-,VEN 但这正好是条件式(16.1),我们已经知道这个条件是f(·)可在优势策略中被实施的 必要充分条件。这样,我们就完成了显示原理的证明。■ 我们可用图16一1来帮助我们理解显示原理背后的思想。在此图中,DSI代表由可 在优势策略中实施的所有社会选择函数组成的集合,DSIC代表由所有优势策略激励相 容的社会选择函数组成的集合。此图说明了DSIC是DSI的一个子集;此图还说明了显 示原理,因为这两个集合的差是空集,因此,这意味着DSIC正好就是DSI。 DSIC DSI 激励相容与显示原理 图16一1优势策略的显示原理 DSI:可在优势策略中实施;DSIC:优势策略激励相容;DSI\DSIC=O。 16.3贝叶斯纳什均衡的显示原理 f(·)的间接机制μ=(S,,Sn,g(·)),那么f(·)是贝叶斯激励相容的。 证明:由于u=(S,,Sn,g(·))可在贝叶斯纳什均衡中实施f(·),因此潜 在的贝叶斯博弈存在着贝叶斯纳什均衡s*(·)=(s*(·),"",s(·))使得 g(s(0),……·,s(0n))=f(0,·.,0n)(01,·…·,0n)∈ (16.6) 贝叶斯纳什均衡条件意味着 Eθ_[u;(g(s(0;),s=;(0-i)),0;)10;]≥Eθ;[u;(g(ais=;(0-)),0;)10;] VaES,0EO,ViEN (16.7) 特别地,式(16.7)意味着

E[u;(g(s²(0;),s(0-)),0;)|0]≥E_u;(g(s²(θ),s;(0-;)),0)∣0] 0EO,0:EO,VEN (16.8) 条件式(16.6)与式(16.8)一起意味着 E0_[u;(f(0,0-;),0;)0]≥Eθ_;[u;(f(0,0-i),0:)10] 0EO,OEO,EN 但这正好是条件式(16.2),我们已经知道该条件是f(·)的贝叶斯激励相容性的必要 充分条件。这样,我们就完成了该定理的证明。■ BIC BNI 图16一2贝叶斯纳什均衡的显示原理 BNI:可在贝叶斯均衡中实施;BIC:贝叶斯激励相容;BNI\BIC=O。 与优势策略均衡的显示原理类似,我们也可以利用图(参见图16一2)来帮助我们 理解贝叶斯纳什均衡的显示原理。在此图中,BNI表示由所有可在贝叶斯纳什均衡中实 施的社会选择函数组成的集合,BIC是由所有贝叶斯激励相容的社会选择函数组成的集 合。此图表明BIC是BNI的一个子集;此图还说明了显示原理,因为这两个集合的差 为空集。因此,这意味着BIC正好与BNI相同。 图16一3给出了本章两个显示原理的鸟瞰图。显示原理在本质上意味着在可实施社 会选择函数集合的角度上,间接机制与直接机制相同。显示原理使得机制设计理论学家 在发展理论结果时仅关注直接机制即可。需要间接机制的是实践者,因为他们需要设计 可行方法来实现社会选择函数的结果。 16.4社会选择函数的性质 我们已经看到,给定一个机制,如果它能实施合意的社会选择函数f(·),那么它 可以作为偏好诱导问题和偏好加总问题的解。显然,一些社会选择函数可实施,而另外 一些不可实施。在考察可实施社会选择函数空间的特征之前,我们有必要知道社会计划 者希望社会选择函数具有哪些性质。在本节,我们说明了社会选择函数的两个合意性 质:事后效率以及非独裁性。在以后章节,我们将适当介绍社会选择函数的其他重要 性质。

DSI BIC BNI 图16一3两个显示原理的综合图 DSI:可在优势策略中实施;DSIC:优势策略激励相容;DSI\DSIC=O。 BNI:可在贝叶斯均衡中实施;BIC:贝叶斯激励相容;BNI\BIC=O。 口事后效率 定义16.4(事后效率)给定社会选择函数f:0→X,如果对于智能体的每个类型 组9E,结果f(θ)是一个帕累托最优结果,那么我们说f有事后效率或是事后帕累托 第 的(ex-postParetian)。其中帕累托最优结果的定义为:给定结果f(θ),如果不存在任 何xEX使得 章 u;(x,0:)≥u;(f(θ),0:)Vi∈N而且对于某个i∈Nu;(x,0;)>u;(f(0),0;) 激励相容与显示原理 那么结果f(θ)是帕累托最优的(Paretooptimal)。 例16.3(供应商选择问题)考虑例14.3中的供应商选择问题。令社会选择函数 f为 f(a,a2)=x f(a,b2)=x 读者需要注意,不要将上面的结果x与定义16.4中的符号x混淆。结果f(a,a2)=x是 帕累托最优的,这是因为结果和使得 u(y,a1)<u(x,a1) u(x,a)<u}(x,a}) 结果f(a1,b2)=x是帕累托最优的,这是因为结果y和z使得 u(ya)<u(x,a1) u(x,a)<u(x,a1) 因此,上面定义的社会选择函数有事后效率。 例16.4(销售一件不可分割的商品)在上一章,我们已考察了三个社会选择函数 SCF1、SCF2和SCF3。读者可以验证这三个函数都有事后效率。口

下面我们给出一个有用的命题,这个命题可用反证法证明。我们将其留作习题。 命题16.1假设f:0→X是一个社会选择函数,使得V0E0, u;(f(0),0)≥u;(x,0)Vx∈x 也就是说,如果每个类型组选择的结果使得智能体的效用之和最大,那么社会选择函数 f(·)有事后效率。 口非独裁性 我们使用独裁的社会选择函数定义这个性质。 定义16.5(独裁)给定社会选择函数f:O→X,如果存在着一个智能体dEN使 得VEO, ua(f(0),0a)≥ud(x,0a)xEX 那么我们说社会选择函数f(·)是独裁的(dictatorial)。这样的智能体称为独裁者。不 含有独裁者的社会选择函数称为非独裁的。 在直觉上,独裁者是下面这样的智能体:对他来说,社会选择函数的所有结果都是 最受欢迎的结果。注意,一个给定的社会选择函数可能存在多个独裁者。 例16.5(供应商选择问题)令例14.3中的社会选择函数f为 f(a1a2)=x;f(a,b2)=x 容易看出,智能体1是一个独裁者,因此这是一个独裁的社会选择函数。另一方面,考 虑下列社会选择函数: f(aa2)=x;f(a1b2)=y 可以验证,这不是一个独裁的社会选择函数。口 16.5小结与参考文献 本章主要考察机制设计理论中的一个基本结果,即显示原理。在直觉上,显示原理 是说直接机制与间接机制等价。下面的知识点值得注意。 ·给定一个社会选择函数(SCF),如果智能体报告的真实类型构成了(对应于该 SCF的)直接机制诱导出的贝叶斯博弈的一个均衡,则该SCF是激励相容的。如果均 衡是优势策略均衡,那么我们说SCF是优势策略激励相容的(DSIC)。如果均衡仅是一 个贝叶斯纳什均衡,那么我们说SCF是贝叶斯激励相容的(BIC)。 ·在直觉上,DSIC意味着报告真实类型是每个智能体的最优反应,不管其他智能 体如何报告。BIC表示当所有其他智能体报告真实类型时,如实报告是每个智能体的最 优反应。显然,DSIC意味着BIC,但BIC未必意味着DSIC。

接机制,那么也存在着能在优势策略中实施该SCF的直接机制(也就是说,该SCF是 优势策略激励相容的)。贝叶斯纳什均衡的显示原理是说,如此存在着能在贝叶斯纳什 均衡中实施给定SCF的间接机制,那么也存在着能在贝叶斯纳什均衡中实施该SCF的 直接机制(也就是说,该SCF是贝叶斯激励相容的)。 ·我们定义了SCF的两个重要性质,即事后效率和非独裁性。事后效率意味着 SCF的所有结果都是帕累托最优的,这是合意的。SCF中的独裁者是一个智能体使得 SCF的每个结果都是该独裁者最喜欢的结果。不含有独裁者的SCF称为非独裁的。下 一章的很多结果都使用了这两个性质。 本章提供的显示原理的证明源于Mas-Colell,Whinston,andGreen[2]。我们也推 荐读者参考Narahari,Garg,Narayanam,and Prakash[3]。 口参考文献 [1]L.Hurwicz.“On informationally decentralized systems”.In:Decision and Organi- zation.Ed.byC.B.McGuire andRRadner.North-Holland,Amsterdam,1972. [2]Andreu Mas-Colell,Michael D.Whinston,and JerryR.Green.Microeco nomicTheory.OxfordUniversityPress,1995. [3]Y.Narahari,Dinesh Garg,Ramasuri Narayanam,and Hastagiri Prakash.Game TheoreticProblemsinNetruorkEconomicsandMechanismDesignSolutions.Springer,Lon- don,2009. 第 16.6习题 章 激 励 (1)回顾第14章中的分饼问题。妈妈想把饼均等地分给她的两个孩子。她设计了 相 容与显示原 下列机制:孩子1把饼切成两块,孩子2先选择。这个机制保证了社会选择函数(两人 均等分饼)在优势策略中可实施。现在假设有3个孩子而不是2个。对于这个问题, (i)给出一种能在优势策略中实施社会选择函数的机制;(i)给出能在贝叶斯均衡但不 能在优势策略中实施社会选择函数的机制。用简明逻辑证明你的结果。 理 (2)证明第15章定义的社会选择函数SCF1和SCF2有事后效率。SCF3有事后效 率吗? (3)假设一个卖者面对着一个买者。买者的类型集为⊙={0,1,2>。结果集为 ;u(c,0)=0,VθEO。写出这个问题的所有激励相容的社会选择函数。注意,这里 仅有一个智能体。 (4)令N={1,2};={a1,b};2={a2,b2};X={x,y,x};以及 u(x,a1)=100;u(y,a)=50;u(x,a)=0 u(x,b)=50;u1(y,b)=100;u(x,b)=40 u2(x,a2)=0;u2(y,a2)=50;u2(x,a2)=100

u2(x,b2)=50;u2(y,b2)=30;u2(x,b2)=100 对于上面的环境,对下列每种情形给出一个社会选择函数(其中,EPE:事后效率; BIC:贝叶斯激励相容;DSIC:优势策略激励相容;D:独裁的;ND:非独裁的)。 ·一个满足EPE、DSIC和D的社会选择函数。 ·一个满足EPE、DSIC和ND的社会选择函数。 ·一个不满足EPE但满足DSIC和ND的社会选择函数。 ·一个满足EPE、BIC(在合适的先验概率分布下)但不满足DSIC的社会选择 函数。 ·一个满足EPE,但不满足BIC(在某个先验概率分布下)和DSIC的社会选择 函数。 (5)证明代表下列情形的社会选择函数有事后效率。有n个智能体,一件不可分割 的商品配置给其中一个智能体。评价最高者获胜,而且所有智能体得到的钱数之和 为零。 (6)推导社会选择函数f(·)为DSIC的必要充分条件,即推导 u;(f(0,0-i),0)≥u;(f(0,0-),0)0∈O,V0:∈O,0-:∈O-i,Vi∈N (7)推导社会选择函数f(·)为BIC的必要充分条件,即推导 E;[u(f(0,0-i),0:)0]≥E[u(f(θ,0-i),0)0]∈,0.∈,i∈N 博奔论与机 (9)假设f:O→X是一个社会选择函数,使得V0E, ∑u;(f(0),0)≥∑u;(x,0)Vx∈X 制 =1 设计 也就是说,如果每个类型组选择的结果使得智能体的效用之和最大,那么社会选择函数 f(·)有事后效率。请证明之。 (10)考虑两个智能体,即1和2;其中,智能体1是某件不可分割商品的卖者,智能 体2是可能的买者。在这里,典型结果的形式为x=(y,y2,t,t2),其中y:的取值规 则为:如果智能体i得到商品则y=1,否则y=0;t表示智能体i(i=1,2)得到的钱 数。我们可以自然地将结果集写为 X={(y1,y2,t,t2):y+y2=1;y1y2∈{0,1}} 适当定义智能体i(i=1,2)的效用函数。智能体1(卖者)的类型6可以视为他的出 售意愿(他能忍受的最低价格)。智能体2(买者)的类型6可以视为他的支付意愿 (他能忍受的最高价格)。假设=2=[0,1],而且每个智能体认为另外一个智能体 的类型在实区间[0,1]上均匀分布。将社会选择函数f(0)=(y(0),y2(0),t(θ), t2(0))定义为 y(0,02)=1若0>02 =0若0<02 y2(θ,02)=1若θ<02

=0若0>02 t1(0,02)=y2(0,02)(+θ 这个社会选择函数是优势策略激励相容的吗?是贝叶斯激励相容的吗? (11)(编程题)给定参与人集、他们的有限类型集、一个有限结果集、效用值、一 个社会选择函数,编程确定给定的社会选择函数是否有事后效率、是否为优势策略激励 相容的以及独裁的。另外,给定信念概率分布,考察给定的社会选择函数是否为贝叶斯 激励相容的。 激励相容与显示原理