欢迎来到锐牛沃德讯息网

你的位置： 首页 > 教程

博弈论与信息经济学在线阅读(博弈论与信息经济学电子书)

2022-04-30 17:16:24 | 人围观 | 评论:

1、博弈论与主流经济学的新发展

经济学是研究说明什么的？

传统观点：研究稀缺资源的有效配置

现代观点：研

究人的行为(human behaviour)。经济学的基本假定：人是理性的。

理性人特征：有一个很好定义的偏好，在面临给定的约束条件下最大化自己的偏好。

理性人与自私人的区别：自私人只能是利己主义者，而理性人可能是利己主义者，也可能是利他主义者(altruist)。

制度与偏好：无论是利己的还是利他的，理性人在最大化偏好时，需要相互合作(cooperation)，而合作中又存在着冲突(conflicts)。为了实现合作的潜在利益和有效地解决合作中的冲突，理性人发明了各种各样的制度规范他们的行为。

价格制度：也称市场制度，是人类为达到合作和解决冲突所发明的最重要的制度之一。

传统的新古典经济学(neo-classiceconomics)就是以价格制度为研究对象的，故又称为价格理论。

新古典经济学的两个基本假定是:(1)市场参与者的数量足够多从而市场是竞争性的，

(2)参与人之间不存在信息不对称问题。

假定的合理性：

以上两个假设在现实申"--般是不满足的。

首先，在现实中，买卖双方的人数常常是非常有限的，在有限人数下，市场不可能是完全竞争的。在不完全竞争市场中，人们之间的行为是直接影响的，所以一个人在决策时必须考虑对方的反应，这就是博弈论要研究的问题。

其次，现实中市场参与者之间的信息一般是不对称的，比如说，卖者对产品质量的了解通常比买者多。当参与人之间存在倍息不对称时，任何一种有效的制度安排必须满足"激励相容"（incentive compatible）或"自选择"(self-selection)条件，这是信息经济学研究的问题。

第三、不完全信息使得价格制度常常不是实现合作和解决冲突的最有效安排，诸如学校、企业、家庭、政府等等这样一些非价格制度，也许更为有效。而非价格制度的最显著特征是参与人之间行为的相互作用。

博弈论方法：由于以上假定不能满足，

博弈论就成为经济学研究的较好

方法。

1994年诺贝尔经济学奖:授给了三位博

弈论专家：纳什(Nash)、泽尔腾

(Selten)和海萨尼(Harsanyi)。

博弈论研究的问题：博弈论，英文为game theory，是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的，也就是说，当一个主体，好比说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。所以在这个意义上说，博弈论又称为"对策论"。

博弈论与传统微观经济学方法比较：

传统微观经济学谈到个人的决策，就是在给定一个价格参数和收入的条件下，最大化他的效用;个人效用函数只依赖于他自己的选择，而不依赖于其他人的选择;个人的最优选择只是价格和收入的函数而不是其他人选择的函数。

个人在选择时,所有其他人的行为都被总结在一个参数里，这个参数就是价格。这样，一个人作出决策时他面临的似乎是一个非人格化的东西，而不是面临着另外一个人、另外一个决策主体。他既不考虑自己的选择对别人选择的影响，也不考虑别人选择对自己选择的影响。

在博弈论里，个人效用函数不仅依赖于他自己的选择，而且依赖于他人的选择,即个人的最优选择是其他人选择的函数。从这个意义上讲，博弈论研究的是在存在相互外部经济条件下的个人选择问题。

在传统微观经济学中，寡头市场是一个例外，而这一部分正是博弈论最主要的应用领域之一。

实例：

人们之间决策行为相互影响的例子很多，几乎所有我们遇到的生活中的事情都是这样的。比如说OPEC(石油输出国组织)成员国家选择石油产量;

寡头市场上，企业选择它们的价格和产量;

又如家庭中的夫妻，他们之间的行为也是一种博弈，

还有国家与国家之间的关系;

中央和地方政府之间，也存在一种博弈，就是说，中央采取一种行动会影响地方的行动，反过来地方的行动又会使中央采取相应的政策。所以博弈论的应用是非常广泛的。

博弈论分类：

博弈论可以划分为合作博弈和非合作博弈。人们所说的博弈论，一般指的是非合作博弈，，很少指合作博弈。

合作博弈与非合作博弈概念的区别：

主要在于人们的行为相互作用时，当事人能否达成一个具有约束力的协议，如果有，就是合作博弈;反之，则是非合作博弈。

实例：

如我们刚才讲的两个寡头企业，如果它们之间达成一个协议，联合最大化垄断利润，并且各自按这个协议生产，就是合作博弈。它们面临的问题就是如何分享合作带来的剩余。

但是如果这两个企业间的协议不具有约束力就是说，没有哪一方能够强制另一方遵守这个协议，每个企业都只选择自己的最优产量(或价格)，则是非合作博弈。

合作博弈强调的是团体理性，强调的是效率、公正、公平，非合作博弈强调的是个人理性、个人最优决策，其结果可能是有效率的，也可能是无效率的。

合作博弈的创立：

一般认为，博弈理论开始于1944年由冯·诺依曼和摩根斯坦恩合作的《博弈论和经济行为》一书的出版。但是现代博弈理论跟他们讲的东西关系不大，尽管有一些概念，特别是预期效用理论等，都是他们创立的。到50年代，合作博弈发展到鼎盛期，包括纳什（1950）和夏普里 (Shapley，1953)的"讨价还价"模型，Gillies和Shapley(1953)关于合作博弈申的"核"(core)的概念，以及其他一些人的贡献。

非合作博弈的创立：

50年代合作博弈达到顶峰，同时非合作博弈论也开始创立。纳什在1950年和1951年发表了两篇关于非合作博弈的重要文章，Tucker于1950年定义了"囚徒困境"。他们两个人的著作基本上奠定了现代非合作博弈论的基石。

到60年代后又出现了一些重要人物。泽尔腾(1965)将纳什均衡的概念引入了动态分析，提出了"精炼纳什均衡"概念；海萨尼(1967一1968)则把不完全信息引入博弈论的研究。然后到80年代出现了几个比较有影响的人物，包括克瑞普斯(Kreps)和威尔逊(Wilson)，他们在1982年合作发表了关于动态不完全信息博弈的重要文章。

博弈论的学科属性：

博弈论不是经济学的一个分支，它是一种方法，应用范围不仅包括经济学、政治学、军事、外交、国际关系、公共选择，还有犯罪学，都涉及到博弈论。实际上，好多人把博弈论看成是数学的一个分支。纳什在1951年的奠基性文章就是发表在数学杂志上，而不是经济学杂志上，

在相当长一段时间里经济学家们并不把纳什当作一个经济学家。还有夏普里1953年的文章本身也是一篇数学手稿，而非经济学手稿。

获奖原因：

那么为什么把诺贝尔经济学奖授给这三个人，而不是把其他的什么奖授给他们呢?大致有以下三方面的原因:

1．博弈论在经济学中的应用最广泛、最成功;博弈论的许多成果也是借助于经济学的例子来发展的，特别是在应用领域。

2．经济学家对博弈论的贡献也越来越大，特别是在动态分析和不完全信息引入博弈论之后。

3．最带根本性意义的原因是经济学和博弈论的研究模式是一样的，这就是强调个人理性，也就是在给定的约束条件下追求效用最大化。在这一点上，博弈论和经济学是完全一样的。

大体是因为这三个原因，博弈论逐渐被当成是经济学的一部分，诺贝尔经济学奖自然就授给了三位博弈论专家。

博弈论方法在经济学领域的应用：

在70年代中期之前，经济学家也有一部分用到博弈论，但所有这些经济学家应用到的博弈论知识大体在1953年之前就已经被创造出来了(当然也有一些例外)。

只是到70年代中期以后经济学家开始转而强调个人理性，特别是强调对个人的最基础的效用函数的研究之后，他们才发现信息是一个非常重要的问题，信息问题成为经济学家关注的焦点。

同时，在研究个人行为时，个人决策有一个时间顺序问题，就是说当你作出某项决策时必须对你之前(或之后)别人的决策有一一个了解(或猜测)，你的决策受你之前别人决策的影响，同时反过来影响你之后别人的行为。

这样，时序问题在经济学中就变得非常重要。博弈论发展到这一阶段正好为这两方面的问题(一个是信息，一个是时序)提供了有力的研究工具，这些工具包括泽尔腾在1965年关于动态博弈精炼均衡和海萨尼茌1967一1968年发表的关于不完全信息的研究成果(这些成果在70年代中期之前经济学家们没有用过)。

博弈论在经济学中的绝大多数应用模型都是在70年代中期之后发展起来的。大体从80年代开始，博弈论逐渐成为主流经济学的一部分，甚至可以说成为微观经济学的基础。博弈论的发展和经济学的发展可以说是你中有我，我中有你，不少当今赫赫有名的经济学家就发迹于其在博弈论方面的研究成果。

博弈论在主流经济学中地位变迁：

在40年代晚期，博弈论充满了生机，并对世界产生广泛的影响。

但到70年代后，经济学家开始发现通过把博弈论应用于复杂的经济问题可能得到一些特处的的东西。理论和应用方面的新发现对非对称信息和动态行为的分析尤其有用。

在80年代，博弈论迅速成为主流经济学的重要组成部分。事实上，它几乎吞没了整个微观经济学，就如同计量经济学吞没了"经验经济学"一样。

实例：:

例一，HalVarian的《微观经济分析》(Microecomeconom论Analysis)是一本在欧美非常流行的高级微观经济学教科书，几乎所有大学的研究生课程都用这本书。在1984年的第二版中，没有博弈论，甚至在书后的词汇表上都找不到"博弈论"这个词，但是在1992年的第三版就加上了"博弈论"一章，而且有关寡头竞争这一章也按博弈论的理论重写了。

例二，克瑞普斯在1990年出版的《微观经济理论教程》是1991年最畅销的经济学教科书，被相当多的欧美名牌大学选为研究生课程的教材，其中的第三部分就是"非合作博弈"，共219页，占全书正文的28%强，且书中的许多内容也涉及到博弈论。当然这可能与他本人就是博弈论专家有关。1990年他因对博弈论的贡献而获美国克拉克奖(全美对40岁以下经济学家的最高奖励)。

例三，泰勒尔，法国经济学家，曾在NIIT任教)在1988年出版了《产业组织理论》一书。该书是目前最受欢迎、最流行的有关产业组织的教科书，全书的内容都是建立在非合作博弈论的基础上的，以致作者不得不在最后加上一章"非合作博弈论"，供不熟悉非合作博弈论的读者参考。现在，博弈论已经基本上成为产业组织理论中占主导地位的研究方法。

博弈论进入主流经济学，反映了经济学发展的以下几个趋势:

第一，经济学研究的对象越来越转向个体，放弃了一些没有微观基础的假定，如消费函数及其投资函数、销售最大化等，一切从个人效用函数及其约束条件开始，解约束条件下的个人效用最大化问题而导出行为及均衡结果。这正是博弈论研究的范式:给出个人的支付函数及战略空间，然后看当每个人都选择其最优战略以最大化个人支付函数时将发生什么。这与经济学效用最大化的方式完全吻合。

第二，经济学越来越转向人与人关系的研究，特别是人与人之间行为的相互影响和作用，人们之间的利益冲突与一致，竞争与合作的研究。过去经济学研究个人行为时，总是假设其他人的行为都被总结在一个非人格化的参数价格里面，所以个人是在给定价格参数下决策，人们行为之间的相互作用是通过价格来间接完成的。

但是现在不是这样了，经济学开始转向对人与人之间的直接关系进行研究。经济学越来越重视人与人之间关系的研究，特别是经济学开始注意到理性人的个人理性行为可能导致的集体非理性。

个人理性与集体理性的冲突：

在传统经济学里，价格可以使个人理性和集体理性达到一致。

现代经济学开始注意到个人理性和集体理性的矛盾与冲突，但是解决这个问题的办法并不是像传统经济学主张的那样通过政府干预来避免市场失败所导致的无效状态，而是认为，如果一种制度安排不能满足个人理性的话，就不可能实行下去。

所以解决个人理性与集体理性之间冲突的办法不是否认个人理性，而是设计一种机制，在满足个人理性的前提下达到集体理性。认识到个人理性与集体理性的冲突对于认识制度安排是非常重要的。

第三，经济学越来越重视对信息的研究，特别是信息不对称对个人选择及制度安排的影响。如我们己经提到的，博弈论成为主流经济学的一部分，正是伴随着经济学对信息问题的重视而来的。从某种意义来讲，信息经济学是博弈论应用的一部分，或者说，信息经济学是非对称信息博弈论。

2 非合作博弈论的一个非技术性概述

博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡。参与人：

指的是博弈中选择行动以最大化自

己效用的决策主体(可能是个人，也

可能是团体，如国家、企业)1

行动：

是参与人的决策变量;

战略：

是参与人选择行动的规则，它告诉参与人在什么时候选择什么行动(如"人不犯我，我不犯人;人若犯我，我必犯人"是一种战略，这里，"犯"与"不犯是两种不同的行动，战略规定了什么时候选择"犯"，什么时候选择"不犯")

信息：

指的是参与人在博弈中的知识，

特别是有关其他参与人(对手)的特

征和行动的知识;

支付函数：

是参与人从博弈中获得的效用水平，

它是所有参与人战略或行动的函数，

是每个参与人真正关心的东西;

结果:

是指博弈分析者感兴趣的要素的集合均衡:

是所有参与人的最优战略或行动的组合。

上述概念中，参与人、行动、结果统称为博弈规则，博弈分析的目的是使用博弈规则决定均衡

博弈的分类：

博弈的划分可以从两个角度进行。第一个角度是参与人行动的先后顺序。从这个角度，博弈可以划分为静态博弈和动态博弈。

静态博弈指的是博弈中，参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动;

动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。第二个角度是参与人对有关其他参与人(对手)的特征、战略空间及支付函数的知识。从这个角度，博弈可以划分为完全信息博弈和不完全信息博弈。

完全信息指的是每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识，否则，就是不完全信息。

将上述两个角度的划分结合起来，我们就得到四种不同类型的博弈，这就是:

完全信息静态博弈，

完全信息动态博弈，

不完全信息静态博弈，

不完全信息动态博弈。

与上述四类博弈相对应的是四个均衡概念，即:

纳什均衡

子博弈精炼纳什均衡，

贝叶斯纳什均衡

精炼贝叶斯纳什均衡

2一1完全信息静态博弈:纳什均衡

纳什均衡：

假设有n个人参与博弈，给定其他人战略的条件下，每个人选择自己的最优战略(个人最优战略可能依赖于也可能不依赖于其他人的战略)，所有参与人选择的战略一起构成一个战略组合。

纳什均衡指的是这样一种战略组合，这种战略组合由所有参与人的最优战略组成，也就是说，给定别人战略的情况下，没有任何单个参与人有积极性选择其他战略，从而没有任何人有积极性打破这种均衡。用句不太褒义的话来说，纳什均衡是一种"僵局":给定别人不动的情况下，没有人有兴趣动。

纳什均衡可以从另一个角度来理解：

假设博弈中的所有参与人事先达成一项协议，规定出每个人的行为规则。那么，我们要问的一个问题是，在没有外在的强制力约束时，当事人是否会自觉地遵守这个协议?或者说，这个协议是否可以自动实施?

说当事人会自觉遵守这个协议，等于说这个协议构成一个纳什均衡:给定别人遵守协议的情况下，没有人有积极性偏离协议规定的自己的行为规则。换句话说，如果一个协议不构成纳什均衡，它就不可能自动实施，因为至少有一个参与人会违背这个协议，

纳什均衡的哲学思想：

不满足纳什均衡要求的协议是没有意义的。这就是纳什均衡的哲学思想。

例：市场经济就是一种纳什均衡，认识自

私的，每个人的选择都是在一定范围

内的最佳选择。在企业中，劳资双方

是一种自愿的结合，谁都不想破坏这

种结合。

例：公有制不是一种纳什均衡，因为要人

先国家，再集体，最后是个人，谁都

想破坏者一规则。

例：钟摆，总是自动回到最低点，钟摆回到最低点使它的最佳选择，否则就要有外力来维持。

例：市场价格，是一种纳什均衡，在一种状态下，谁都不肯改变。

例：讲奉献不是一种纳什均衡，义务劳动不是一种纳什均衡。

纳什均衡模型：

例一，囚徒困境模型

坦白

抵赖

坦白

抵赖

囚徒A

囚徒B

囚徒困境讲的是两个嫌疑犯作案后被警察抓住，分别被关在不同的屋子里审讯。警察告诉他们:如果两人都坦白，各判刑8年;如果两个都抵赖，各判1年(或许因证据不足);如果其中一人坦白另一人抵赖，坦白的放出去，不坦白的判刑10年(这有点"坦白从宽、抗拒从严"的味道)。

这里，每个囚徒都有两种战略:坦白或抵赖。表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用)，其中第一个数字是第一个囚徒的支付，第二个数字为第二个囚徒的支付。战略形式又称标准形式，是博弈的两种表述形式之一，它特别方便于静态博弈分析。

在这个例子里，纳什均衡就是(坦白，坦白):给定B坦白的情况下，A的最优战略是坦白;同样，给定A坦白的情况下，B的最优战略也是坦白。事实上，这里，(坦白，坦白)不仅是纳什均衡，而且是一个占优战略均衡,

就是说，不论对方如何选择，个人的最优选择是坦白。比如说，如果B不坦白，A坦白的话被放出来，不坦白的话判一年，所以坦白比不坦白好;如果B坦白，A坦白的话判8年，不坦白的话判10年，所以，坦白还是比不坦白好。这样，坦白就是A的占优战略;同样，坦白也是B的占优战略。结果是，每个人都选择坦白，各判刑8年。

囚徒困境反映了一个很深刻的问题，这就是个人理性与集体理性的矛盾:

如果两个人都抵赖，各判刑1年，显然比都坦白各判刑8年好。但这个帕累托改进办不到，因为它不满足个人理性要求，(抵赖，抵赖)不是纳什均衡。换个角度看，即使两囚徒在被警察抓住之前建立一个攻守同盟(死不坦白)，这个攻守同盟也没有用，因为它不构成纳什均衡，没有人有积极性遵守协定。

囚徒困境在经济学上有着广泛的应用，这里举几个例子。

例一：两个寡头企业选择产量的博弈。

如果两企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多的利润。但卡特尔协定不是一个纳什均衡，因为给定对方遵守协议的情况下，每个企业都想增加生产，

结果是，每个企业都只得到纳什均衡产量的利润，它严格小于卡特尔产量下的利润。

这个例子也说明，在有些情况下，个人理性与集体理性的冲突对整个社会来说也许是一件好事，尽管它对该集体的成员而言是一件坏事。前述囚徒的行为也如此。当然，这里的前提条件是集体成员的数量严格小于全体社会成员的数量。

例二：公共产品的供给

公共产品的供给也是一个囚徒困境问题。如果大家都出钱兴办公用事业，所有人的福利都会增加。问题是，如果我出钱你不出钱，我得不偿失，而如果你出钱我不出钱，我就可以占你的便宜。所以，每个人的最优选择都是"不出钱"，这种纳什均衡使得所有人的福利都得不到提高。

例三：军备竞赛。

冷战期间，苏美两国都竞争增加各自的军费预算，如果不搞军备竞赛，各自把资源用于民品生产，不是很好吗?问题是，如果我把资源用于民品生产，你增加军费支出，我不是就受到威胁吗?这样对我不好。纳什均衡是两国都大量增加军费预算，两国的社会福利都变得更槽。

例四：经济改革

在许多改革中，改革者要付出成本(包括风险)，而改革的成果大家共享，结果是，尽管人人都认为改革好，却没有人真正去改革，大家只好在都不满意的体制下继续生活下去。

例五、战略联盟

从囚徒困境模型引出的很重要的结论:

一种制度(体制)安排，要发生效力，必须是一种纳什均衡。否则，这种制度安排便不能成立。

模型二，智猪博弈

这个例子讲的是，猪圈里圈两头猪，一头大猪，一头小猪。猪圈的一头有一个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有10个单位的猪食进槽，但谁按按钮谁就需要付2个单位的成本。

若大猪先到，大猪吃到9个单位，小猪只能吃l个单位;若同时到，大猪吃7个单位，小猪吃3个单位;若小猪先到，大猪吃6个单位，小猪吃4个单位。

按

等待

按

等待

小猪

大猪

纳什均衡为：大猪案，小猪等待

例：股票炒作

股市上有大户，也有小户，大户类似"大猪"，小户类似"小猪"。这时候，对小户而言，"跟大户"是最优选择，而大户则必须自己搜集信息，进行分析。

例：市场申大企业与小企业之间的关系

进行研究开发，为新产品做广告，对大企业是值得的，对小企业则得不偿失。所以，一种可能的情况是，小企业把精力花在模仿上，或等待大企业用广告打开市场后出售廉价产品。

例：公共产品提供

比如说，村里住两户人家，一户富，一户穷，有一条路年久失修。这时候，富户一般会承担起修路的责任，穷户则很少这样干，因为富户家常常是高朋满座，坐车坐轿的都来，而穷户家只是自己穿着破鞋走路，路修好了他走起来舒服，路修不好他也无所谓。

例：经济改革

改革带给一部分人的好处可能比另一部分人大得多。这时候，前一部分人比后一部分人更有积极性改革，改革往往就是由这些"大猪"推动的。如改革能创造出更多的"大猪"来，改革的速度就会加快。

模型三，性别战

一男一女谈恋爱，有些业余活动要安排，或者去看足球比赛，或者看芭蕾舞演出。男的偏好足球，女的则更喜欢芭蕾，但他们都宁愿在一起，不愿分开。

足球

芭蕾

足球

芭蕾

男

女

这个博弈中，有两个纳什均衡:

(足球，足球)，

(芭蕾，芭蕾)。

就是说，给定一方去足球场，另一方也会去足球场;类似地，给定一方去看芭蕾，另一方也会去看芭蕾。

那么，究竟哪一个纳什均衡会实际发生?我们不知道。实际生活中，也许是这一次看足球，下次看芭蕾矽口此循环，形成一种默契。

这里还有一个先动优势，比如说，若男的买票，两人就会出现在足球场，若女的买票，两人就会在芭蕾舞厅。

模型四：斗鸡博弈(chickengame)。

设想两个人举着火棍从独木桥的两端走向中央进行火拚，每个人都有两种战略:

继续前进，或退下阵来。

进

退

进

退

若两人都继续前进，则两败俱伤;若一方前进另一方退下来，前进者取得胜利，退下来的丢了面子;若两人都退下来，两人都丢面子。

纳什均衡：一方进，另一方的最优战略是退

例：冷战期间，苏美两个军事集团在世界各地抢占地盘，也是一种斗鸡博弈。一般来说，如果一方已经抢占了一块地盘，另一方就设法占领另一块地盘，而不是与对手竞争同一块地盘。

例：警察与游行队伍的例子。

游行队伍与警察越来越近，这时候，定要有一方退下来。如果警察不让步，游行队伍便会向后退;反过来，如果游行队伍来势很猛，警察就得撤退。

例：夫妻间矛盾

一般来说，吵得厉害了，不是妻子回娘家躲一躲，就是丈夫到院子里抽支烟。

斗鸡博弈的一个重要问题是：

究竟哪一方退下来，因为退下来虽比两败俱伤好，总归是一件丢面子的事情。若每一方都寄希望于对方退下阵来，两败俱伤的结局也可能出现。另外，在混合战略纳什均衡情况下，两败俱伤的事也会出现。

模型五，市场进入阻挠

这是产业组织经济学中的一个例子。设想有一个垄断企业已在市场上(称为"在位者")，另一个企业虎视眈眈想进入(称为"进入者")。在位者想保持自己的垄断地位，所以就要阻挠进入者进入。在这个博弈中，进入者有两种战略可以选择:进入还是不进入;在位者也有两种战略:默许还是斗争。

假定进入之前垄断利润为300，进入之后寡头利润合为100(各得50)，进入成本为10。

进入

不进入

进入

不进入

进入者

在位者

这个博弈也有两个纳什均衡，即

(进入，默许）

(不进入，斗争）

为什么(进入，默许）是纳什均衡?

因为给定进入者进入，在位者选择默许时得50单位利润，选择斗争时得不到利润，所以，最优战略是默许。类似地，给定在位者选择默许，进入者的最优战略就是进入。

尽管在进入者选择不进入时，默许和斗争对在位者是一个意思，只有当在位者选择斗争时，不进入才是进入者的最优选择，所以，(不进入，斗争)是一个纳什均衡，而(不进入，默许)不是一个纳什均衡。

2一2完全信息动态博弈:子博弈精炼纳什均衡

前面介绍了纳什均衡的概念。但纳什均衡有三个问题：

第一，如前述例三、例四和例五所示，一个博弈可能有不止一个纳什均衡，事实上，有些博弈可能有无数个纳什均衡，究竟哪个纳什均衡实际上会发生?不知道。

第二，在纳什均衡中，参与人在选择自己的战略时，把其他参与人的战略当作给定的，不考虑自己的选择如何影响对手的战略。这个假设在研究静态博弈时是成立的，因为静态博弈下，所有参与人同时行动，无暇反应。但对动态博弈而言，这个假设就有问题了。当一个人行动在先，另一个人行动在后时，后者自然会根据前者的选择而调整自己的选择，

前者自然会理性地预期到这一点，所以不可能不考虑自己的选择对其对手的选择的影响。

第三，与第二个问题相联系，由于不考虑自己选择对别人选择的影响，纳什均衡允许了不可置信威胁的存在。如前述例五的市场进入阻挠中，如若进入者真的进入，在位者的最优行动显然是默许而不是斗争，因为默许带来50的利润，斗争则使利润化为乌有。

所以，斗争是一种不可置信的威胁，就是说，如果在位企业摆出一副"你进入我就斗争"架势，进入企业不应该被这种威胁所吓倒，因为它是不可置信的。但是，纳什均衡概念承认了这种不可置信的威胁，所以(不进入，斗争)便成为一个纳什均衡。

这就引出了泽尔腾的贡献。泽尔腾(1965)通过对动态博弈的分析完善了纳什均衡的概念，定义了"子博弈精炼纳什均衡"。这个概念的中心意义是将纳什均衡中包含的不可置信的威胁战略剔除出去，就是说，使均衡战略不再包含不可置信的威胁。

它要求参与人的决策在任何时点上都是最优的，决策者要"随机应变"，"向前看"，而不是固守旧略。由于剔除了不可置信的威胁战略，在许多情况下，精炼纳什均衡也缩小了纳什均衡的个数。这一点对预测是非常有意义的。这里，有必要介绍一下博弈的另外一种表述形式，即扩展型。博弈的标准型表述有三个要素:参与人，每个参与人可选择的战略，及支付函数。两人有限战略博弈的标准型可以用一个矩阵表表示。对比之下，扩展型表述包含五个要素:

(1)参与人，

(2)每个参与人选择行动的时点，

(3)每个参与人在每次行动时可供选择的行

动集合，

(4)每个参与人在每次行动时有关对手过去

行动选择的信息，

(5)支付函数。

博弈树(gametrees)是扩展型的一种形象

化表述。

下图是前面讲过的"市场进入阻挠"博弈(例五)的博弈树。这里，进入者先选择行动(进入或不进)，在位者然后选择默许还是斗争，最后的数字是支付水平。如进入者选择"进入"，在位者选择默许，支付水平分别为40和50。

进入者

进入

不进入

0，300

在位者

合作

斗争

40，50

-10，0

博弈树用于表述动态博弈是非常方便的，它一目了然地显示出参与人行动的先后次序，每位参与人可选择的行动，及不同行动组合下的支付水平。在动态博弈中，如果所有以前的行动是"共同知识"，就是说，每个人都知道过去发生了些什么(什么人在什么时候选择了什么行动)，每个人都知道每个人知道……那么给定历史，从每一个行动选择开始至博弈结束又构成一个博弈，称为"子博弈"。

如图中，在进入者选择进入之后，在位者选择行动开始就是一个子博弈。在博弈论的著作中，一般把整个博弈也称为一个子博弈。子博弈的概念可以用生活中的一个例子来说明(尽管有欠准确)：

如果我们把家庭生活作为一个博弈，这个博弈始于男女双方谈恋爱，结婚后是一个子博弈，生孩子后又是一个子博弈，如此等等。事实上，由于生活每天都在进行，每天都是一个子博弈的开始。

子博弈精炼纳什均衡概念：

一个纳什均衡称为精炼纳什均衡，当只当参与人的战略在每一个子博弈中都构成纳什均衡，就是说，组成精炼纳什均衡的战略必须在每一个子博弈中都是最优的。

在市场进入博弈中，在给定进入者己经进入的情况下，在位者的"斗争"战略已不再是最优的。所以，(进入，斗争)不是一个精炼纳什均衡。剔除了这个均衡，(进入，默许)是唯一的子博弈精炼纳什均衡。

精炼均衡与纳什均衡的关系：

一个精炼均衡首先必须是一个纳什均衡，但纳什均衡不一定是精炼均衡。只有那些不包含不可置信威胁的纳什均衡才是精炼纳什均衡。

例：设想一个农村姑娘爱上一个小伙子，她父亲坚决不同意，威胁说，如果女儿不与小伙子断绝恋爱关系，他就与女儿断绝父女关系。如果女儿相信父亲的话，她大概会中断与恋人的关系，因为恋人是可以重新选择的，而父亲则无法重新选择。

问题是，假使女儿真的与恋人结婚了，父亲难道真的会走断绝父女关系这一步吗?一般来说是不会的，因为断绝父女关系对父亲的损害会更大。这就是说，父亲的威胁是不可置信的。聪明的女儿当然明白这一点，她知道，一旦生米煮成熟饭，父亲只好吃下去。结果是女儿会勇敢地恋爱下去直到结婚，父亲最终承认那个他当初并不喜欢的女婿。这大概是这个博弈中唯一的精炼纳什均衡。这个例子与市场进入博弈的例子很相似。

不可置信的威胁引出信息经济学中一个很重要的概念，Bp"承诺行动"(committment)。承诺行动是当事人使自己的威胁战略变得可置信的行动。一种威胁在什么时候才是可置信的?答案是，只有当事人在不施行这种威胁时，就会遭受更大的损失的时候。所以说，承诺行动意味着当事人要为自己的"失信"付出成本，尽管这种成本并不一定真的发生。但承诺行动会给当事人带来很大的好处，因为它会改变均衡结果。

举例来说，在市场进入博弈中，如果在位者通过某种承诺行动使自己的"斗争"威胁变得可置信，进入者就不敢进入，在位者就可以获得300的垄断利润，而不是50的寡头利润。承诺行动可能有多种形式。一种简单的办法是，在位者与某个第三者打个赌:如果进入者进入后他不斗争，他就付给后者100。这时，斗争就变成了一种可置信的威胁。因为，如果进入后不斗争而是选择默许，在位者得到50的寡头利润，去掉100的赌注，净得一50;而若选择"斗争"，净得为0，所以斗争比合作好。

注意，有了这个赌，进入者就不敢迸入了，在位者实际上无需支付100的赌注，却得到300垄断利润(在这个例子中，承诺行动的实际成本为零，但一般来说，承诺行动的成本不为零。而且，承诺行动的成本越高，威胁就越值得置信)。承诺行动在军事博弈中有广泛应用。如两军对阵抢占一个小岛，红军可从岛北通过一座桥抢占该岛，白军可以从岛南抢占该岛。假使红军抢先一步占领了小岛，白军要不要进攻呢?红军若一上岛就派工兵将桥炸掉，自绝后路，表示出决一死战的劲头，白军大概就不会再去争夺了。这里，炸掉小桥是红军的一种承诺行动，它使得红军决一死战的威胁变得可置信了。

成语"破釜沉舟"讲的就是这个意思。项羽与秦兵交战，领兵过河后就砸锅沉船，这就是一种承诺行动。另一个例子是三国演义》中曹操与袁绍仓亭之战。曹操召集将领来献破衰之策，程昱献了十面埋伏之计。他让曹操退军河上，诱袁军前来追击，到那时"我军无退路，必将死战，可胜绍矣"。曹操采纳此计，令许褚诱袁军至河上，曹军无退路，操大呼日:"前无去路，诸军何不死战一众军回头奋力反击，袁军大败(严格地讲，袁绍的追击是非理性的。

如果他预期到曹军将无退路，他就不应该追击)。

最后我想谈的一点是，精炼纳什均衡与宏观经济学申讲的理性预期均衡和政策动态一致性很类似。政策的动态一致性(me-consistency)指的是一种政策不仅在制定时应是最优的，而且在制定之后的执行当中也应该是最优的(假定没有新的信息出现)，否则就是动态不一致的。比如说，在理性预期假设下，只有未预料到的通货膨胀才会对产出发生影响。

如果政府有兴趣用通货膨胀的办法解决失业问题，政府的零通货膨胀政策就不是动态一一致的，因为给定公众相信零通货膨胀的情况下，政府就有积极性在事后制造通货膨胀。这说明，零通货膨胀的许诺是不可置信的。具有理性预期的公众当然不会被政府所愚弄，最后的结果是一个被预料到的正的通货膨胀，而失业率则会保持在其"自然水平"。这是一个精炼纳什均衡。当然，政府也许会从自身长远利益的考虑树立一个不制造通货膨胀的形象。这里，重要的是政府必须言而有信。

0.2一3不完全信息静态博弈:贝叶斯纳什均衡

我们前面讲的博弈都包含一个基本假设，即所有参与人都知道博弈的结构、博弈的规则，知道博弈的支付函数(pay)。回到前面"市场进入"博弈的例子，也就是进入者知道在位者的偏好、战略空间及各种战略组合下的利润水平，反之亦然。满足这个假设的博弈称为完全信息博弈(gamesofcompleteinformation)。当然，这个假设在许多情况下是不成立的。比如说，进入者实际上并不完全了解在位者的生产函数、成本函数及偏好。这就是不完全信息博弈(gamesof;n-completeinformation)。设想在位者成本函数有两种可能的情况，对应于这两种情况的支付矩阵分别如表0·八表0·8所示。

0·7市场进人，育成本佑况

显然，在给定进入者选择进入的情况下，高成本在位者的最优战略是默许，而低成本在位者的最优战略是斗争。低成本情况下斗争之所以比默许优，可能是由于在位者的生产成本是如此之低，从而他在非常低的价格下获得的垄断利润(此时进入者已无利可图)也高于相对高的价格下分享到的寡头利润(另一种可能的解释是，在位者有一种好斗的天性，他更乐于与进入者斗争而不是合作)。在1967年之前，通到上述情况，博弈论是无能为力的。

因为，当你还不知道你的对手为何物时，你如何选择自己的战略呢?海萨尼的贡献(1967一1968)就是使得上述情况变得可以分析。他的办法是引入一个虚拟的参与人 "自然"(上帝n。《自然"不同于一般参与人之处在于它在所有后果之间是无差异的。自然首先行动选择参与人的"类型"。被选择的参与人知道自己的真实类型，而其他参与人并不清楚这个被选择的参与人的真实类型，仅知道各种可能类型的概率分布。

另外，被选择的参与人也知道其他参与人心目中的这个分布函数就是说，分布函数是一种"共同知识"(commonknowledge)。在"市场进入"这个例子中，自然首先选择在位者的类型，一高成本还是低成本;在位者本人知道自己究竟是高成本还是低成本，而进入者仅知道在位者或者是高成本，或者是低成本，并且，知道高成本和低成本的可能性各为多少。

海萨尼的上述工作被称为"海萨尼转换"(theHarsanyi transfor血ation)。通过这个转换，海萨尼把"不完全信息博弈"转换成"完全但不完美信息博弈"(completebutimperfectin- formation)。这里，"不完美信息"指的是，自然作出了它的选择，但其他参与人并不知道它的具体选择是什么，仅知道各种选择的概率分布。这样;不完全信息博弈就变得可以分析了。在这个基础上，海萨尼定义了"贝叶斯纳什均衡"。贝叶斯(匝yes)是一位概率统计学家。

贝叶斯均衡是纳什均衡在不完全信息博弈中的自然扩展。我们可以对此作如下解释:在静态不完全信息博弈中，参与人同时行动，没有机会观察到别人的选择。给定别人的战略选择，每个参与人的最优战略依赖于自己的类型。由于每个参与人仅知道其他参与人的类型的概率分布而不知道其真实类型，他不可能准确地知道其他参与人实际上会选择什么战略。但是，他能正确地预测到其他参与人的选择是如何依赖于其各自的类型的。

这样，他决策的目标就是在给定自己的类型和别人的类型依从战略的情况下，最大化自己的期望效用。贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下，每个参与人的期望效用达到了最大化，也就是说，没有人有积极性选择其他战略。

现在我们再回到"市场进入"这个例子。在这个例子中，进入者只有一种类型，在位者有两种类型(高成本或低成本)。也就是说，进入者具有不完全信息，而在位者具有完全信息。给定进入者选择进入的情况下，在位者选择默许还是斗争依赖于他的类型;如果是高成本，就默许;低成本，就斗争。进入者不知道在位者的真实类型，但是，比如说，他知道高成本的可能性为z，低成本的可能性为(1一2)。那么，进入者选择进入得到的期望利润为402十(一10)(1一刀)，选择不进入的期望利润为零。

一个简单的计算表明，当2一0·20时，进入得到的期望利润才大于不进入时的期望利润，从而，进入才是最优的。假定z大于0·20，那么，贝叶斯(纳什)均衡是:进入者选择进入，高成本在位者选择默许，低成本在位者选择斗争。再举个生活中的例子。设想有人向你求爱，你的选择是接受还是拒绝，依赖于你对求爱者品德的判断。假定如果你准确地知道求爱者品德良好，你会选择接受，反之，不接受。问题是，你可能并不准确地知道求爱者的品德。

这时，你的决策显然取决于你在多大程度上相信他是一个品德优良(或品德恶劣)的人。表0·9和表0，10分别列出两种情况下的支付矩阵。这里，我们假定不论求爱者品德如何，要他求爱你接受，他就得到100;但是，你的支付依赖于求爱者的类型:接受一个品德优良者的求爱使你得到100，而接受一个品德恶劣者的

现在假设你认为求爱者品德优良的概率为刀。求爱者也知道这个z为多少，那么他求爱你接受时你的期望效用为1002十(一100)(1一2)，你不接受时你的期望效用为零。

当无一1/2时，你接受才是最优选择。如果z确实大于1/2，贝叶斯(纳什)均衡是，求爱者求爱，你接受;反之，如果2之1夕，贝叶斯(纳什)均衡是:求爱者不求爱，你不接受。为什么当2之1/2时，求爱者选择不求爱呢?因为他知道他求爱会被你拒绝，这种损脸面的事是不值得干的。

贝叶斯纳什均衡的一个重要应用领域是招标或拍卖方面。设想政府有一项建设工程要出包，选择要价最低的承包者。

假设招标的办法是一级密封投标，让每个投标者将自己的标价写下装入信封，一同交给政府，信封打开后，政府选择标价最低者为中标者。这时，不同投标者之间进行的就是一场博弈。假定每个投标者不知道其他投标者的真实生产成本而仅知其概率分布，那么，他在选择自己的报价时就面临着一种交替:报价越低，中标的可能性就越大;但另一方面，给定申标的情况，报价越低，利润就越小。

博弈分析证明，每个投标人的标价依赖于他的类型(这里为生产成本，，但一般来说，贝叶斯均衡标价高于生产成本。二者之间的差异随总投标人数的增加而减少。这就是说，让更多的企业参加投标，对政府是一件有利的事情。这是中国在出卖或出租国有企业、国有土地时要考虑的事情(这时，出价最高者得胜，。

0.2一4不完全信息动态博弈:林炼贝叶斯均衡

前面我们谈了不完全信息静态博弈，接下来我们谈谈不完全信息动态博弈。在动态博弈中，行动有先后次序，后行动者可以通过观察先行动者的行动获得有关后者偏好、战略空间等方面的信息，修正自己的判断，如我们日常生活中通过观察某人的行为表现来了解其品德一样。自然，先行动者知道自己的行为有传递自己特征信息的作用，就会有意识地选择某种行动来揭示或掩盖自己的真实面目(如好人想让别人知道自己是好人，坏人则设法噫瞒自己是坏人)。当然在均衡状态下，理性人是不会被愚弄的。

对应于不完全信息动态博弈的均衡概念是"精炼贝叶斯均衡"(perfect匝yesianequ们brium)。这个概念是完全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合，对此作出贡献的主要有泽尔腾(1975)，克瑞普斯和威尔逊(1982)及弗得伯格和泰勒尔(FudenbergandTiroIe，1991)等。泽尔腾定义了"颤抖手均衡伙tremblinghandequi-l记rium)，克瑞普斯和威尔逊定义了"序贯均衡"(sequential-equ们brium)，弗得伯格和泰勒尔给出了"精炼贝叶斯均衡"的正式定义。理论上讲，序贯均衡是比精炼贝叶斯均衡更强的概念，

而颤抖手均衡又比序贯均衡更为强，但在许多情况下，三个概念是一致的。

精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为来修正自己有关后者类型的"信念"(主观概率)，并由此选择自己的行动。这里，修正过程使用的是贝叶斯规则。这一点意味着，每个参与人都假定其他参与人选择的是均衡战略。具体来讲，精炼贝叶斯均衡是所有参与人战略和信念的一种结合，

它满足如下条件:(1)给定每个人有关其他人类型的信念的情况下，他的战略选择是最优的，(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。用数学的语言来说，精炼贝叶斯均衡是个"不动点"。应该强调的是，与其他均衡概念不同，精炼贝叶斯均衡不能仅定义在战略组合上，它必须同时说明参与人的信念，因为量优战略是相对于信念而言的。

这里有必要解释一下贝叶斯规则。贝叶斯规则是概率统计学中应用所观察到的现象修正先验概率的一种标准方法。根据这一规则，比如说，给定张三干了X这件事的条件下张三属于类型A的概率(后验概率)，等于(你认为)张三属于类型A的先验概率乘以A类型人干X这件事的概率，再除以张三可能千这件事的"边际"概率。更为具体地讲，设想张三是你办公室新来的一位同事，你对他的人品不了解简单地说，你认为他是好人和坏人的可能性相等。你知道好人是不干坏事的，只有坏人才干坏事。

如果有一天你发现张三干了一件坏事，你就会修正对他的看法，说他肯定是一个坏人，这里你事实上使用了贝叶斯规则把你认为张三是坏人的概率由0·5修正为1。当然，如果张三干了一件好事，你也许会或也许不会修正对他的看法，依赖于这件好事好到什么程度，因为坏人为了假装好人也会干些一般性的好事。下面我们举几个例子来说明不完全信息动态博弈的精炼贝叶斯均衡。

第一个例子回到张三与你。设想张三有一种恃强欺弱的天性，喜欢与弱者斗，但害怕与强者相遇。张三在第一次遇到你后是否应该欺负你?答案依赖于他对你是强者还是弱者的判断。假设他最初判断你是弱者的概率为0·2，是强者的概率为0·8，那么，他大概不会欺负你。现在假定你在进行某种可以被张三观察到的行动，比如说，吃早餐。早餐的内容也许包含着有关你强弱的某些信息，张三可以通过分析你的早餐内容修正他对你的判断。

假设强者喜欢吃辣椒，弱者不喜欢吃辣椒。如果张三发现你不吃辣椒，自然会认为你是弱者，可欺。你知道自己不吃辣椒的后果，即使本性懦弱，也许会强迫自己吃几根辣椒，以示自己并不是弱者。张三当然不会被你的这种鬼把戏迷惑。他会仔细地观察你究竟能吃多少辣椒。除非你吃的辣椒的数量足够多，否则，张三不会认为你是一个强者。因为强悍的你也不愿意与张三相斗，张三知道，如果你真是一个强者，你或许会吃比通常情况下更多的辣椒以示自己确实是强者，

这个数量是如此之多以致如果是个弱者的话，你是受不了的。一个可能的精炼贝叶斯均衡是，懦弱的你不吃辣椒(吃少无用吃多难受)，强悍的你吃辣椒(比通常情况多)，张三根据你是否吃辣椒来推断你是强者还是弱者，然后选择是否欺负你。另一个可能的均衡是，懦弱的你和强悍的你都吃同样数量的辣椒，张三从吃辣椒这件事推不出任何新的信息，他仍然认为你是强者的概率为0·8，弱者的概率为0·2，所以仍然不敢欺负你。用博弈论的术语讲，前一个均衡口q"分离均衡"，后一个均衡叫"混同均衡"。

成语故事"黔驴之技"实际上也是一个动态不完全信息博弈。毛驴刚到贵州时，老虎见它是个庞然大物，不知有多大本领，感到很神奇。给定这个"信念"，老虎躲在树林偷偷地瞧毛驴就是一种最优选择。过了一阵子，老虎走出树林，逐渐接近毛驴，就是想获得有关这个庞然大物的真实本领的信息。有一天，毛驴忽然大叫一声，老虎吓了一跳，急忙逃走，这也是最优选择，因为毛驴的叫声是老虎预料之外的。又过了一些夭，老虎又来观看，发现毛驴并没有什么特别的本领，对毛驴的叫声也习以为常了，

但老虎仍不敢下手，因为他对毛驴的真实本领还没有完全了解。再后来，老虎对毛驴挨得更近，往毛驴身上挤碰，故意冒犯它。毛驴在忍无可忍的情况下，就用蹄子去踢老虎。这一踢向老虎传递的信息是"毛驴不过这点本事而已"，所以老虎反倒高兴了。到这时，老虎对毛驴已有了完全的了解，所以就扑过去把它吃了。这个故事里，老虎通过观察毛驴的行为逐渐修正对毛驴的看法，直到看清它的真面目，把它吃掉，这是一个精炼贝叶斯均衡。

老虎的每--步行动都是给定它的信念下最优的。事实上，这个故事里，毛驴的行为也是很理性的，它知道自己技能有限，所以不到万不得已是不用那仅有的一技的，否则它早就被老虎吃掉了。

现在回到"市场进入"例子上来。在这个博弈中，在位者可能是低成本，也可能是高成本，进入者事先不知道。在静态博弈中，进入者只能根据先验判断选择进入还是不进入。现在假设在位者先行动比如说定价。我们用P来表示价格。

那么，P本身可能包含有关在位者成本函数的信息，因为不同成本函数下的最优价格是不一样的。假定存在一个价格尸"，只有低成本企业才有利可图，而高成本企业是不敢模仿这个价格的。那么，精炼贝叶斯均衡是，低成本在位者选择P*，高成本企业选择-d个较高的垄断价格;如果进入者观察到在位者选择了P，，就推断其为低成本，不进入;否则，就认为在位者是高成本，进入。这就是著名的"垄断限价模型"(MilgromandRoberts，1982)。

精炼贝叶斯均衡的一个重要应用是"信号传递模型"。上述垄断限价模型是信号传递模型的一个特例。这类模型由斯宾塞(Spence，1974)开创，具有广泛的应用领域(但斯宾塞本人没有使用博弈论的术语)。斯宾塞(1974)分析的是劳动力市场上工人的教育水平如何传递有关能力的信息。这个模型里，企业的生产率取决于工人的能力。工人的能力可能高可能低，工人本人知道，雇主不知道，教育本身不改进工人的能力，但却可以传递有关这种能力的信息，

原因是，教育要花费成本，而高能力的人的教育成本相对于低能力的人要低，因为一个笨蛋要比一个聪明人过受更大的痛苦才能完成必修的课程拿到文凭。这样，文凭就成为能力的象征，尽管它不一定是能力的源泉。高能力的人要把自己与低能力的分开，就要选择受更多的教育，企业看到受过教育的人就推断是高能力，支付高工资。如果这个模型是正确的话，我们也许不应该简单地因为所学内容无用就否定一种教育制度，如中国古代社会的科举制度，它或许也具有信号传递的功能。

在完全信息动态博弈中，我们强调了承诺行动在子博弈精炼纳什均衡中的重要性。这里，要强调一下成木在精炼贝叶斯均衡中的重要性。一种行动要起到某种传递信息的功能，行动者必须为此付出足够的成本，否则，所有其他类型的参与者都会模仿。这也就是说，只有负担成本的行动才是可信的。简单地告诉对方"我是低成本企业"、"我是强者"、"我是好人"、"我是高能力的人"之所以不传递信息，就是因为这类"行动"不花成本，谁都可以效仿。

低成本企业要把自己与高成本企业分开从而阻止进入者进入，就得定---个比短期垄断价格低的价格牺牲一部分短期利润;强者要把自己与弱者分开以免遭恃强欺弱者的进攻，就要吃比一般情况下多的辣椒;好人要把自己与坏人分开，就得干更多更大的好事;高能力的人要把自己与低能力的人分开，就得接受没有实际价值的教育，如此等等。

这种为传递信息支付的成本是由信息的不完全性导致的。那么，是不是说不完全信息就一定是件坏事呢?不一定。Kreps，Milgrom，Roberts和Wilson(1982)关于声誉的模型证明，在有限次重复囚徒困境博弈中，不完全信息可以导致合作的后果，而这在完全信息下是不可能的，理由是，当信息不完全时，当事人为了获得合作带来的长期利益，不愿过早地暴露自己的本性。说得更通俗一点，在一种长期的关系中，

一个人千好事还是坏事常常不取决他在本性上是好人还是坏人，而很大程度上取决于其他人在多大程度上认为他是好人。给定其他人并不知道自己的真实面目，一个坏人也会在相当长时间内于好事，这就如同雨果小说《悲惨世界》中的主人公一样。从这个意义上讲，过早地揭穿坏人的"真面目"也许不是一件好事，因为坏人干好事本身并不一定是件坏事。当然，在博弈的最后阶段，坏人的真实面目总是要暴露的，这就是我们常说的"路遥知马力，日久见人心"。

标签：

博弈论与信息经济学在线阅读(博弈论与信息经济学电子书)

相关内容推荐：