发生在我们身边的博弈

更新时间：2024-04-27 15:25:01 阅读量：综合文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

发生在我们身边的小事推荐度：
相关推荐

《身边的博弈论：博弈论与信息经济学浅说》第一稿余治国编著（《中国民营企业批判》当代中国出版社，《转型力：中国企业转型之道》清华大学出版社，目前正在创作《企业与企业家道德》国家行政学院出版社）目录

序言大博弈的思维观 2

第一章什么是博弈论：从秦始皇统一天下谈起 3 1．秦始皇因何统一天下？ 3 2．博弈是一种竞合游戏 5 3．博弈论不是“万金油” 7

第二章纳什均衡、纯策略与混和策略 8 1．从围棋定式谈纳什均衡 8

2．从爱情故事谈起：优势策略与房地产开发博弈 10 3．房地产博弈、警察捉小偷博弈与纳什均衡 11 4．位置博弈与商家策略 12 5．猎鹿模型的合作哲学 13 第三章 “囚徒困境”的启示 14 1．“囚徒困境”的深刻哲理 14 2．经济自由与效率 16 3．“囚徒困境”的破解：无限次重复博弈与有限次重复博弈4．威胁、承诺、作弊与惩罚 19 5．国家法律 20

6．猴子的故事与道德约束 21

7．爱克斯罗德试验、针锋相对的策略 22 8.合作、利他主义与爱克斯罗德试验的局限 23 第四章 “智猪博弈”：对诸多现象的解释 25 1．“智猪博弈”的故事 25 2“智猪博弈”与激励机制设计 26 3．企业战略与“智猪博弈” 27 4．证券市场中的“智猪博弈” 28 第五章常见的博弈案例 29 1．“斗鸡博弈”与“骑虎难下” 29 2．银行会垮掉吗？ 31 3．如何以弱胜强？ 32 4．公共地悲剧 34

5．少数人博弈与酒吧问题 35 6．房地产市场的多人博弈 36 第六章信息经济学基础 37 1.信息有价 37

2. 从形象工程谈道德风险 39

3．逆向选择的困境：二手车市场为何建立不起来？ 41 4.声誉、信号传递与制度设计 42 5．所罗门故事与信息甄别 44 第七章讨价还价的策略 46 1．从情侣博弈谈起 46 2．先发优势与后发优势 47

3．谈判的要诀:掌握对方心理与妥协 48 4．独裁者博弈与劳资谈判 49 第八章如何做好一个老板 50

17 1．管理需要建立预期 50 2．奖罚分明 51

3．强强如何有效联合？ 53 4．如何接到一个项目？ 54 第九章民主的悲剧 55 1.社会选择的形式 55 2.非排序式投票 56 3．孔多塞投票法则 58 4．BORDA法则及其他 60 5．投票操纵的方法：民主的悖论 6．阿罗不可能定理 62 参考文献： 64

序言大博弈的思维观

对于许多非数学专业和经济学专业的人们来说，博弈论可能是一个极为陌生的概念。但在国外，博弈论作为现代经济学的前沿领域，已成为占据主流的基本分析工具。1994年诺贝尔经济学奖即授予三位博弈论专家，1996年诺贝尔经济学奖又授予两位与博弈论一脉相承的信息经济学的开拓者。经济学的三次重大的“革命”，分别是“边际分析革命”、“凯恩斯革命”与“博弈论革命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命，博弈论与信息经济学代表着一种新概念、新方法论、新分析方法和一种全新的思想。经济学家凯恩斯1936年在《就业利息与货币通论》写过这样一段深刻的话，“经济学家和政治哲学家的思想，不管是正确的还是错误的，其力量之大，往往超出常人意料。事实上，统治这个世界的就只是这些思想。许多实践家自以为绝不受任何知

识的影响，却往往当上了一些已故经济学家的奴隶。执政的狂人，自称听到了上帝的指示，实际上却是从若干年前一些学术界劣等思想家那儿拾取了一些怪诞的想法......比起思想的逐渐侵蚀力来，既得利益的势力被过分夸大了。” 由此可见，博弈论的思想比任何技术性的分析都要重要。

实际上，博弈之道是古已有之，但博弈思想的系统化、数学化却是近几十年的事。正是因为博弈科学是一门新学科，我国管理界、经济界对博弈论与信息经济学的研究还是停留在引进介绍层面上，他们发表的成果大多堆砌庞杂的数学算法与令人眩目的数学模型。虽然博弈论与信息经济学在中国已是一门显学，但却逐渐变成阳春白雪、弃之不用的高深学问或是概念混乱而被滥用到极至。

博弈论与信息经济学不仅仅能在学术领域中光彩夺目，在其它领域如军事、管理、体育、政治、公关、个人生活中同样能得到充分利用，甚至在生物学中都可以觅其踪迹。在普通的企业管理中，经营者要熟练地掌握管理之术，必须能够自动自发并自觉地运用博弈论与信息经济学。在日常生活中，人们可以博弈论与信息经济学得思想方法赖分析甚而解决实际问题。正是因为如此，诺贝尔经济学奖获得者保罗·萨缪尔逊（Paul Samuelson）说：“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解。”

笔者试图在这本小册子中用最浅显的语言描述博弈论与信息经济学的大概思路方法，能用语言可以描述的就尽量少用或不用数学，因此笔者未对博弈论与信息经济学作数学化、系统的证明与阐述。但是，只有这样才能够使似乎高深的博弈论与信息经济学思想很轻松地为普通读者所掌握，并能够让读者应用其思想方法来分析甚至是能够解决身边的实际问题。笔者这里还要解释一下书名的由来，“身边的博弈论”并不是说读者身边看到感受到的博弈论，这样理解未免过于狭窄。这里“身边的博弈论”的含义是，人们身边无处不在的博弈哲学，无论是直接感受到还是从未接触过的社会、政治、法律、军事、经济、管理等现象。

由于笔者本人学识有限，对博弈论与信息经济学的理解与研究尚不深刻，错误在所难免，敬请博弈论与信息经济学的方家高人指点，以免贻误广大读者。

余治国2005年9月谨识于安徽工业大学

第一章什么是博弈论：从秦始皇统一天下谈起

1．秦始皇因何统一天下？

2000多年前，雄才大略的秦始皇第一次统一了中国大地,并创建了当时世界上最庞大的帝国，得以名垂青史。从当时的历史条件来看，秦国虽然在商鞅变法之后实力大增，但其经济、政治、军事实力是远远不能与六国总和相匹敌的。这种情况下，六国与秦国的形势就产生了两种针锋相对的可能：其一，六国采用“合纵”政策对抗秦国，也就是各国缔结军事盟约，共同抵御秦国的侵略，秦国若对任一国家发动侵略，其它国家必须无条件出兵营救；其二，六国采用“连横”政策与秦国妥协，也就是各国都与秦国签订友好互助条约，保持双边和平关系。

当时七国之中，只有齐国实力比秦国稍逊一筹，成为六国军事同盟的核心。一旦齐国放弃“合纵”政策，六国的军事同盟就土崩瓦解。真实的历史也证明了这一点，秦国对六国联盟的破坏正是从齐国开始的。在这种情况下，秦国与齐国都有两种战略政策可以选择，那就是“合纵”与“连横”。秦国如果默许六国“合纵”，齐国采用“合纵”政策，结果是秦国势力扩张被遏制，而齐国成为六国领袖，势力得以扩张。秦国采取“连横”政策，齐国仍然采取“合纵”政策，结果是秦国与六国处于对峙状态。秦国默许六国“合纵”，齐国却采用“连横”政策与秦国示好，结果是秦国没有吞并六国的野心自然无法一统天下，齐国的势力也没有得以扩张。而历史的真相是，秦国采取“连横”政策，齐国默许秦国的“连横”政策并与秦国建立友好外交关系，齐国最终被灭，千古一帝秦始皇得以名扬千秋。

秦国与六国集团之间的争斗实质上就是一种博弈。秦国与齐国之间的战略政策选择正是为了在保持自身能够生存的基础上谋取更大的利益甚至是统一天下。有利益的争夺是博弈的目的，也是形成博弈的基础。经济学的最基本的公设就是经济人或理性人的目的就是为了收益最大化，参与博弈的博弈者正是为了自身收益的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系，以争得利益的多少决定胜负，一定的外部条件又决定了竞争和对抗的具体形式，这就形成了博弈。如象棋对局的参与者是以将对方的军为目标，战争的目的是为了胜利，古罗马竞技场中角斗士在争夺两人中仅有的一个生存权，企业经营的目的是为了生存发展，而股市中人们所争的很实在，就是金钱。从经济学角度来看，有一种资源为人们所需要，而资源的总量具有稀缺性或是有限的，这时就会发生竞争，竞争需要有一个具体形式把大家拉在一起，一旦找到了这种形式就形成了博弈，

竞争各方之间就会走到一起开始一场博弈。《孙子兵法》上说，“知己知彼，百战百胜。”，可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中，秦国与齐国都明白对方的策略，从博弈理论来说，更拗口的说法是秦国知道齐国知道自己的策略，反之齐国亦然，这种句法我们可以一直这么用下去，一直用到打“??”，而这正是博弈双方所掌握的信息。因此我们可以了解到，形成一个博弈有4个要素： 1．博弈要有2个或2个以上的参与者（Player）。在博弈中存在一个必须的因素，那就是不是一个人在一个毫无干扰的真空作决策。比如，前例中只有秦国，而没有与之对抗的六国，就不存在“合纵连横”的博弈。从经济学的角度来看，如果是一个人做决策而不受到他人干扰的话，那就是一个传统经济学或管理学中最经常研究的最优化问题，也就是一个人或一个企业在一个既定的局面或情况下如何决策的问题。最简单一个最优化的例子就是，吸烟伤肺，不吸烟却又伤心，烟民是选择抽烟还是不抽烟，这就需要进行权衡（Tradeoff）。如果这个烟民非单身贵族，而是有妻子或女友，这种情况下就很有可能形成一个博弈。这也就是，博弈者的身边充斥着具有主观能动性的决策者，他们的选择与其它博弈者的选择相互作用、相互影响。这种互动关系自然会对博弈各方的思维和行动产生重要的影响，有时甚至直接影响着其他参与者的决策结果。

在冯·诺依曼（Von Neumann）的博弈论奠基之作《博弈论与经济行为》一书中举过这样一个经典的例子。在《鲁滨逊漂流记》中，与世隔绝的“鲁滨逊”（Robinson Crusoe）一个人组成一个独立的经济系统，有中学数学水平的人都能够清楚，这只是一个普通的求解最大值的问题。因为鲁滨逊面对的是一些死的数据，而不是有主观意愿的人。一旦“星期五”（《鲁滨逊漂流记》中鲁滨逊的黑人仆人）加入这个系统，这个经济系统就形成了一个博弈问题。 2）博弈要有参与各方争夺的资源或收益（Resources或Payoff）。资源指的不仅仅是自然资源，如矿山、石油、土地、水资源等，还包括了各种社会资源，如人脉、信誉、学历、职位等。如果这些资源是无限供给的，那么我们也不需要为共产主义而奋斗了，因为一步就可以迈入“货恶其弃于地也，不必藏于已，力恶其不出于身也，不必为已。”、“大道之行也,天下为公。”的大同社会。当然，不可否认是，一方面，博弈者之间会发生冲突；另一方面，他们当中也包含着合作的潜力。

笔者在这里还要强调一点是，资源是有主观性的。人们之所以会参与博弈是受到利益的吸引，预期将来所获得利益的大小直接影响到竞争博弈的吸引力和参与者的关注程度。经济学的效用理论可以用来解释这个问题，凡是自己主观需要的就是资源，反之亦然。比如，“孩子总是自己的好，妻子总是别人好”：自己的孩子在眼里是无价之宝，而在别人面前相对是无价值的；即使是众人公认的美妻娇眷也会产生审美疲劳，资源的价值不断下降，这正是效用递减规律起了作用。最极端的例子大概就是明代小说《镜花缘》中所描绘的君子国，人人礼让使得客观的资源就变得毫无价值，自然就不存在竞争与博弈。 3）参与者有自己能够选择的策略（Strategy）。所谓策略，就是“计利以听，乃为之势，以佐其外。势者，因利而制权也。”，这指的是直接实用的针对某一个具体问题所采取的应对方式。通俗的说策略就是计策，是博弈参与者所能够选择的手段方法。比如秦国就采用了“连横”的策略将六国“合纵”瓦解。

一般日常生活中，策略选择仅是解决问题的方法，并不牵涉到分析关键因素、确定局势特征这些理论化的内容。而博弈论种的策略选择，是先对局势和整体状况进行分析，确定局势特征，找出其中关键因素，然后在最重要的目标上进行策略选择。由此可见，博弈论种的策略是可以牵一发而动全身的，这直接对整个局势造成重大影响。 4）参与者拥有一定量的信息（Information）。比如在“合纵连横”的故事中，秦国与六国之间所拥有的信息就是完全的。但有些时候，信息并不是完全的，俗话说“天有不测风云”，比如今天是阴云密布、狂风大作，气象台预报明天是“阴转小雨”，明天出门上班到底要不要带伞呢？这种情况的信息是不完全的，人们决策的信息条件是不确定。当然从情理上说，在实际生活中一般是要带伞以防不测。

通俗的说，博弈就是个人或组织在一定的环境条件与既定的规则下，同时或先后，仅仅一次或是进行多次地选择策略并实施，从而得到某种结果的过程。我们生活在这个世界上，就不可避免地要与他人打交道，这是一个利益交换的过程，也就无可避免地要面对各种矛盾和冲突。所谓博弈论听似拗牙聱齿，看似深不可测，但其思想极易理解。简单说来博弈论就是研究，人们如何进行决策、以及这种决策的如何达到均衡问题。每个博弈者在决定采取何种行动时，不但要根据自身的利益和目的行事，还必须考虑到他的决策行为对其他人的可能影响，以及其他人的反应行为的可能后果，通过选择最佳行动计划，来寻求收益或效用的最大化。

2．博弈是一种竞合游戏

“博弈论”的英文是“Game Theory”，实际上Gme的本意是游戏，博弈论直接翻译成中文最贴切的直译是“游戏理论”。更准确点说，是一种竞合的智力游戏。

所谓竞合，就是竞争合作的简写，一个博弈，并不仅仅是竞争，实际上竞争种包含着潜在合作的种子，合作中包含着潜在竞争的种子。合作博弈并不是指合作各方具有合作的意向或态度，而是指在博弈中有一些对博弈各方有约束力的协议或契约，或者说是博弈各方不能公然“串通”或“共谋”。合作博弈最典型的例子就是石油输出国组织欧佩克（Organization of Petroleum Exporting Countries，简称Opec），其1960年9月，由伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会，决定联合起来共同对付西方石油公司，维护石油收入。随着成员的增加，欧佩克发展成为亚洲、非洲和拉丁美洲一些主要石油生产国的国际性石油组织。欧佩克协调和统一各成员国的石油政策，并以石油生产配额制的手段来维护它们各自和共同的利益,把

国际石油价格稳定在公平合理的水平上。比如有些时候为防止石油价格飚升，欧佩克可依据市场形势增加其石油产量；为阻止石油价格下滑，欧佩克则可依据市场形势减少其石油产量。

智力游戏与博弈相近似的本质是，在确定游戏规则的约束下，游戏参与者决策、行动的过程。各种智力游戏实际上就是一个实际社会、经济、管理、军事、政治等现象抽象出来的缩微模拟的模型。在这个意义上不妨说，博弈论就是研究怎么玩好游戏的理论。

游戏是一种抽象。面对复杂现象时，人们经常会“见树木不见森林”，无法抓住某种现象的关键所在。而在游戏中，可以通过抽象出现实生活中的要点，并将干扰因素减至最低，从而轻松地分析问题并找到合理可行的解决方法。

中国最古老的围棋最初的功能形态就是模拟战争。围棋包含最多的是军事内涵，如围而歼之，生死存亡为先，争地夺利为上。围棋以获得最大的利益为胜，抽象出战争的本质和目的，非常符合战争规律。

围棋游戏的规则极其简单，不过是两气生，一气死，附加帖目、打劫等辅助规则，最终以所占地盘大小定胜负。但其作为一项智力游戏，与战争在很多方面都相通。围棋棋手在小小棋盘上较量，就是战争、战场、战斗在棋盘上的演绎。战争理念和战争指导思想是“基于毁伤”，以破坏、消耗、摧毁敌方为上。现代西方国家提出“基于效果”的作战思想，美国人将这一战争理念上的革命称为新的战争哲学。基于效果就是，着眼于敌方整个作战系统的控制，使之丧失作战能力。美军在伊拉克发动“斩首行动”的前一天，还专门召开了推出基于效果作战理念的新闻发布会，接着就发动了进攻。

围棋模拟出“基于效果”的战争理念，强调从全局上控制，而不是基于蝇头小利。即所有的作战方法都必须是有效的，着子要看在全局中是否有用、有效,而不再是基于棋理、棋道、棋风等虚幻的在形式。基于效果的思想就是赢棋第一，实事求是。比如韩国棋手李昌镐就是基于效果的典范。

现在很多世界级公司都已经明白智力游戏的作用。比如著名的微软公司在招聘员工时出过非常“儿童化”的招聘考题，题目是这样的：“某合唱团的4名成员A、B、C、D往演出现场，他们途中要经过一座小桥。当他们赶到桥头时，天已经黑了，周围没有灯。他们只有一只手电筒。现在规定：一次最多只许两人一起过桥，过桥人手里必须有手电筒，而且手电筒不能用扔的方式传递。4个人的步行速度都不同，若两人同行，则以较慢者的速度为准。A需花1分钟过桥，B过桥需花2分钟，C需花5分钟过桥，D需花10分钟过桥。请问：他们能在17分钟内过桥吗？” 这可不是微软公司的别出心裁，据说世界上许多跻身世界500强的公司在招收新员工时，都要出类似的智力题。

智力游戏可以锻炼人的思维能力，培养人的思维方法。良好的思维方法能使我们从错综复杂的现象中找到事物的本质，从纷繁的因素中找到事物变化的主要原因，使事物呈现出条理性。思维方法是抽象的，它不像1＋1＝2那么简单，只有通过自己的想像，亲自动手操作，经历失败，才能逐步形成。思维科学化程度越高的人，工作中发现问题、解决问题的能力就越强。这一点已成为人们的共识。

在许多智力游戏中，都存在这么一个共同的特点，就是参与者所选择的策略对于胜负有着举足轻重的影响。一个游戏一点规则制订好之后，策略选择的好坏就成了游戏参加者所能自由运用的左右游戏结果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全相同的游戏中，策略选择就成了游戏结果的唯一决定因素。

至于从围棋初段段到九段之间的差别，从博弈论的角度去看，就是他们之间策略选择的技巧高低不同而已。博弈论的策略思维是一种技巧。策略思维从一些基本技巧出发，考虑的是怎样将这些基本技巧最大限度地发挥出来。任何游戏都有自己的规则（Rule of the game）。实际现实自然也是如此，这就是法律、道德和各种成文或不成文的规章制度和惯例等。当然，这些规则也不是一成不变的，它会随着情况的改变和人们的要求不断修正，但是只要规则存在，这个规则就是确定了人们行为的前提条件。因此博弈与游戏都有一个重要的共同特征，那就是这些规则规定游戏参加者可以做什么，不可以作什么，按照什么次序去做，什么时候结束游戏，一旦参与者犯规将受到怎样的处罚等。

游戏者的策略有相互依存的关系。每一个游戏者从游戏所得结果的好坏不仅取决于自身的策略选择，同时也取决于其它参加者的策略选择。有时甚至一个坏的策略会给选它的一方带来并不坏的结果，原因是其它方选择了更坏的利他而不利己的策略。这一点也是游戏与博弈重要的相似之处。 3．博弈论不是“万金油” 博弈论并不是“万金油”，正如诺贝尔经济学奖得主莱因哈德·泽尔滕教授所说，“博弈论并不是疗法，也不是处方，它不能帮我们在赌博中获胜，不能帮我们通过投机来致富，也不能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西，这是计算机或者字典的任务。”

要求博弈论能够完全刻画真实的世界，那么这命中注定会徒劳无功。根据著名的哥德尔不完备定理，任何一个理论体系必定是不完全的，任何理论包含了既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能只有其本身，但是正如罗宾逊夫人的妙语“比例尺是一比一的地图是没用的”。

博弈论也是这样，博弈论力图用最简单的假设下得到最大范围的推理应用。博弈论的这种方法与很多应用广泛学科都是相似的。如欧几里德几何的基本假设是两点之间直线，推演出庞大而严密的几何体系，可以说，在生活中或工程应用中，欧几里德几何学的思想方法是无处不在、无时不有。其基本公设之一就是，人是理性的（rational）。所谓理性的人是指行动者具有推理

能力，在具体策略选择时的目的是使自己的利益最大化。而现实生活中，人们再做决策时往往是有限理性。

所谓有限理性，也就是说人不是机器，人的理性是有限度的。比方说，某人要签署一份合同，有三种方法可供选择：一种是计划好，安排好一切，然后不动脑筋按部就班地照计划进行；另一种是做进度安排的时候都留一点余地，可供签订合同双方私下协商解决：最后一种是完全没有安排，凭着当时的感情与直觉任意为之，这种方法当然不可能是理性的。

后两种一眼就可看出完全不满足博弈论意义上的理性，即使是第一种方法也不是真正意义上的经济理性。这是因为人们很难对每个措施将要产生的结果具有完全的了解和正确的预测，常常要在缺乏完全了解的情况下，一定程度地根据主观意识进行决策，个人或企业的决策都是在有限理性的条件下进行的。完全理性，意味着对每个抉择的确切后果都有完完全全的了解。事实上，一个人对自己的行动条件的了解，从来都只能是零碎的；至于使他得以从对当前状况的了解去推想未来后果的那些规律和法则，他也是所知甚微的。

人类的精力和时间永远是有限的，人不可能具备完全理性，不可能掌握所有知识和信息。人类也不可能搜寻到所需的全部的信息。另一方面也要意识到信息的搜寻需要成本，而不是毫不费成本的，因为人类必须为此付出大量的时间、精力和财力等等。意图搜寻到所有信息，企图做出收益最优的决策行为有时反而是最不理性的行为。

但当我们退而求其次时，博弈论可以得到对现实的客观世界描述的近似。所以博弈论仍然是我们目前所能得到的最好但非唯一的工具。就像并不完美的力学是自然科学的哲学和数学一样，博弈论是社会科学的力学和数学。没有牛顿力学我们连最简单的物理现象都无法理解，马用了多大的力拉动一车货物？上帝说“让牛顿来做吧”，于是我们知道了马用的力相当于克服摩擦力。同样的道理，没有博弈论我们也无法解释分析很多现实的社会现象。著名的博弈论大师鲁宾斯坦（Rubinstein）说过，“一个博弈模型是我们关于现实的观念的近似，而不是现实的客观描述的近似”。看来“理论之树是灰色的，生命之树常青！”这句话，我们应该谨记于心。

第二章纳什均衡、纯策略与混和策略

1．从围棋定式谈纳什均衡

我们已经知道，博弈论的基本前提是，某人或某物的行为效果如何，有赖于他人或他物的行为。由于世上人间的事物很少不依赖于其他事物而存在。非合作博弈强调利益的冲突，即非合作甚至对抗状态。比如，“零和博弈”就是典型的非合作博弈，它是指博弈各方的所得之和为零，在特殊情况下如两人博弈时，一方所得与另一方所失相等。从严格的数学角度来看，围棋19?19的361个交叉点就是围棋对弈者所得的总和，因此围棋棋手非输即赢，可见围棋明显是数学意义上的严格的零和博弈。世事如棋局，而棋局是可以用博弈思维加以概括的。比如过分的“骗着”，“本手”与“缓着”之间，一般都会选择本手，着法过分如不遇反击，可能占到便宜，如遇反击则可能亏损，因此如果棋力相当，则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占尽便宜。这就导致双方都能接受的方案。

围棋定式从策略层面看，如一方的策略是抢占实地，另一方是获得外势，而结果相当，互有所得，双方就愿意那样下。抢占实地考虑现实利益，获得外势考虑将来发展，这便形成一个双方的“均衡”；另一方面，可以从具体行棋效果来看，如果一步棋能考虑到对手各种应手而依然成立，对手也运用同样法则找到应对，则可以说双方达成了“均衡”。

在经济学中，均衡(equilibrium)意即相关量处于稳定值。比如在经典的供需分析中，若某一商品的市场价格使得欲购买该商品的人均能买到，同时想卖的人均能将商品卖出去，此时该商品的供求达到了均衡。这个市场价格可称之为均衡价格，产量可称之为均衡产量。均衡分析是经典经济学中的重要方法。

在讲解纳什均衡之前，我们再来看这样一个例子。一般对博弈论稍微有些了解的人，都会知道“囚徒困境”这个名词。这个例子就是在“囚徒困境”的基础上所作的修改。

A和B是两个因盗窃而被抓的惯犯。警察局局长C正在调查该局管辖区域内的一宗悬而未决的银行抢劫案，并且他根据一系列的线索判定A和B是这桩案子的凶犯。因为该局管辖地区治安一向混乱不堪，C的上级对C非常恼火，直接威胁C如果银行案破不了，就要撤销C局长的职位，给予降级惩罚。C在上级的压力下不得不耗费大量时间、精力提审A和B。为了能够让两个囚犯认罪，C想让A和B明白，假如只有他们其中的一人坦白认罪则这个人可能受到的最严厉的惩罚是什么，但向他们遵守承诺，若两个人都坦白，则会从轻发落。

于是，这个警察局长C分别与A、B立下许诺：如果只有一个人坦白认罪，则认罪的一方会收到所有指控，会因银行抢劫而判无期徒刑，另一个人则不会再加刑罚。如果无人认罪，两个人都会因盗窃罪而判刑2年。如果两个人都坦白，则两个人都被判处有期徒刑5年。

这样，警察局长C给A和B构造了一个博弈。不妨假设，A和B都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人，同时A和B被分别审查不能够进行沟通。在这种情况下，A会在脑子里打小算盘，他会想：如果选择坦白，那么B选择坦白时将判刑5年，B选择不坦白时将判刑20年，因此选择坦白时最坏的打算就把牢底坐穿；若是选择不坦白，那么B选择坦白时将无罪释放获得自由，B选择不坦白时将判有期徒刑5年，因此选择不坦白时最坏的可能就是被囚禁5年。两害相权，取其轻。因此在这种情况下，A必然会选择不坦白，同样的道理，B也会选择不坦白。这个时候，博弈达到了这样一种局面，这

种局面就是纳什均衡（Nash Equilibrium）。

纳什均衡的思想其实并不复杂，在博弈达到纳什均衡时，局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益，于是各方为了自己利益的最大化而选择了某中最优策略，并与其他对手达成了某种暂时的平衡。这种平衡在外界环境没有变化的情况下，倘若有关各方坚持原有的利益最大化原则并理性面对现实，那么这种平衡状况就能够长期保持稳定。

再简单一点说，一策略组合中，所有的参与者面临这样的一种情况：当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的收益将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。由此可见，纳什均衡是一稳定的博弈结果。打一个比方，如果把一个乒乓球，放到一个光滑的铁锅里，不论其初始位置在何处，最终乒乓球都会稳定地停留在锅底，这时的锅底就可称为是一个纳什均衡点。相反，如果锅是扣在地上的，那么锅底部位是很难放稳一个乒乓球的，因为往任何方向的一点点移动，都会使球彻底离开锅底。这时的锅底部位就不是一个纳什均衡点了。

博弈的结果并不都能成为均衡。博弈的均衡是稳定的，则必然可以预测。纳什均衡的另一层含义是：在对方策略确定的情况下，每个参与者的策略是最好的，此时没有人愿意先改变或主动改变自己的策略。在上面的“囚徒困境”变形的博弈中，A和B都不坦白就是一个纳什均衡，这对双方来说都是最优选择。同时在这个博弈中，其均衡对双方来说是全局最优的。当然博弈达到纳什均衡，并不一定是对参与者最有利的结果，更不意味着是对整个社会作为一个整体而言最有利的结果，比如“囚徒困境”的例子导致了整体的不利。

围棋与这个博弈的例子是有所不同的。上面的这个例子是A和B双方没有信息交换下的博弈，这就是博弈论中的静态博弈概念。围棋则是对弈双方相继按照一先一后次序行动的博弈。对于一人一步的相继行动的博弈，每个参与者都必须向前展望或预期，估计对手的意图，从而倒后推理，决定自己这一步应该怎么走。这是一条线性的推理链：“假如我这么做，他就会那么做——若是那样，我会这么反击”，后面的步骤依此类推。也就是说，你怎么走棋，完全取决于对手的上一招。这在博弈论上叫做“倒推法”。在动态博弈中，存在明显的马太效应，也就是说凡是少的，连他仅有的也夺过来；凡是多的，就加给他，让他更多。比如在围棋上，就有“一招不慎，满盘皆输”的谚语，当然我们也要应用动态博弈的马太效应原理，在获得优势的情况能够保持优势扩大优势，直至最后成功。

而在同时行动的静态博弈里，没有一个博弈者可以在自己行动之前得知另一个博弈者的整个计划。在这种情况下，互动推理不是通过观察对方的策略进行，而是必须通过看穿对手的策略才能展开。要想做到这一点，单单假设自己处于对手的位置会怎么做还不够。即便你那样做了，你只会发现，你的对手也在做同样的事情，即他也在假设自己处于你的位置会怎么做。因此，每一个人不得不同时担任两个角色，一个是自己，一个是对手，从而找出双方的最佳行动方式。与一条线性的推理链不同，这是一个循环，即“假如我认为对方认为我认为??”。

这样来看，定式是一系列纳什均衡的累计直至局部达到稳定的一种变化，直到一方认为可以根据形势选择任何变化或脱先而无局部受损之虞。由于定式是在大量实战基础上不断被验证并长期积累而成。

因此在动态博弈中，纳什均衡的要义在于：即使在对抗条件下，双方可以通过向对方提出威胁和要求，找到双方能够接受的解决方案而不至于因为各自追求自我利益而无法达到妥协，甚至两败俱伤。稳定的均衡点建立在找到各自的“占优策略”(dominant?strategy)，即无论对方作何选择，这一策略优于其他策略。 2．从爱情故事谈起：优势策略与房地产开发博弈

“原地高天，堪叹古今情难尽；痴男怨女，可怜风月债难偿。”我们来先看欧·亨利的小说《麦吉的礼物》描述的这样一个爱情故事。新婚不久的MM和GG，很是穷困潦倒。除了MM那一头美丽的金色长发，GG那一只祖传的金怀表，便再也没有什么东西可以让他们引以为傲了。虽然生活很累很苦，他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了促进对方的利益，他们愿意奉献和牺牲自己的一切。

话说明天就是圣诞节了，小两口都是身无余钱。为了让爱人过得好一点，每个人还是想悄悄儿准备一份礼物给对方。GG卖掉了心爱的怀表，买了一套漂亮发卡，去配MM那一头金色长发。MM剪掉心爱的长发，拿去卖钱，为GG的怀表买了表链和表袋。

最后，到了交换礼物的时刻，他们无可奈何地发现，自己如此珍视的东西，对方已作为礼物的代价而出卖了。花了惨痛代价换回的东西，竟成了无用之物。出于无私爱心的利他主义行为，结果却使得双方的利益同时受损。欧·亨利在小说中写道：“聪明的人，送礼自然也很聪明。大约都是用自己有余的物事，来交换送礼的好处。然而，我讲的这个平平淡淡的故事里，两个住公寓的傻孩子，却是笨到极点，彼此为了对方，白白牺牲了他们屋檐下最珍贵的财富。”从这段文字看，欧亨利似乎并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨，单从利益的角度来解读。我们假定，他们每个人，有一个“毫不利己专门利人”的偏好系统，毫不考虑自身利益，专门谋求别人的幸福。这样，个人选择付出还是不付出，只看对方能不能得益，与自己是否受损无关。以这样的偏好来衡量，最好的结果自然是自己付出而对方不付出，对方收益增大；次好的结果是大家都不付出，对方不得益也不牺牲；再次的结果是大家都付出；最坏的结果是别人付出而自己不付出，靠牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结果的评价：第一种结果给3分，第二种结果给1分，第三种结果

给1分，最后那种给0分。

不难看出，无论对方选择付出，还是选择不付出，个人自己的最佳选择都是付出。然而这并不是对大家都有利的选择。事实上，大家都选择不付出，明显优于大家都选择付出的境况，这就达到了上文提到的纳什均衡。

实际上，这里的例子是一个博弈论中所说的占优策略均衡。通俗地说，在占优策略均衡中，不论所有其他参与人选择什么策略，一个参与人的占优策略都是他的最优策略。显然，这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。因此，占优策略均衡一定是纳什均衡。在这个例子中，MM选择不付出，也就是不剪掉金发对于MM来说是一个优势策略，也就是说MM不付出，GG不管选择什么策略，MM所得的结果都好于GG。同理，GG不卖掉怀表对于GG来说也是一个优势策略。

再举个简单的例子：一名篮球前锋和队友在蓝下面对着对方的一个后卫时，形成了二打一的局面，该前锋可以选择直接投篮，也可以选择传球给队友，根据经验，传球过人的成功率更大，那么传球就是该前锋的优势策略。即某些时候它胜于其他策略，且任何时候都不会比其他策略差。如果一个球员具有这样一种策略，无论其他球员怎么做，这个策略都会高出一筹，那么这个球员就有一个优势策略。当然如果一个球员有这么一个优势策略，他的决策就会变得非常简单，只要直接采用该策略而完全不必考虑对手的应对策略。

还有一个要注意的问题是，采用优势策略得到的最坏结果并不一定比采用另外一个策略得到的最佳结果要好，这是很多博弈论普及书中容易出错的一个问题。应该说，对局者采用优势策略在对方采取任何策略时，总能够显示出优势。比如就这个例子来说，就MM来说，她采用不付出的策略，无论GG付出或不付出，MM的不付出策略总是占有优势。GG的优势策略也是一样。但是，MM选择不付出的最坏结果是1，二选择付出的最好结果是3，很明显，MM的优势策略得到的最坏结果并不比采用另外一个策略得到的最佳结果要高出一筹。

反之，劣势策略则是指在博弈中，不论其他参与人采取什么策略，某一参与人可能采取的策略中，对自己严格不利的策略，劣势策略是我们在日常生活中不可以选择的行动。劣势策略是与优势策略相对应的概念，笔者这里就不多做介绍。 3．房地产博弈、警察捉小偷博弈与纳什均衡

实际上，在上一小节，每个参与人都有优势策略的情况下，优势策略均衡是非常合乎逻辑的。一个优势策略优于其他任何策略，同样，一个劣势策略则劣于其他任何策略。假如你有一个优势策略，你可以选择采用，并且知道你的对手若是有一个优势策略他也会照办；同样，假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有一个劣势策略他也会规避。但遗憾的是不是所有博弈都有优势策略，哪怕这个博弈只有两个个参与者。实际上，优势策略只是博弈论的一种特例。虽然出现一个优势策略可以大大简化行动的规则，但这些规则却并不适用于大多数现实生活中的博弈。

来看这样一个房地产开发博弈的例子。假定北京市的房地产市场需求有限，Ａ、Ｂ两个开发商都想开发一定规模的房地产，但是市场对房地产的需求只能满足一个房地产的开发量，而且，每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下，无论是对开发商Ａ还是开发商Ｂ，都不存在一种策略完全优于另一种策略，也不存在一个策略完全劣于另一个策略。因为，如果Ａ选择开发，则Ｂ的最优策略是不开发；如果Ａ选择不开发，则Ｂ的最优策略是开发；类似地，如果Ｂ选择开发，则Ａ的最优策略是不开发；如果Ｂ选择不开发，则Ａ的最优策略是开发。这样就形成了一个循环选择。

根据纳什均衡含义就是：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。这个博弈的纳什均衡点不止一个，而是两个：要么A选择开发，B不开发；要么A选择不开发，B选择开发。在这种情况下，A与B都不存在优势策略，也就是A和B不可能只要选择某一个策略而不考虑对方的所选择的策略。实际上，在有两个或两个以上纳什均衡点的博弈中，其最后结果难以预测。在房地产博弈中，我们无法知道，最后结果是A开发，B不开发还是A不开发，B开发。

再来看这样一个警察捉小偷博弈的例子。某个村庄上只有一名警察，他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B，A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷，要在村中偷盗A和B的财产，这个消息被警察得知。因为分身乏术，警察一次只能在一个地方巡逻；而小偷也只能偷盗其中一家。若警察在某家看守财产，而小偷也选择了去该富户家，就会被警察抓住；若警察没有看守财产的富户家而小偷去了，则小偷偷盗成功。

一般人会凭着感觉认为，警察当然应该看守富户A家财产，因为A2万元的财产而B只有1万元的财产。实际上，对于警察的一个最好的做法是，警察抽签决定去A还是B家。因为A家的财产是B家的2倍，所以用两个签代表A家，比如如果抽到1、2号签去A家，抽到3号签去B家。这样警察有2／3的机会去A家进行做看守，1／3的机会去B家做看守。而小偷的最优选择是：以同样抽签的办法决定去A家还是去B家实施偷盗，只是抽到1、2号签去A家，抽到3号签去B家，那么，小偷有l／3的机会去A家，2／3的机会去B家。这些数值是可以通过联立方程准确计算出的，笔者这里就不给出具体的数学计算过程。

细心的读者会发现，警察捉小偷博弈与前面所举的两个博弈案例有一个很大的差别，就是用到了概率的知识，警察与小偷没有一个一定要选择某个策略的纳什均衡，而只有选择某个策略是多少几率的纳什均衡。

在博弈论中，可以选择出某个策略的纳什均衡，这个策略叫做纯策略，凡是用到概率（并且几率不能为0和1，否则就退化

为纯策略，可以想见，纯策略的纳什均衡只是博弈的一种特例）的纳什均衡。用专业的话来说，所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点。所谓混合策略是指参与者采取的不是惟一的策略，而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点，而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。

最常见混和策略就是猜硬币游戏。比如在足球比较开场，裁判将手中的硬币抛掷到空中，让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的，概率应该都是1/2。那么，猜硬币游戏的参与者都是1/2的概率选择正与反，这时博弈达到混和策略纳什均衡。再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡，对每个小孩来说，自己采取出“剪”、“布”还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大，那么这个对弈者在游戏中输的可能性就增大。因此，每个小孩的最优混合策略是采取每个策略的可能性是l／3。在这样的博弈中，每个小孩各取三个策略的1／3是纳什均衡。由此可见：纯策略是参与者一次性选取的，并且坚持他选取的策略；而混合策略是参与者在各种备选策略中采取随机方式选取的。在博弈中，参与者可以改变他的策略，而使得他的策略选取满足一定的概率。当博弈是零和博弈时，即一方所得是另外一方的所失时，此时只有混合策略均衡。对于任何一方来说，此时不可能有纯策略的占优策略。 4．位置博弈与商家策略

有这么一个大家都很熟悉的现象，那就是在每个大大小小的城市街道上，经常见到一些地段上的商店十分拥挤，构成一个繁荣的商业中心区，但另一些地段却十分冷僻，没什么商店。更有意思的是，往往在一个同类型的商家总是聚集在比较近的地方，比如在任何城市肯德基、麦当劳之间总是津津相邻。再如超市现象，前两年有很多人对超市的布局发表了一些议论。因为有人注意到，如果在一条街上有2～3家超市的话，这几家超市经常性地会“相依为邻”，选址离得很近，倘若它们稍微分散地布置于街上，无疑对市民的购物提供相当的便利，因此他们认为超市“拥挤”在一起属于资源浪费。

类似的事情发生于电视台的节目播放。很多电视迷会发现，大部分电视台总是将最精彩的节目放在相同的时间段，甚至有些时候是在相同时间段播放类似的节目，比如你播“快乐大本营”，我就播“超级总动员”；你播“玫瑰有约”，我就播“单身男女”。人都说文人相轻，电视台也是这么相煎太急。

博弈论能够对这个现象作出科学的解释。首先看一个简单的博弈模型进行叙述：

假设有条完全笔直的公路，连接城市A到城市B之间的交通。这条公路上每天行驶着大量的车辆，并且车流量在公路上是均匀分布的。假设有两家快餐店，我们不妨假设为靠高速公路起家的麦当劳与肯德基，它们要在这条公路上选择一个位置开设快餐，招揽来往车辆。为了能够更加清晰的说明这个博弈，我们不得不画一张图。

再对该模型作一个合乎逻辑的假定：通常情况下，车辆总是乐意到距自己最近的快餐店购买食物。根据这个原则，从资源的最佳配置来看，麦当劳、肯德基应该分别开在1/4、3/4处是最优。在这种均匀散布的情况下，每家快餐店所有拥有的客户从距离最近的城市到两家快餐店的中心为止，因此都拥有1/2的顾客量，同时对于开车的人们总体来说，这种策略的选择，车辆到快餐店的总的距离最短。然而，，天总不能遂人之愿。肯德基与麦当劳都是百年老店，自然是精明之至，从经济学上就是具有经济理性。他们只要手段合法，总是希望自己的生意尽可能地红火，至于其他人的生意的好坏则与己无关。出于这种理性，肯德基分店经理肯定会想到：如果我将店铺从3/4点处向左移一点，那麽1/4点之间的中点不在是1/2点处，而是位于1/2点的靠左边一点。这等于说，这一移位，肯德基将从麦当劳抢夺走部分顾客，这对于肯德基单方面来说无疑是一个好主意。当然麦当劳也不甘示弱，作为一个“理性人”，麦当劳自然也应该想到将自己的店铺从1/4点处向右移动以争取更多的顾客。不难想象，双方博弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态，甲乙两人相依为邻且相安无事地做起快餐生意。如果我们放宽条件，不是两家快餐店，而是很多家快餐店，很容易分析得到结果：这些快餐店仍然会在1/2处设店达到纳什均衡。

同样的道理，如果地段的繁华等其他原因在一条路上上都可以认为到处相同的话，没有一个商家会将自己安置于某条路的一头，只要条件许可，超市将几乎趋向于相依为邻，这种现象完全可以看作公正的市场竞争的合理结果。这就是很多城市商业中心形成的原理，在博弈论中称为位置博弈。

电视台之间在时间段上的重叠问题在本质上就是位置博弈。事实上，我们只要将时间设想为上述案例中的公路，就不难分析到它们都将得到大部分观众青睐的精彩节目放在同一黄金时段完全是市场竞争的结果。在这种情况下，电视台之间的竞争会更加激烈，为了获得收视率，电视台只能在制作质量上下功夫，获得真正实惠的依然是广大观众。 5．猎鹿模型的合作哲学

来看这样一个“狩猎”故事：设想在原始社会，人们靠狩猎为生。某一天有两个猎人围住了一头鹿，他们各卡住鹿可能逃跑的两个路口中的一个。只要他们齐心协力，鹿就会成为他们的猎物，不过仅凭一个人的力量是无法猎捕到鹿的。如果此时周围跑过一群兔子，两位猎人中的任何一个只要去抓兔子一定会获得成功，他会抓住4只兔子。从能够填饱肚子的角度来看，4只兔子可以供一个人吃4天，1只鹿如果被抓住将被两个猎人平分，可供每人吃10天。这里不妨假设两个猎人叫A和B。我们

引入一种矩阵式的对两人博弈的描述方法，见下图。

4 4

0 4 4 0

10 10

在这个矩阵图中，每一个格子都代表一种博弈的结果。具体说来，在左上角的格子表示，猎人A和B都抓兔子，结果是猎人A和B都能吃饱4天；在左下角的格子表示，猎人A抓兔子，猎人B打鹿，结果是猎人A可以吃饱4天，B则一无所获；在右上角，猎人A打鹿，猎人B抓兔子，结果是猎人A一无所获，猎人B可以吃饱4天；在右下角，猎人A和B合作抓捕鹿，结果是两人平分猎物，都可以吃饱10天。

在这个博弈中，根据纳什均衡的定义，应用博弈论中的“严格劣势删除法”（有兴趣的读者可以找本书参考文献中的相关书籍阅读，这里不做详细介绍。）可以得到该博弈有两个纳什均衡点，那就是：要么分别打兔子，每人吃饱4天；要么合作，每人吃饱10天。

两个纳什均衡，就是两个可能的结局。两种结局到底哪一个最终发生，这无法用纳什均衡本身来确定。比较[10，10]和[4，4]两个纳什均衡，明显的事实是，两人一起去猎鹿比各自去抓兔子可以让每个人多吃12天。按照经济学的说法，合作猎鹿的纳什均衡，分头抓打兔子的纳什均衡，具有帕累托优势。与[4，4]相比，[10，10]不仅有整体福利改进，而且每个人都得到福利改进。换一种更加严密的说法就是，[10，10]与[4，4]相比，其中一方收益增大，而其它各方的境况都不受损害。这就是[10，10]对于[4，4]具有帕累托优势的含义。

在经济学中，帕累托效率准则是：经济的效率体现于配置社会资源以改善人们的境况，主要看资源是否已经被充分利用。如果资源已经被充分利用，要想再改善我就必须损害你或别的什么人，要想再改善你就必须损害另外某个人，一句话，要想再改善任何人都必须损害别的人了，这时候就说一个经济已经实现了帕累托效率。相反，如果还可以在不损害别人的情况下改善任何人，就认为经济资源尚未充分利用，就不能说已经达到帕累托效率。

目前在世界上比比皆是的企业强强联合就很接近于猎鹿模型的帕累托改善，跨国汽车公司的联合、日本两大银行的联合等等均属此列，这种强强联合造成的结果是资金雄厚、生产技术先进、在世界上占有的竞争地位更优越，发挥的影响更显赫。总之，他们将蛋糕做得更大，双方的效益也就越高。比如宝山钢铁公司与上海钢铁集团强强联合也好，最重要的就是将蛋糕做大。在宝钢与上钢的强强联合中，宝钢有着资金、效益、管理水平、规模等各方面的优势，上钢也有着生产技术与经验的优势。两个公司实施强强联合，充分发挥各方的优势，发掘更多更大的潜力，形成一个更大更有力的拳头，将蛋糕做得比原先两个蛋糕之和还要大。

猎鹿模型的讨论，我们的思路实际只停留在考虑整体效率最高这个角度，而没有考虑蛋糕做大之后的分配。猎鹿模型是假设猎人双方平均分配猎物。

我们不妨做这样一种假设，猎人A比猎人B狩猎的能力水平要略高一筹，但B猎人却是酋长的之子，拥有较高的分配权。可以设想，A猎人与B猎人合作猎鹿之后的分配不是两人平分成果，而是A猎人仅分到了够吃2天的鹿肉，B猎人却分到了够吃18天的鹿肉。在这种情况下，整体效率虽然提高，但却不是帕累托改善，因为整体的改善反而伤害到猎人A的利益。我们假想，具有特权的猎人B会通过各种手段方法让猎人A乖乖就范。但是猎人A的狩猎热情遭到伤害，这必然会导致整体效率的下降。进一步推测，如果不是两个人进行狩猎，而是多人狩猎博弈，根据分配可以分成既得利益集团与弱势群体，这和我国的现状非常相似。

我国改革进程根据著名经济学家左大培先生的研究，在九十年代中期以前是一种帕累托改善的过程。但是随着国企改制失误、教育体制改革失误、医疗改革失误、腐败等因素的影响，逐渐是极少数既得利益集团获得最大的利益（中国千万富翁超过24万人），基尼指数接近0.6，社会极度不平等，贫富差距极度拉大，帕累托改善已不存在。很显然，这种情况如果继续下去，社会稳定和改革深化会受到决定性的冲击。

第三章 “囚徒困境”的启示

1．“囚徒困境”的深刻哲理

在前面的章节，笔者讨论一个“囚徒困境”(Prisoner’s dilemma)变形博弈，很明显，该警察局长所采取的策略必然不能够使得两名囚犯坦白罪行。其实，只有改变游戏规则，利用“囚徒困境”模型策略才可以达到目的。“坦白从宽，抗拒从严”的道理人人都懂，从博弈论的角度来看，其实就是一个囚徒困境模型的应用。我们前面所讨论的爱情博弈其实也是囚徒困境的一种形式。

这里我们继续前面的讨论，这个警察局局长C如果足够明智的话，必然不要求两名囚犯都招供，而是让两名囚犯中的任何一名坦白，招出另外一个人。这样警察局局长C就要确定，对不坦白的人施以最严厉的刑罚。

这种情况下，警察局局长C对囚犯A和B作成如下许诺：如果他们之中有一人坦白，而另一人不坦白，则坦白者无罪释放，而不坦白者要被判无期徒刑，囚禁终生；如果两人都坦白，则两人都被判有期徒刑5年；如果两人都不坦白，则两人都被判2年监禁。

囚徒困境仍然需要2个前提预设：囚徒A和B两人都是自利理性的个人，即只要给出两种可选的策略，每一方将总是选择其中对他更有利的那种策略；两人无法沟通，要在不知道对方所选结果的情况下，独自进行策略选择。在这种条件下，从囚犯A的立场来看，共有2种可能情况：第一种可能是B采取坦白的策略，这时如果囚犯A也坦白，则要入狱5年，如果不坦白，则要囚禁终生，两相比较，结论是应该坦白。第二种可能是囚犯B采取沉默的态度，这时若甲也沉默，要入狱2年，如果囚犯A坦白，则可获得自由，两相比较结论是应该坦白。因此，无论囚犯B是坦白还是沉默，囚犯A采取坦白的策略对自己更为有利。同样以上推理对于囚犯B也适用。结果两个囚徒都坦白了，都被判刑5年。囚徒困境的“困境”在于如果甲乙二人都保持沉默，则都只被判刑一年，显然比两人都坦白的结果要好。

两名囚犯都作出招供的选择，这对他们个人来说都是最佳的，即最符合他们个体理性的选择。照博弈论的说法，这是惟一的纳什均衡点。除了这个均衡点，A与B的任何一人单方面改变选择，他只会得到更加不经济的结果。而在其它的结果中，比如两人都不坦白的情况下，都有一人可以通过单方面改变选择，来减少自己的刑期。可是两人经过一番理性计算后，却选择了一个使自己陷入不利的结局。

其实“囚徒困境”不允许囚犯A和B进行沟通的假设，与实际生活中大部分情况的现实是有差异的。比如，在爱情博弈中，很多恋人会经常花前月下、彻夜厮守；在企业的价格战中，企业之间也会多有沟通，价格；即使是二十世纪下半世纪的美苏军备竞赛中，两个超级大国也会经常进行外交交谈，及时交换信息。

笔者不妨将条件放宽，允许囚犯A和B在审讯室李一起单独呆上10分钟，然后再决定是否坦白。很明显，双方交流的主旨就是建立攻守同盟，克服自利心理，甚至可能订立一个口头协议，要求双方都不去坦白。然后，双方再单独被提审。我们不妨设想，囚犯A的心理，他一定会认为，如果囚犯B遵守约定的话，则自己坦白就可获得自由；如果囚犯B告密的话，若不坦白就会被终生囚禁。事实上，囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。

恋人们在恋爱中的海誓山盟，最终还是分手；企业之间相互沟通信誓旦旦，价格战仍然会爆发；美苏两国经常会晤，甚至签订核不扩散条约，但军费一年高过一年。这些现象都反映了上面所说明的问题。

在本节所举的囚徒困境的游戏规则，能够让狡猾的罪犯招供，得到应有的惩罚，固然不是坏事。然而，我们不妨假设囚徒A和B都是完全清白的大大的具有理性的良民，这个博弈的纳什均衡并不会因为他们的清白而改变。如果在现实生活中，加上对身体的残害，完全会造成屈打成招的冤假错案。在中国历史上，这种事情并不是多么稀有的个案。在更深刻的意义上，囚徒困境模型动摇了传统社会学、经济学理论基础，这是经济学的重大革命。传统经济学的鼻祖亚当·斯密在其传世经典《国民财富的性质和原因的研究》中这样描述市场机制：“当个人在追求他自己的私利时，市场的看不见的手会导致最佳经济后果。” 这就是说，每个人的自利行为在“看不见的手”的指引下，追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。

传统经济学秉承了亚当·斯密的思想。传统经济学认为：人的经济行为的根本动机是自利，自私是个好东西，每个人都有权追求自己的利益，没有私社会就不会进步，现代社会的财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力，只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正，自然会增进社会福利。

但是囚徒困境的结果，恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参与者可以相信市场所提供的一切条件，但无法确信其他参与者是否能与自己一样遵守市场规则。佛家讲因果律，儒家讲究“财自道生，利缘义取”。从囚徒困境看来，如果一味地想算计别人，算来算去，最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑，那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过的了。 2．经济自由与效率

关于经济自由主义，笔者不得不在这里着重笔墨写这么额外的一小节。在目前中国的经济、管理领域，经济自由主义者的观点已是喧嚣尘上、风靡一时，如江河之泛滥，一发不可收拾。他们恨不能将中国所有的大型国有企业全部分解成原始资本主义的小商小贩，妄图在一夜之间造就出梦幻般的完全自由竞争的市场经济体系。按照经济学家左大培的观点，中国经济自

由主义者的思想是 “有中国特色的经济自由主义”。

在资本主义早期，成千上万的小私有者投资工商业作为谋生手段，亚当·斯密正是在这种背景下才假设经济个体行为不会影响其他个体行为，并推断出个体利益最大化也就是社会利益的最大化。后来资本的高度集中使其日益脱离生产，变为纯粹攫取利润的工具，理论模型开始注意经济生活中各利益主体之间的相互影响和相互作用。一种研究经济个体如何在复杂的竞争关系中使自身利益最大化的理论“经济博弈论”应运而生。正如上一节所述，“囚徒困境”本身就已经推翻了自由经济主义存在的理论基础。囚徒困境揭示了：个体理性的选择与群体理性选择之间的矛盾，从个体利益出发的行为往往不能实现团体的最大利益；同时也揭示了市场理性本身的内在矛盾，从个体理性出发的行为最终也不一定能真正实现个体的最大利益，甚至会得到相当差的结果。从“囚徒困境”与“囚徒困境”变形模型中，我们可以证明：人们的相互交往过程中，每个行为主体的利己主义决策结果，可能是有效率的，也可能是无效率的，但多次重复这种决策肯定是低效率的。它实际上证明了亚当·斯密200年前提出的每个人自私自利就可以实现社会最大福利的假设的不可实现性。在现代市场经济中，人们在多次交往或者重复博弈后发现，遵循平等合作规则要比通过欺诈获得少数几次不义之财更有利。如果一直按照工业社会的传统规则博弈下去，人类将面临“一切人坑害一切人”的社会。笔者这里再举一个实例证实，自由竞争并不是最优效的经济体系，而政府管制也不是最无效的手段。

1971年，美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是，财大气粗的各大烟草公司反应相当平静，并没有动用其庞大的社会资源和影响力阻止这个法律的通过。政府管制最终的结果是，尽管烟草广告因受到限制而减少，可是烟草公司的利润却提高了。实际上，政府禁令不仅没有打击烟草公司，反而是把陷入白热化广告战的各大烟草集团从“囚徒困境”中解放了出来。

在20世纪60年代，美国烟草行业竞争激烈，为了争夺市场，各大烟草公司都必须耗费巨额费用大做广告，这无疑降低了它们的利润水平。也就是说，如果烟草公司都不做广告，它们的利润要更高。可是，如果其中一家公司不做广告，它的市场份额就会被其他公司抢走。这正是一个囚徒困境：某公司放弃做，而其它公司仍然大作广告抢占市场，放弃做广告的公司必然利益受损。在这种情况下，做广告就是每一个广告公司的优势策略。即使烟草公司能够达成都不做广告的协议，但是这个协议的约束力太低，这在上一节已经解释过，这并不能将烟草行业从广告战的泥潭中解救出来。

这个时候国家出台法令对于烟草行业来说反而是个好事，烟草公司靠自己做不到的事情，政府做到了。因为国家法律具有强制性的作用，相当于是烟草集团之间签订了极具约束力的协议，同时政府承担了监督烟草公司是否违反协议的成本。

除了自由竞争之外，中国的经济自由主义者还强调，经济只应关注效率，不要强求公平，更加谬误的是他们又把效率只片面地看成是个人或家庭的发财致富。我们可以发现，这种思想在社会上引起了很恶劣糟糕的一种思想潮流。在书店里充斥着如何发财致富的书籍，而所谓的一些成功人士则是人们顶礼膜拜的新偶像。

他们甚至还认为，经济体系可以不要任何秩序的竞争，一切都应放任自流，反对靠政府的干预来建立秩序。所谓秩序，就是游戏规则，就是一个博弈对局的规则。比如很多知名的所谓经济学家竟然公开颂扬“全民炒股”、全国性的房地产投机之类的对经济具有极强破坏力的现象。更有甚者是，某经济学居然从理论上推出这样的结论：“腐败适度存在，能使改革进一步推进”。还有经济学家公开宣称“腐败和贿赂成为改革过程得以顺利进行的润滑剂”。关于这个问题，笔者会在后面的章节用博弈论的方法与观点来说明其荒谬性与无耻性。 3．“囚徒困境”的破解：无限次重复博弈与有限次重复博弈 “不识庐山真面目,只缘身在此山中。”我们继续囚徒困境的讨论，从上几节的解释中，我们可以看出，严格囚徒困境的前提条件是博弈各方不可以进行合作，也就是不能够制订有约束力的协议。但在实际上，合作是文明的基础，比如兴修水利、组织国防、创建企业等都是合作而产生的，无怪乎哲学家卢梭写了本书《社会契约论》，认为契约是整个人类社会存在的前提条件之一。

前面已经分析过，如果囚徒困境只是一次性的博弈，那么签订协议是毫无意义的，其纳什均衡点并不会改变。可以签订协议的一个最基本的条件，就是博弈需要重复若干次，当然至少大于一次。就恋爱博弈来看，男女双方在交往的过程，随时都在博弈，因为相爱的过程中任何一个时点都是有可能分手的。用博弈论的术语来说，这是一种囚徒困境的重复博弈。无数爱情故事中的悲欢离合、精彩跌宕正是这个博弈模型的表现。当然那种素不相识一对男女，偶尔在酒吧中相遇，于是宾馆订房、春梦一场，拂晓之后就各自分道扬镳的一夜情是理所当然的一次性囚徒困境博弈。

我们在这里要注意的是，重复博弈与我们前面所提及一般性的动态博弈是不同的。多轮动态博弈中，参与者能够了解到博弈中的每一步其它参与者的在自己选择某种策略下的行动，而重复博弈的参与者无法了解到在任何一个步中，其它参与者的策略选择。

囚徒困境一旦从一次性博弈转变为重复博弈，情况会发生非常大的变化，博弈的结局也就是纳什均衡点可能会完全不同。举个最简单的例子，大家都知道国外的黑手党组织严密，对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员，一定会被组织谋杀。我们假设前面的囚徒困境故事不是发生在中国，而是意大利，囚犯A和B都是黑手党成员。他们很可能宁愿被判处终生囚禁，也不愿意出狱之后被同伙干掉。

实际上，在重复型的囚徒困境中，并不是签订合作协议很困难，困难的是这个协议对博弈各方是否具有很强的约束力。一个合作契约建立的困难在于任何协议签订之后，博弈参与者都有作弊的动机，因为至少在作弊的这一局博弈中，作弊者可以得到更大的收益。还是用爱情来打比方，常言道：“婚姻是走向爱情的坟墓”，但从博弈论的角度来看，婚姻恰恰是男女双方签订的一种协议，具有一定约束力的协议，因为一旦对方背叛婚姻，就会受到家庭的压力与社会舆论的谴责。

在博弈理论中，博弈专家已经用数学证明出，在无限次重复博弈的情况下，合作可能是稳固的。如果博弈无穷次，双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会招致对方在下一次博弈时的报复；而双方都取合作态度会带来合作收益。但是在现实社会生活中又不完全这样，人总是要死的，因而人与人之间的博弈不是无限次的。当一个人知道他终将退出博弈时，他就可能不再害怕此后别人对他的报复，从而可以在博弈结束前做损害他人的事情，这就回复到有限次重复博弈的境况。对于有限次囚徒困境博弈，美国密西根大学的罗伯特·爱克斯罗德教授（Robert Axelrod）曾经做过一个著名的博弈论试验。这个试验的思路非常简单：任何想参加这个计算机竞赛的人都扮演“囚徒困境”模型中一个囚犯。他们把自己的策略编入计算机程序，然后这些程序会被成双成对地融入不同的组合。分好组以后，参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。试验参与者连续玩上200次，于是这就更逼真地反映了日常人际关系。

试验的结果表明，囚徒困境在同样重复数十次或一百次的情况下，只要两个参与者仍然还是理性人（这可以在该试验的参加者所编程序中反映出），博弈的结果仍然是囚徒A和B相互把对方招供出来。为了解释这个问题，我们不妨讨论一个博弈两次的模型。

我们首先考虑第二次博弈的情况，由于这是最后一次博弈，自然没有后面的博弈对这次博弈的影响，因此也不就不必为将来打算，个人都只追求这次博弈的最大利益，于是第二次博弈的结果应该和一次囚徒困境博弈完全一样，自然是囚徒A和B都坦白，达到纳什均衡。现在再来考虑第一次博弈的情况，博弈参与者A已经很清楚最后一次博弈，B一定会招供，那么即使囚徒A不坦白，在下一次博弈时，B也一定会招供，这次博弈A不坦白对下一次博弈没有任何好的影响，那么作为理性人的A一定仍然选择坦白。对于B，也是一样的道理。由此可见，第一次博弈自然也和一次性囚徒困境博弈完全一样。

其实不论是两次博弈，还是3次，4次，甚至是上百次，只要是有限次数的重复囚徒困境博弈，其思路方法都是一样的。这种方法就是我们在前文中提到的倒推法（Backward induction），这在博弈论中，对于重复博弈与动态博弈是一种重要的分析方法，当然这对我们在日常生活中分析问题也不无裨益。比如，汽车企业之间的价格战往往不是一次性降价，而是一轮一轮地降价，这种类似的问题都可以用有限次囚徒困境模型来分析，事实情况和我们前面的分析完全相同，汽车企业之间每一次的价格博弈的纳什均衡只有一个，那就是全体降价。

笔者在这一节最后还要补充一个问题，就是多人重复囚徒困境的博弈。实际上，生活中的两人博弈毕竟是特例，绝大部分的情况还是多人博弈，比如上面提到的汽车价格战。在多人博弈中，只有其它所有参与者在第k－1次博弈中都是合作的，某个参与者才会在的k次博弈中采取合作策略。然而，这一策略会带来一个协调问题，任何人的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈，最终导致所有人的背叛。更糟糕的是，一旦出现这种情况，没有任何人会主动开始合作。因此，我们可以这么说，多人重复囚徒困境（无论有限或无限）中稳定的合作几乎是不可能的。

比如1992年英镑事件前后，可以明显感觉到有关游戏各方的思路与分析、行为模式。游戏中的德国、英国、意大利等的共同利益是建立统一的欧洲共同体；而它们在考虑统一货币的利益时，均在强调自己的利益；德国在其中的地位很特殊，它具有双重身份，既是欧洲汇率机制的基础，也是德国货币稳定的保证。这就形成了“囚徒困境”的博弈模型。索罗斯的量子基金发起攻击的主要原因在于：德国联邦银行总裁“暗示”不会放弃德国的利益。而英国、意大利等国家在本国利益受到损害时，也必然倾向于自保。而在这种分歧加剧的背景下，无疑会加重有关各方拒绝承认错误的立场，这又进一步加重了分歧，索罗斯正是利用这套机制获利的。

这个结论似乎是一个令人绝望的，绝望之处必有希望，欧元已经成功地在欧洲大陆通行，成为可以与美圆相抗衡的硬通货。这其中的道理，笔者在下一节将告诉读者，什么样的游戏规则可以保证博弈各方稳定合作。 4．威胁、承诺、作弊与惩罚西方哲学家卢梭说过，“究竟是什么不可思议的艺术，使人类找到一种法，通过强迫人们服从，从而使他们获得自由？” 其中最著名的一个答案是由托马斯·霍布斯给出的。霍布斯是现代英国君主立宪政体的理论奠基人，其代表作是政治学名著《利维坦》（Leviathan）。所谓“利维坦”，是《圣经》中的一种力大无穷的巨兽名字的音译，在书中意指一个强大的国家。霍布斯说：“人的自然本性是自私自利、恐惧、贪婪、残暴无情，人对人互相防范、敌对、争战不已，像狼和狼一样处于可怕的自然状态中。于是出于人的理性，人们相互间同意订立契约，放弃各人的自然权利，把它托付给某一个人或一个由多人组成的集体（如议会、董事会、法院等），这个人或集体能把大家的意志化为一个意志，能把大家的人格统一为一个人格；大家都服从他的意志，服从他的判断。这个人或这个集体就是主权者，而像这样通过社会契约而统一在一个人格之中的一群人就组成了国家。这就是伟大的利维坦的诞生，用更尊敬的方式来说，这就是活的上帝的诞生。”按照他的观点，没有集权的合作是不可能产生的。因此，一个有力的政府是必要的。霍布斯对合作协议的观点是：“不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。”这就是说，没有权威的

协议并不是导致民主，而是导致无政府状态。最后，霍布斯总结道，“在一切政体中，最坏的政体并不是专制而是无政府状态。” 霍布斯的观点虽然有些偏激，但却不无道理。根据博弈论的观点，无论是一次性或有限次重复博弈，“囚徒困境”产生这种结局的原因是两个囚犯都基于自身利益的角度考虑，这最终导致合作协议无法稳定遵守。

实际上，决定合作协议是否能够被囚徒双方执行的最关键的基本要素有两个，即承诺与威胁。所谓承诺，在囚徒困境中就是囚徒向对方相互许诺，在下一次博弈时会采取让对方有利的行为，也就是不坦白与对方合作；所谓威胁，就是某个囚徒告知对方如果下一次博弈时其采取招供策略而不合作，在下下一次博弈时就会采取不利于对方的策略即招供。

其实，在社会生活中，承诺与威胁是非常常见的现象。比如女生告诉她男朋友，如果他敢结交其他的女生，只要被发现一次，就立刻分手，这是威胁；而她男朋友向她发誓绝对自己是个专一的情圣，决不会背叛爱情，这就是承诺。再比如，在外交中，美国经常向中国承诺只承认一个中国的原则，我国政府向国际社会承诺中国强大也决不会采用霸权政策。大家常见的很多耳熟目详的俗语都是承诺与威胁，比如“人不犯我，我不犯人”、“坦白从宽，抗拒从严”、“以眼还眼，以牙还牙”等。

合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是在博弈者进行策略选择之前作出的，如果承诺与威胁对博弈者的约束力越小，那么合作的可能性就越小。假想一个可信度很小的承诺与威胁，比如参加考试的学生向监考老师承诺在没有老师监考的时候决不会作弊，不难想象考场中将会是什么样的一种景象，学生并不都是道德高尚、具有很强自制能力的人。即使在有老师监督考场，并威胁如果有学生敢于顶风作案，必然严惩不待，比如考卷直接判零分。设想一下，如果这种威胁仅仅是威胁，在学生作弊后并未真的采取什么严惩的行动，那么学生作弊的风险非常小，考场纪律依然与没有老师一样。由此可见，监考老师在一定程度上不得不要做一个霍布斯所说的“利维坦”式的专制者。

从实际的整个社会生活说来，对于有限次重复博弈合作问题的解决主要有2个典型方法，那就是国家法律与社会道德。至于其他解决方法在本质上并不会超脱于它们。 5．国家法律

100多年以前，粱启超曾说过：“我国成文法之起原不可确指，然以数千年之思想往往视法律与命令同为一物。”直至今日，很多人在骨子里面往往还是视法律和命令同为一物。从命令的角度来理解法律，是指个人意志或某个集团的意志以上下级纵向关系的方式传达，具有直接的强制力，在命令者与被命令者之间缺乏公正程序、严格的概念解释以及独立的第三者裁判等中间环节或者客观化机制作为媒介。这样的法律往往是朝令夕改，其约束力并不能保持长久。更严重的是，这种法律经常演变成是权力的合法外衣，为个人私欲谋取利益，而法律不再成为凌驾于社会生活博弈的超然之物，而是让博弈又多了一个权力者的不公平参与。真正的法律是在顾及社会各方利益博弈均衡的结果，在社会博弈中具有独立性，不参与博弈。同时，合理的法律必须又要有强制性，不管是对社会大众还是掌握权力的人，都拥有至高无上的权威，所有的人都必须遵守法律的约定，包括制定与执行法律的人，否则必然要受到无法逃脱的惩罚。

在这样一种法治环境中，法律必然可以改善囚徒困境。我们来看这样一个例子。如所前述，我们假定执法人员独立于博弈之外，有公司A与公司B是商业上的合作伙伴，公司A经常向公司B购买原材料，由于两家公司在不同的城市，于是两个公司经过谈判之后签定买卖合同，一般在一周之后的那一天，公司A打现金打入公司B的银行帐户，公司B则发货到公司A，若违约则处于2~5倍罚款。实际上，如果公司A与公司B都是理性人，那么他们的合作就是一个有限次数重复博弈，在社会不存在法律的情况下，在两个公司任何一次交易中都有可能有某一家公司不遵守合同，逃款或逃货，即使公司A现金充裕，而公司B货源充足。所谓的熟人欺诈也是这个道理。然而，在我们理想的法律环境下，公司A和B最佳策略都是合作。不妨假设公司A与公司B每年的交易都有十几次，平均每笔生意为100万，若违约则罚款200万。见下图，公司A与公司B合作时，双方收益均为20万（指公司A与公司B的利润）；公司A付款，而公司B不发货，A损失100万，B收益100万；公司A不付款，公司B发货，公司A收益120万（其中包含20万的利润），公司B损失80万（指公司B货物的成本，也就是收入减去利润）；公司A不付款，公司B不发货，双方收益为零。当然，这里还要说明的是这个博弈中没有考虑商业信誉的问题，商誉是社会道德中的问题，后面笔者会详细讨论。

20 20

120 -80

-100 100

0 0

很显然这是一个有限次重复博弈的囚徒困境，注意到前文所介绍的模型都是对称的，这个博弈则是非对称博弈，这更加贴切于日常生活的真相。在没有法律背景的条件下，双方选择不合作是自然的纳什均衡点。然而引入强制性的法律则不同，这时他们所签合同具有法律效应，一旦有一方违约，另一方有权罚款其200万元，并且法院可以强制实行。在这种情况下，两个“囚徒”，也就是公司自然都会采取合作策略，完成合同对各方所要求的行动。简单说来，就是法律改变了两个公司博弈的均衡结果。霍布斯认为，国家以法律形式规定对某种行为如“违约”采取惩罚措施，但是如果惩罚措施不力，即使扣除惩罚的成本，行动者从“违约”策略中获取的好处大于他采取“守信”策略所带来的好处，那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行动为原则。这就是法律制定的第一条原则：效率原则。效率原则是从对社会的整体考虑分析得出的，从这个意义上讲，法律越严格越好，越严格越有效率。强制性有效率的法律之重要性还可从冷战时期美苏两个超级大国40多年的军备竞赛中得出反证。尽管他们双方签定一些制止军备竞赛的协议，但是由于缺乏一个世界性的公平合理又具有强制性的法律环境，其结果仍然是陷入无法解脱的囚徒困境。类似的还有各国的贸易保护主义的永恒倾向也很能说明这个问题，除非某一天出现全世界的国家都得到统一，建立一个全球性政府才可以彻底解决这些国与国之间的囚徒困境问题。

法律制定的第二条原则是，法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则，这就是公平原则。用简单的一句话说，法律惩罚太重对犯法者不公平，惩罚太轻则对社会或他人不公平。

因此在不同的国家以及在同一个国家的不同时期，对这两个原则的是不同的。法律制定的这两条原则要根据不同时代，不同社会的具体状况而各有侧重。前面一小节提到目前一些国内的经济学家否认国家法律与立法执法的重要性，否认反腐败的重要性，导致目前经济混乱的观点是非常荒谬的。从法律制定的第一条原则来看，违反契约的惩罚越是严厉并可信，则博弈者违约的可能性越小，这是路人皆知的。从法律制定的第二条原则来看，权力对法律公平性的侵害有损法律的权威性与公正性，这也是众所周知的。笔者相信，这些学者的素养应该比绝大部分人要强很多，自然他们也应该能够理解甚至是精通这些基本常识。可见他们公开所宣称的观点只能说明其赤裸裸的掠夺社会财富、剥夺绝大部分人公平权利的无耻性。“乱世用重典”，通过博弈分析，笔者认为采用如同香港70年代严厉的反腐政策或新加坡一样的严刑峻法比较适宜目前的社会状况。 6．猴子的故事与道德约束

与当代某些无耻之尤的中国经济学家不同，亚当·斯密在写完《国富论》与市场这只“看不见的手”之后，转而又写了本《道德情操论》，专门论述个人道德与社会道德是维持市场经济的基本要素之一。亚当·斯密告诉我们：最商业化的社会，也是最讲究道德的社会，比如16世纪时荷兰人就比英国人值得信赖，当时荷兰的商业比英国发达，反之亦然。

人类道德的产生一般有两种解释：一种是纯文化因素起作用，有些国家道德程度高，有些国家则低。如北欧人之间的道德感高于意大利人的道德感。或者是宗教信仰的原因，怕上帝惩罚你，所以有宗教信仰的人道德感就要强于一般人。如在美国，教会的人道德感比较强，因为他们认为若不道德，将来会进地狱。这种解释中，道德是外界强加于人们的，使人们不违约。而笔者主要想给出的是第二种解释，即博弈论是如何解释道德的。

道德可以打破囚徒困境的难题，化解个人理性与社会群体理性的矛盾，维系整个社会经济体系的稳定与发展。关于这一点，我们来看一个猴群博弈的故事。这个故事这两年一直流传于中文网络各大论坛与社区。

有一群猴子被关在笼子里，在笼子里的上方有一条绳子，绳子拴着一个香蕉，绳子连着一个机关，机关又与一个水源相连。猴子们发现了香蕉，有猴子跳上去够这个香蕉，当猴子够到时，与香蕉相连的绳子带动了机关，于是一盆水倒了下来，尽管够到香蕉的猴子吃到了香蕉，但其他猴子被淋湿了，这个过程重复着，猴子们发现，尽管有猴子吃到香蕉，但吃到香蕉的猴子是少数，而其余的大多数猴子都被淋湿。经过一段时间，有一伙猴子自觉地行动起来，当有猴子去抓香蕉时，它们便揍那个猴子。每当有猴子去取香蕉，就有其他的猴子因愤怒而自动地去撕咬那个猴子，久而久之，猴子们产生了合作，再也没有猴子敢去取香蕉了。

在这个故事里，猴子间产生了“道德”。如果这群猴子构成一个社会，它们也繁衍下一代，它们会将它们的经历告诉下一代，渐渐地猴子们便认为取香蕉的后果对其他猴子不利，从而认为去取这个香蕉是“不道德的”，它们也会自动地惩罚“不道德的”猴子。当然这只是一个故事，但这个博弈故事却反映了人类的道德的产生过程。

霍布斯认为人类在没有任何约束的自然状态中，就是“人与人之间像狼与狼一样”，是“每个人对每个人的战争”。在这种状态中，每个人都力图保护自己的利益，并企图占有别人的东西，此时，每个人是每个人的敌人。此时没有任何规则，没有财产，没有正义或不正义，只有战争。武力与欺诈是战争中的两大基本德性。因此人类在自然状态下无法产生文明。

与国家一样，道德也是对某些不合作行动的惩罚机制。这种机制的出现使得人类从囚徒困境中走出来。人的正义与非正义的观念产生了道德感。

道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作，从而使得不道德的人遭受损失。这样，社会上不道德的行为就会受到抑制。因此只要社会形成了道德或不道德，或者正义或非正义的观念，就自动地产生了调节作用。

当然，道德约束有其自身的局限性。它对不道德的行为的抑制是有限度的，当不道德的行为带来的利益大于道德的满足时，

道德约束的作用便失效。举个很简单的例子，拾金不昧是理所当然的美德，当捡到别人丢的100块钱时还给失主不仅有道德满足感，还会受到社会的表扬，建立起自己的美誉；若不及时交换失主并很容易被发现的话，则会受到严厉的谴责并失去社会信誉。假想一下，当检别人遗失的价值上百万的古玩名画时，极大的可能是归为己有。这是因为他道德的满足感与可能所受谴责的效用远小于其所检物品给他带来的效用。这种情况下，道德作用失效了，法治就不可替换地代替了道德。 7．爱克斯罗德试验、针锋相对的策略

如果没有外部强制力，这时囚徒困境中两个参与者采取什么样的策略才可以更好的维持合作的稳定性呢？这是一个非常实际的问题，生活中经常见到国家与国家之间达成协议，这种协议我们在前面解释过，由于不存在一个世界性的政府，往往约束力很小。

对于这个问题，有这样一种答案。如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略，在博弈论里面称之为触发策略（Trigger strategy），或称冷酷策略。如果对方知道你的策略是触发策略，那么对方将不敢采取不合作策略，因为一旦他采取了不合作策略，双方便永远进入不合作的困境。因此，只要有人采取触发策略，那么双方均愿意采取合作策略。但是这个策略面临着这样一个问题：如果双方存在误解，或者由于一方发生选择性的错误，这个错误是无意的，那么结果将是双方均采取不合作的策略。也就是说，这种策略不给对方一个改正错误或解释错误的机会。

在前文提到的美国密西根大学罗伯特·爱克斯罗德教授那个著名的博弈论试验中给出了这个问题更好的答案。爱克斯罗德邀的这些人都是政治学家、数学家、经济学家、社会学家。获胜者是加拿大多伦多大学的拉波波特写出的针锋相对（tit-for-tat）策略。说穿了，所谓针锋相对策略，就是胡萝卜加大棒的原则。

爱克斯罗德在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的企图进行决策。在此前提下，合作要研究的问题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时候又是不合作的；第三、如何使别人与你合作。

这个游戏共分两轮。第一轮游戏有14个程序参加，再加上爱克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作)，运转了200次。结果得分最高的程序是加拿大学者罗伯布编写的针锋相对策略的游戏程序。这个程序的特点是，第一次对局采用合作的策略，以后每一步都跟随对方上一步的策略，你上一次合作，我这一次就合作，你上一次不合作，我这一次就不合作。爱克斯罗德还发现，得分排在前面的程序有三个特点：第一，从不首先背叛，即“善良的”；第二，对于对方的背叛行为一定要报复，不能总是合作，即“可激怒的”；第三，不能人家一次背叛，你就没完没了的报复，以后人家只要改为合作，你也要合作，即“宽容性”。

为了进一步验证上述结论，爱克斯罗德决定邀请更多的人再做一次游戏，并把第一次的结果公开发表。第二次征集到了62个程序，加上他自己的随机程序，又进行了一次竞赛。结果，第一名的仍是针锋相对策略。，爱克斯罗德总结这次游戏的结论是：第一，针锋相对方法仍是最优策略。第二，前面提到的三个特点仍然有效，因为63人中的前15名里，只有第8名的哈灵顿程序是“不善良的”，后15名中，只有1个总是合作的是“善良的”。可激怒性和宽容性也得到了证明。此外，好的策略还必须具有的一个特点是“清晰性”，能让对方在三、五步对局内辨识出来，太复杂的对策不见得好。针锋相对策略就有很好的清晰性，让对方很快发现规律，从而不得不采取合作的态度。

针锋相对策略的优越性向我们充分展示了一个纯粹自利的人何以会选择善，只因为合作是自我利益最大化的一种必要手段。比如在爱情中的博弈原则应该是：善意而不是恶意地对待恋人；宽容而不是尖刻地对待恋人，关键是能够彼此宽容，既宽容对方的缺点；强硬而不是软弱地对待恋人，就是要在我永远爱你的善意的前提下，做到有爱必报，有恨也必报，以眼还眼，以牙还牙，以其人之道，还治其人之身，比如对恋人与其他异性的亲热行为，要有极其强烈的敏感与斩钉截铁地回报；简单明了而不是山环水绕地对待恋人，在博弈中过分复杂的策略使得对手难于理解，无所适从，因而难以建立稳定的合作关系，明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。 8.合作、利他主义与爱克斯罗德试验的局限

我们再进一步看这个试验中选手策略的演化方向。假设对策者所组成的策略群体是一代一代进化下去的，进化的规则包括：一，试错。人们在对待周围环境时，起初不知道该怎么做，于是就试试这个，试试那个，哪个结果好就照哪个去做。第二，遗传。一个人如果合作性好，他的后代的合作基因就多。第三，学习。比赛过程就是对策者相互学习的过程，针锋相对策略好，有的人就愿意学。在爱克斯罗德的试验中，第一轮比赛中的63个对策者，谁在第一轮中的得分高，他在第二轮的群体中所占比例就越高。这样，群体的结构就会在进化过程中改变，由此可以看出群体是向什么方向进化的。

试验结果很有趣。针锋相对策略原来在群体中占1/63，经过1000代的进化，结构稳定下来时，它占了24%。另外，有一些程序在进化过程中消失了。其中有一个值得研究的程序，即原来前15名中唯一的那个不善良的“哈灵顿”程序，它的对策方案是，首先合作，当发现对方一直在合作，它就突然来个不合作，如果对方立刻报复它，它就恢复合作，如果对方仍然合作，它就继续背叛。这个程序一开始发展很快，但等到除了针锋相对之外的其它程序开始消失时，它就开始下降了。因此，以合作系数来测量，群体是越来越合作的。

进化试验揭示了一个哲理：一个策略的成功应该以对方的成功为基础。针锋相对在两个人对策时，得分不可能超过对方，

最多打个平手，但它的总分最高。它赖以生存的基础是很牢固的，因为它让对方得到了高分。哈灵顿程序就不是这样，它得到高分时，对方必然得到低分。它的成功是建立在别人失败的基础上的，而失败者总是要被淘汰的，当失败者被淘汰之后，这个好占别人便宜的成功者也要被淘汰。

那么，在一个极端自私者所组成的不合作者的群体中，针锋相对策略能否生存呢？爱克斯罗德发现，在得分矩阵和未来的折现系数一定的情况下，可以算出，只要群体的5%或更多成员是针锋相对策略的，这些合作者就能生存，而且，只要他们的得分超过群体的总平均分，这个合作的群体就会越来越大，最后蔓延到整个群体。反之，无论不合作者在一个合作者占多数的群体中有多大比例，不合作者都是不可能自下而上的。这就说明，社会向合作进化的趋势是不可逆转的，群体的合作性越来越大。在研究中发现，合作的必要条件是：第一、关系要持续，一次性的或有限次的博弈中，对策者是没有合作动机的；第二、对对方的行为要做出回报，一个永远合作的对策者是不会有人跟他合作的。

那么，提高团队合作性必须要做到以下8点：要建立持久的关系，即使是爱情也需要建立婚姻契约以维持双方的合作；要增强识别对方行动的能力，如果不清楚对方是合作还是不合作，就没法回报他了；要维持声誉，说要报复就一定要做到，人家才知道你是不好欺负的，才不敢不与你合作；能够分步完成的对局不要一次完成，以维持长久关系，比如，贸易、谈判都要分步进行，以促使对方采取合作态度；不要嫉妒人家的成功，针锋相对策略正是这样的典范；不要首先背叛，以免担上罪魁祸首的道德压力；不仅对背叛要回报，对合作也要作出回报；不要耍小聪明，占人家便宜。

爱克斯罗德在《合作的进化》一书结尾提出这么几个结论。第一、友谊不是合作的必要条件，即使是敌人，只要满足了关系持续，互相回报的条件，也有可能合作。比如，第一次世界大战期间，德英两军在战壕战中遇上了三个月的雨季，双方在这三个月中达成了默契，互相不攻击对方的粮车给养，到大反攻时再你死我活地打。这个例子说明，友谊不是合作的前提。第二、预见性也不是合作的前提，爱克斯罗德举出生物界低等动物、植物之间合作的例子来说明这一点。但是，当有预见性的人类了解了合作的规律之后，合作进化的过程就会加快。这时，预见性是有用的，学习也是有用的。

当游戏中考虑到随机干扰，即对策者由于误会而开始互相背叛的情形时，以修正的针锋相对策略，即以一定的概率不报复对方的背叛，和“悔过的针锋相对策略”，即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强，悔过的针锋相对策略效果越好，宽大的针锋相对策略效果越差。

爱克斯罗德所发现的针锋相对策略，从社会学的角度可以看作是一种利他主义，这种行为的动机是个人私利，但它的结果是双方获利，并通过互惠式利他有可能覆盖了范围最广的社会生活，人们通过送礼及回报，形成了一种社会生活的秩序，这种秩序即使在多年隔绝，语言不通的人群之间也是最易理解的东西。比如，哥伦布登上美洲大陆时，与印地安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为，比如无偿损赠，也通过某些间接方式，比如社会声誉的获得，得到了回报。但是，爱克斯罗德对博弈者的一些假设和结论使其研究不可避免地与现实脱节。首先，《合作的进化》一书暗含着一个重要的假定，即，个体之间的博弈是完全无差异的。现实的博弈中，对策者之间绝对的平等是不可能达到的。一方面，对策者在实际的实力上有差异，双方互相背叛时，可能不是各得1分，而是强者得5分，弱者得0分，这样，弱者的报复就毫无意义。另一方面，即使对局双方确实旗鼓相当，但某一方可能怀有赌徒心理，认定自己更强大，采取背叛的策略能占便宜。爱克斯罗德的得分矩阵忽视了这种情形，而这种赌徒心理恰恰在社会上大量引发了零和博弈。第四章 “智猪博弈”：对诸多现象的解释 1．“智猪博弈”的故事

博弈论里面有个十分卡通化的博弈模型，叫做“智猪博弈”（Pigs’payoffs）。整个故事是这样的：笼子里面有两只猪，一只大，一只小。笼子很长，一头有一个按钮，另一头是饲料的出口和食槽。按一下按钮，将有相当于10个单位的猪食流进食槽，但是按按钮以后跑到食槽所需要付出的“劳动”，加起来要消耗相当于2个单位的猪食。如果两只猪同时按按钮，再一起跑过去吃，大猪吃到7个单位，小猪吃到3个单位，减去劳动耗费各自2个单位，大猪净得益5个单位，小猪净得益1个单位。大猪按按钮，小猪等着先吃，大猪再赶过去吃，大猪吃到6个单位，去掉按按钮的劳动耗费2个单位净得4个单位，小猪也吃到4个单位。如果小猪按按钮，大猪等着先吃，大猪吃到9个单位，小猪吃到1个单位，再减去按按钮的劳动耗费，小猪是净亏损1个单位。如果大家都等待，结果是谁都吃不到。可以得出结论，唯一解是大猪按按钮，小猪等待。 1 5

4 4

-1 9

我们把这个博弈用矩阵的形式表达，见上图。根据这个矩阵，我们知道“等待”是小猪的优势策略，“按按钮”是小猪的劣势策略。先把小猪的劣势策略消去。现在来看大猪。由于小猪有“等待”这个优势策略，大猪只剩下了两个选择：等待一份不得；按按钮得到4份。所以“等待”就变成了大猪的劣势策略。把它也删去，就得到智猪博弈最后出现的的结局：大猪来回在猪槽的两端奔波，小猪则坐享其成。其结论似乎是，在一个双方公平、公正、合理和公享的竞争环境中，有时占优势的一方最终得到的结果却有悖于他的初始理性。这种情况在现实中比比皆是，譬如在北约内部，美国承担了防务开支很大比例的份额，大大便宜了西欧和日本。美国经济学家曼库尔·奥尔森将这一现象称为“小国对大国的剥削”。

智猪博弈告诉我们，谁先去按下按钮，就会造福全体，但多劳并不一定多得。在现实生活中，很多人都只想付出最小的代价，得到最大的回报，争着做那只坐享其成的小猪。 “一个和尚挑水喝，两个和尚抬水喝，三个和尚没水喝”说得正是这样一个道理。这三个和尚都想做小猪，却不想付出劳动，不愿承担起大猪的义务，最后导致每个人都无法获得利益。

智猪博弈这一模型可以扩展到生活中的各个方面，不论是在战争中还是商业竞争中，我们都会看到类似于智猪博弈这种情况的存在。在办公室的人际冲突中，有一些人会成为不劳而获的“小猪”，而又另一些人充当了费力不讨好的“大猪”。有这样一个真实的故事深刻反映了智猪博弈的哲理。某大学公开招聘两名教授，一个是教经济学的，一个是教会计学的。经过层层选拔，最终有两人获得机会，姑且称之为A教授和B教授。接下来就是一个让所有人想不通但现实得不能再现实的选择过程。会计学教授的工资是5000元/月，而经济学教授的工资是3500元/月。A、B两教授具有相同的学历背景--会计学硕士。同时又都有经济学的教学经验，A授的会计学教学经验优于B教授。依一般人的想法，知识就是金钱，知识越多，工资越高，A教授理所当然的会获得会计学教授职位。这就是我们这些聪明人的天真之处，殊不知现实并非如此。因为B教授知道市场行情，而且知道到了目前，不可能有新的竞争者加入。因此，在与教务主任谈判时，极力否认自己具有经济学的教学经验，甚至说如果让他去讲授经济学会误人子弟，与其这样，自己宁可不要这分工作。而A教授为了证明自己的能力，一开始就合盘托出，甚至大谈特谈自己的经济学教学经验。事情到此为止，我想每个人都看出了门道，学校不可能重新招聘，而两个教授也都不可能随便丢掉到手的美差。最终的结果就是B教授获得了会计学的教授职位，而A教授只好退而求其次，教授经济学。

事实上，这样的情况在企业里比比皆是。因为我们什么都缺，就是不缺人，所以每次不论多大的事情，加班的人总是越多越好。本来一个人就可以做完的事，总是会安排两个甚至更多的人做。“三个和尚”的现象这时就出现了。如果大家都耗在那里，谁也不动，结果是工作完不成，挨老板骂。这些常年在一起工作多年的战友们，对对方的行事规则都了如指掌。“大猪”知道“小猪”一直是过着不劳而获的生活，而“小猪”也知道“大猪”总是碍于面子或责任心使然，不会坐而待之。因此，其结果就是总会有一些“大猪们”过意不去，主动去完成任务。而“小猪们”则在一边逍遥自在，反正任务完成后，奖金一样拿。智猪博弈用句通俗的话来形容就是“枪打出头鸟”。一个很常见的现象就是在企业中，不论国企还是民企或是外企，在企业内部总会存在各种各样的小团体，套用组织行为学的专业术语来说就是存在各种非正式组织。而每一个团体都代表了一部分人的利益，因此不可避免的会产生冲突。这时，每个团体都会推选出各自的代言人。这些代言人是为集体利益（如争取加薪或增加福利等）做出积极行动的领头人。但我们这时会发现，被推选为代言人的总是那些胸无城府，但又总是给人以积极形象的人。而群体活动的最大受益者“小猪”则永远躲在幕后。活动成功了，他们可以不伤皮毛的优先分到一杯羹；如果失败了，他们也可以发表一通与我无关，我是受害者之类的演讲，让“大猪”成为永远的牺牲者。 2“智猪博弈”与激励机制设计

“智猪博弈”给了竞争中的弱者以等待为最佳策略的启发同时，也反映了一种“搭便车”现象。 “搭便车”的现象在现实中大量存在，在企业的运营过程中也不乏其例。很多企业的一般员工甚至中层管理者工资、福利也不算低，但依然缺乏工作能动性，不能创造优异的绩效，很多事情还要亲力而为。对于社会而言，因为小猪未能参与竞争，创造价值，小猪“搭便车”时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府、公司都是如此。智猪博弈告诉我们一个企业制度和流程的重要性，以及不好的规则对公司带来的影响。这就要求规则的设计者应清楚、慎重地考虑规则制定的前瞻性、适应性和高效性。

能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适。“智猪博弈”的核心指标一般来说有两个：食物数量、按钮与食槽之间的距离。

那么，如果改变这两个关键条件，“搭便车”的现象会不会杜绝呢？

首先来看看减量方案。食物只有原来的一半分量，也就是5个单位的食物。这种情况下，小猪大猪都不去按按钮。小猪去按按钮，大猪将会把食物吃完；大猪去按按钮，小猪将也会把食物吃完。谁去按按钮，就意味着为对方嫁衣裳，所以谁也不会有按按钮的动力。如果目的是想让两只猪去按按钮，这个制度的设计显然是非常失败的。

其次再来看看增量方案。食物是原来的两倍分量，也就是20个单位的食物。结果是小猪、大猪都会去抢着去按按钮。谁想吃，谁就会去按按钮。因为对方不可能一次把食物吃完，小猪和大猪相当于生活在应有尽有的天堂，当然它们的竞争意识也不会得到提高。对于制度设计者来说，这个制度的成本提高了一倍，因为可以不费心地就可以得到所需要的食物，自然两只猪都

不会有多少动机去增加按按钮的数量。这个制度的设计明显激励作用不足。

最后再来看看移位方案。考虑到问题的关键是移位，接下来我们探讨一下因移位而产生的几种改变方案。

其一，移位并减少食物投放量。食物只有原来的一半分量，但同时将食槽与按钮之间的距离缩短。这种情况下，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。

其二，移位并增加食物投放量。正常情况移位用不着增量，大猪小猪都会去踩踏板。如果适当增量，成员会快速成长，小猪会长大，大猪会出栏，效益就会增长。不过需要把握成本增加的度，适当的增量更符合组织与个人的需求。

其三，移位但不改变食物投放量。由于食槽与按钮之间的距离缩短，去按按钮的劳动量减少，大猪小猪都会争着去按按钮。如果把按按钮的次数增加，吃到的食物会更多，对食物的不懈追求，将驱动合作机制的形成和生产效率的提高。对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。

智猪博弈制度规则的改变对于企业的经营管理者而言，就是采取不同的激励方案，对员工积极性调动的影响也是不同的，并不是足够多的激励就能充分调动员工的积极性。比如企业实行职工全员持股的方案，结果如第二个方案一样，人人有股不但没有起到相应的激励作用。

同样的，企业在构建战略性激励体系过程中，也需要从目标出发，设计相应的合理方案。一是，根据不同激励方式的特点，结合企业自身发展的要求，准确定位激励方案的目标和应起到的作用。二是，根据激励方案的目标和应起到的作用，选择相关激励方式，并明确激励的对象范围和激励力度。

扩而大之，从整个社会来讲，自身需求大的群体，比如现在媒体经常提及的弱势群体，他们往往才是社会生产力推动的主力。换句话说，要迅速提高整个社会的生产力水平，就需要有一个自身具有很大消费需求的群体，并且需要给他们一定程度的奖励。第三种改变方案反映的就是这种情况，方案中降低了取食的成本，在现实中，也可以等同于增加了对取食者的奖励。 3．企业战略与“智猪博弈”

价格竞争作为市场经济实行优胜劣汰、优化资源配置的一种手段，起着独特的作用。但在一些行业除了有大中型的公司以外还同时存在着一些管理规范、运作良好的小公司。那么在两个企业实力存在差距的情况下而对价格竞争时，小企业的生存反展与其所选择的策略有着密不可分的关系。我们都知道，“智猪博弈”的结果依赖于大猪的行为。如果小猪去按动按钮。大猪当然乐于等待在食槽旁吃掉9个单位的猪食。如果小猪等待，那么大猪将先去按动按钮再跑回来以获得相当于4个单位的猪食，这总比肚子等待要好。对小猪来说，情况非常清楚，无论大猪如何行动，它最好是等在食槽旁边。因此这个博弈的均衡结果就是：每次都是大猪去按动按钮，小猪先吃，大猪再赶来吃，只有这样大猪小猪才可以共同生存。

在实力悬殊公司之间的价格竞争策略也是这个道理。在商业竞争中，如果公司是弱小的一方，则可以选择如下策略：

首先是等待，静观其变。允许市场上占主导地位的品牌开拓本行业所有产品的市场需求。将自己的品牌定位在较低价格上，以享受主导品牌的强大广告所带来的市场机会。

其次是不要贪婪，妄图将“大猪”应得的那份也据为己有。只要主导品牌认为弱小公司不会对自己形成威胁，它就会不断创造市场需求。因此公司可以将自己定位在一个引起不了主导品牌兴趣的较小的细分市场，以限制自己对主导品牌的威胁。如果公司是“智猪博弈”中的大猪，在行业市场中占主导地位，则可采取以下策略：

首先要接受小公司。作为主导品牌，加强广告宣传，创造和开拓对行业所有产品的市场需求才是真正的利益所在。不要采取降价这种浪费资源的做法与小企业竞争，除非它对公司形成了真正的威胁。正是小企业采取的低价格阻止了潜在进入者的涌入。对威胁的限制要清楚：如果小企业发展壮大到了构成威胁的程度，大公司就应该迅速做出进攻性的反应，并且让小企业清楚地知道它们在什么样的规模水平之下才是可以被容忍的，否则就会招致大公司强有力的回击。如果小公司知道对它们的限制，也就不会再有兴趣超越这种限制。当然“大猪”“小猪”的共同生存是有条件的。“智猪博弈”说明了在某个市场上一个占主导地位、控制着市场的公司和它的一个较小的竞争对手之间可能发生的竞争情况。这取决于占主导地位的公司如何看待这个较小的竞争对手对它的威胁程度。“智猪博弈”中“共同生存”的均衡结果只有在大猪的食物份额没有受到小猪严重威胁时才会出现。

70年代末80年代初，美国市场上私人标签（Private label，非品牌产品）的软饮料质量虽低劣，但价格很便宜，因此仍然能够占有较低的市场份额。可口可乐公司和百事可乐公司最初能够容忍这些私人标签软饮料的存在，因为它们的威胁有有限的。可没过多久，一家主要的私人标签软饮料供应商Cott公司通过挑衅性的定价和较高的质量，从一只仅有较低市场份额的地区品牌的“小猪”，成为一个拥有1/3市场份额的、与两大可乐公司旗鼓相当的竞争者。此时，可口可乐公司和百事可乐公司通过降低价格这种进攻性的战略行动，抢占了私人标签软饮料的市场份额，这些公司包括Scott公司在瞬间土崩瓦解。

总而言之，通过运用“智猪博弈”模型对两个规模与实力存在较大差距的竞争对手之间价格战的情况进行分析可以看到，竞争双方应对自己在竞争博弈中的地位和作用有一个清醒的认识，这一点非常重要。认清自己真正的利益所在，避免残酷的价格战的发生，两个地位相去甚远的对于最终能够达成一种和平的生存模式：共同生存。 4．证券市场中的“智猪博弈”

金融证券市场是一个群体博弈的场所，其真实情况非常复杂。在证券交易中,其结果不仅依赖于单个参与者自身的策略和市场条件，也依赖其他人的选择及策略。

在“智猪博弈”的情景中，大猪是占据比较优势的，但是，由于小猪别无选择，使得大猪为了自己能吃到食物，不得不辛勤忙碌，反而让小猪搭了便车，而且比大猪还得意。这个博弈中的关键要素是猪圈的设计，即按按钮的成本。

证券投资中也是有这种情形的。例如，当庄家在底位买入大量股票后，已经付出了相当多的资金和时间成本，如果不等价格上升就撤退，就只有接受亏损。所以，基于和大猪一样的贪吃本能，只要大势不是太糟糕，庄家一般都会抬高股价，以求实现手中股票的增值。这时的中小散户，就可以对该股追加资金，当一只聪明的“小猪”，而让“大猪”庄家力抬股价。当然，这种股票的发觉并不容易，所以当“小猪”需要忙碌的就是发现有这种情况存在的猪圈，并冲进去当聪明的小猪。

从散户与庄家的策略选择上看，这种博弈结果是有参考意义的。例如，对股票的操作是需要成本的，事先、事中和事后的信息处理都需要金钱与时间成本的投入，如行业分析、企业调研、财务分析等，一旦已经付出，机构投资者是不太甘心就此放弃的。而中小散户，不太可能事先支付这些高额成本，更没有资金控盘操作，因此只能采取小猪的等待策略。等到庄家动手为自己觅食而主动出击时，散户就可以坐享其成了。

股市中，散户投资者与小猪的命运有相似之处，没有能力承担炒作成本，所以就应该充分利用资金灵活、成本低和不怕被套的优势，发现并选择那些机构投资者已经或可能坐庄的股票，等着大猪们为自己服务。由此看到，散户和机构的博弈中，散户并不是总没有优势的，关键是找到有大猪的那个食槽，并等到对自己有利的游戏规则形成时再进入。

遗憾的是，在股市中，很多作为“小猪”的散户不知道要采取等待策略。让“大猪”们去表现，在“大猪”们拉动股票价格后从中获取利润，才是“小猪”们的最佳选择。作为“小猪”，还要学会特立独行。行动前，不用也不需要从其他“小猪”那里得到肯定；行动时，认同且跟随你的“小猪”越多，则你出错的可能也就越大。简单地说，就是不要从众，而是跟随“大猪”。当然股市中的金融机构要比模型中的大猪聪明的多，并且不守游戏规则，他们不会甘心为小猪们按按钮。事实上，他们往往会选择破坏这个博弈的规矩，甚至重新建立新规则，比如把按钮放在食槽旁边，或者可以遥控，这样小猪们就失去了搭便车的机会。例如，金融机构和上市公司串通，散布虚假的利空消息，这就类似于按按钮前骗小猪离开食槽，好让自己饱餐一顿。当然金融市场中的很多“大猪”也并不聪明，他们的表现欲过强，太喜欢主动地创造市场反应，而不只是对市场做出反应。短期来看，他们可以很容易地左右市场，操纵价格，做胆大妄为的造市者。这些“大猪”们并不知道自己要小心谨慎、如履薄冰，他们不知道自己的力量不如想象的那样强大到可以无敌于天下。自然而然地，每一年都会有一些高估自己的“大猪”倒下，幸存的“大猪”在经过优胜劣汰之后会变得更加强壮。不过，无论是多么强壮的“大猪”，只要过于自信、高估自己控制市场的能力，总会倒下。

俗话说“家家有本难念的经”,在股市中，“大猪”有“大猪”的难处，“小猪”有“小猪”的难处。尽管“大猪”“小猪”只要了解自身处境，采取相应的策略就会成功，然而理性是有限的，确定的成功总是很难获得。第五章常见的博弈案例 1．“斗鸡博弈”与“骑虎难下”

试想有两只公鸡遇到一起，每只公鸡有两个行动选择：一是退下来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，这只公鸡则很丢面子；如果对方也退下来双方则打个平手；如果自己没退下来，而对方退下来，自己则胜利，对方则失败；如果两只公鸡都前进，那么则两败俱伤。因此，对每只公鸡来说，最好的结果是，对方退下来，而自己不退，但是此时面临着两败俱伤的结果。

不妨假设两只公鸡如果均选择“前进”，结果是两败俱伤，两者的收益是-2个单位，也就是损失为2个单位；如果一方“前进”，另外一方“后退”，前进的公鸡获得1个单位的收益，赢得了面子，而后退的公鸡获得-l的收益或损失1个单位，输掉了面子，但没有两者均“前进”受到的损失大；两者均“后退”，两者均输掉了面子获得-1的收益或1个单位的损失。当然这些数字只是相对的值。

如果博弈有唯一的纳什均衡点，那么这个博弈是可预测的，即这个纳什均衡点就是一事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点，则无法预测出一个结果来。斗鸡博弈则有两个纳什均衡：一方进另一方退。因此，我们无法预测斗鸡博弈的结果，即不能知道谁进谁退，谁输谁赢。

由此看来，斗鸡博弈描述的是两个强者在对抗冲突的时候，如何能让自己占据优势，力争得到最大收益，确保损失最小。斗鸡博弈中的参与者都是处于势均力敌、剑拔弩张的紧张局势。这就像武侠小说中描写的一样，两个武林顶尖高手在华上之上比拼内力，斗得是难分难解，一旦一方稍有分心，内力衰竭，就要被对方一举击溃。

斗鸡博弈在日常生活中非常普遍。比如收债人与债务人之间的博弈类似于斗鸡博弈。还如，警察与游行者相遇，最好有一方退下来。假设债权人A与债务人B双方实力相当，债权债务关系明确，B欠A100元，金额可协商，若合作达成妥协，A可获90元，减免B债务10元，B可获10元；如一方强硬一方妥协，则强硬方收益为100元，而妥协方收益为0；如双方强硬，发生暴力冲突，A不但收不回债务还受伤，医疗费用损失100元，则A的收益为-200元，也就是不仅100元债收不回反而倒贴100元，B则是损失了100元。

因此，A、B各有两种战略：妥协或强硬。每一方选择自己最优战略时都假定对方战略给定：若A妥协，则B强硬是最优战略；若B妥协，A强硬将获更大收益。于是双方都强硬，企图获100的收益，却不曾考虑这一行动会给自己和对方带来负效益100。故这场博弈有两个纳什均衡，A收益为100，B收益为0，或反之，这显然比不上集体理性下的收益支付，A、B皆妥协，收益支付分别为90、10。也就是债权人与债务人为追求利益最大化，会选择不合作，从某种意义上说双方陷入囚徒困境。尽管在理论上有两个纳什均衡，但由于当今中国信用不健全(如欠债不还、履约率低、假冒伪劣盛行)，法律环境对债务人有利，可想而知B会首先选择强硬。因此，这是一个动态博弈，A在B选择强硬后，不会选择强硬，因为弱采取强硬措施反而结局不好，故A只能选择妥协。而在双方强硬的情形下，B虽然收益为-100，但B会预期，他选择强硬时A必会选择妥协，故B的理性战略是强硬。因此，这一博弈纳什均衡实际上为B强硬A妥协。

欠债还钱博弈是假定A、B实力相当，如实力相差悬殊，一般实力强者选择强硬。比如在家庭夫妻冲突中，首先退下阵的一般是丈夫。大部分夫妻怄气或吵架，最终得利的总是妻子。

前面提到的斗鸡博弈如果进一步衍生为动态博弈，会形成这样一个拍卖模型。拍卖规则是：轮流出价，谁出得最高，谁就将得到该物品，但是出价少的人不仅得不到该物品，并且要按他所叫的价付给拍卖方。

假定有两人竞价争夺价值100元的物品，只要双方开始叫价，在这个博弈中双方就进入了骑虎难下的状态。因为，每个人都这样想，如果我退出，我将失去我出的钱，若不退出，我将有可能得到这价值100元的物品，但是，随着出价的增加，他的损失也可能越大。每个人面临着是继续叫价还是退出的两难困境。

这个博弈实际上有一个纳什均衡：第一个出价人叫出100元的竞标价，另外一个人不出价（因为在对方叫出100元的价格后，他继续叫价将是不理性的），出价100元的参与人得到该物品。

一旦进入骑虎难下的博弈，及早退出是明智之举，然而当局者往往做不到，这就是所谓当局者迷。这种骑虎难下的博弈经常出现在国家之间，也出现在企业或组织之间，当然个人之间也经常碰到。20世纪60年代，美国介入越南就是一个骑虎难下博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本，也是骑虎难下博弈，其实，赌徒进入赌场开始赌博时，他已经进入了骑虎难下的状态，因为，赌场从概率上讲是肯定赢的。从理论上讲，赌徒与赌场之间的博弈如果是多次的，那么赌徒肯定输的，因为赌徒的“资源”与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大，那么赌场有可能输的；如果你的资源无限大，只要赌徒有非0的赢的可能性，那么赌徒肯定会赢的。因此，像葡京这样的赌场要设定赌博数额的限制。

博弈论专家将这里的骑虎难下博弈称为协和谬误。20世纪60年代，英国和法国政府联合投资开发大型超音速客机，即协和飞机。该种飞机机身大、设计豪华并且速度快。但是，英法政府发现：继续投资开发这样的机型，花费会急剧增加，但是这样的设计定位能否适应市场还不知道；而停止研制将使以前的投资付诸东流。随着研制工作的深入，他们更是无法作出停止研制工作的决定。协和飞机最终研制成功，但因飞机的缺陷（如耗油大、噪音大、污染严重等），它不适合市场，最终被市场淘汰，英法政府为此蒙受很大的损失。在这个研制过程中，如果英法政府能及早放弃飞机的开发工作，会使损失减少，但他们没能做到。

2．银行会垮掉吗？

银行挤兑是存款人集中大量提取存款的行为，是一种突发性、集中性、灾难性的危机。自有银行以来，挤兑现象就相并而存。据载，世界上最早的两家银行是1272年和1310年在意大利设立的巴尔迪银行和佩鲁齐银行，均因债务和挤兑问题于1348年倒闭。始于银行挤兑而爆发的1929～1933年的经济大危机，使美国大约1.1万家银行倒闭或被兼并，造成金融混乱。20世纪70年代以来，银行危机发生的频率越来越高，世界上有100多个国家和地区的银行曾发生过银行挤兑的灾难。

一般来说，在发生大规模金融危机期间，挤兑现象会非常严重，同时正是由于挤兑国内银行，导致金融危机愈加严重。比如在1998的东南亚金融危机、俄罗斯金融危机，以及拉丁美洲各国金融危机时，银行挤兑现象都是非常严重，很多时候正是银行挤兑摧残了雪上加霜的国家经济。

为了了解银行挤兑，我们来看这样一个简单的例子。这个例子正反映了银行挤兑现象发生的机理。假设现在有A和B两个朋友，都借给C朋友100万元人民币做生意，C拿到这200万元在第一年进行投资，第二年才可以赚得利润。笔者不妨假设第一年的时候，A和B索要借款，C只能还给两人各70万元，若是A和B并不是那么急着用钱，给C两年的时间，则C连本带利可以获得280万。

对于A、B两人来说，第一年要回借款，各得70万；其中一个人要回借款，而另一个人没有去索要，则索要的人先来一步得到100万本钱，另一个人则只拿到剩下的40万元；如果两人都在第二年才拿回存款，则各得140万元；在第二年，只有一个人要回借款，另一个人并没有催着C还钱的情况下，先催款的人得到180万，另一个人只拿到原来的本钱100万。这种情况下，就是一个两阶段的动态博弈。见下面两个图。 70 70

40 100

100 40

到第二年

140 140

100 180 180 100

140 140

态博弈都是用倒推法进行分析，我们在这里仍然采用倒推法，首先看第二年时，A和B作为理性人会如何选择行动策略。假如A和B都将资金借给C用到第二年，这个时候，博弈均衡点是双方都索要回自己的资金，A和B各得到140万元的还款，利息率高达40％。从博弈论的角度来看，整个均衡点是A、B两人理性博弈的唯一可能结果。

我们回过头来看，第一阶段也就是本例中第一年双方的博弈情况。由于在第一年时，双方都不抽回资金的策略将产生第二阶段的均衡结果，因此，在第一阶段的博弈矩阵可以改写成如下的图。 70 70

40 100

100 40

140 140

在我们假定A和B都是理性人的条件下，第一阶段的纳什均衡点很明显有两个，一个是双方都索要借款，这时双方都只能拿回70万元，另一个就是双方在第一年都不索要借款，这时根据我们在第二阶段的分析，双方各能收到140万元的回报。自然对于A和B来说，后一个纳什均衡比前一个纳什均衡要好。

遗憾是，并没有什么可以保证A、B双方一定会在第一年不索要借款。在现实生活中，这个模型中的C就相当于是一家银行，而A和B就是银行的存款客户。银行挤兑往往是由于谣言四起，存款客户不再放心将钱放在银行中，纷纷去银行拿回存款，在很短的时间内，银行又无法筹措大量的现金，最终的结果就是银行倒闭，很多人只能抽回银行存款的一部分，甚至是一分存款都拿不到。这种情况往往就是实际生活中许多银行因挤兑风潮倒闭的根源。

由此可见，只有强有力、权威的、有担保能力的政府才可以出面保证客户资金安全并辟谣，来防止挤兑的发生。同时政府需要建立信贷制度、保险制度来加强人们的信心，尽量让该模型另一个较好结果的纳什均衡。 3．如何以弱胜强？

在中国历史上，以弱胜强的战役举不胜数。在现代企业竞争中，弱小企业打败大企业也是司空见惯的情形。比如在第二次世界大战中，德国以最少的兵力最快的速度侵占法国。德国要进攻法国无非有三种选择：从两国接壤的边境发起进攻；借道比利时和卢森堡；借道瑞士。由于瑞士是个高山国家，阿尔卑斯山脉贯穿全境，不便于开展军事行动。所以第三种选择首先被排除，于是，进攻路线的选择就剩下了两个：从两国接壤的边境发起进攻；借道比利时和卢森堡。法国修筑了漫长的防线，严阵以待，抵抗的军。然而事实是，1940年5月10日，德军从卢森堡和比利时东部的阿登森林地区进入法国，撕开了法国防线，德

军于是长驱直入。驻守在法国和比利时边境的英法联军，一下子被断了后路，被德军包围了。他们一路向后撤，直到大海边。5月26日一天，英国动员了所有的船只，从法国接回了33.8万人，这就是著名的“敦克尔刻大撤退”。

我们不妨用博弈论来简单地分析一下当时的法国是否有好的策略来阻止德国的进攻。假设进攻方德军准备进攻法国，军力是2个师。而防守的法国军队则有3个师。德军与法军每个师的装备、人员、后勤等完全相同，自然战斗力相同。不妨假想，德国进攻法军有两个方向，分别是A、B两个方向。由于一个德军师与一个法军师的战斗力完全相同，因此两军相遇时，人数居多的一方取胜，战争中都是“易攻难守”，因此当两方人数相等时，守方获胜。同时，军队的最小单位为师，不能够再往下分割。只要德军可以突破防线，就算德军胜利；反之则法军胜利。由此看来，进攻方德军的战略有两个： 1．两个师集中向法军防线的A方向进攻；

2．兵分两路，一个师向法军防线的A方向进攻，另一个师向法军防线的B方向进攻； 3．两个师集中向法军防线的B方向进攻。防守方法军则有四种不同的防守策略： 1．3个师集中防守A方向；

2．2个师防守A方向，1个师防守B方向； 3． 1个师防守A方向，2个师防守B方向； 4．3个师集中防守B方向。

我们依次用排列组合来看罗列双方各种策略组合下的结果，见下图。 1 2 3 4 1

法军胜利法军胜利德军胜利德军胜利 2

德军胜利法军胜利法军胜利德军胜利 3

德军胜利德军胜利法军胜利法军胜利

这个博弈中，德军没有劣势策略，而法军有劣势策略，很明显，法军选择第一种策略，也就是派3个师防守A方向劣于第二种策略，也就是派2个师防守A方向，1个防守B方向。因为，法军选择第二种策略的任何一个结果斗不比选择第一种策略的结果要差，在图中能够看出三种结果：德军选择第一种策略时，法军选择第二种策略与第一种策略相同，都是法军胜利；德军选择第二种策略时，法军选择第二种策略是法军胜利，而第一种策略则是德国胜利，自然选择第二种策略要好；德军选择第三种策略时，法军选择第一、第二策略结果相同，都是德军胜利。由此可见，法军选择第二种策略自然好于第一种。同理，法军选择第三种策略也好于第四种策略的结局。因此，法军策略选择种的第一种和第四种都是劣势策略。

劣势策略从理性人的角度来看是法军一定不会采用的策略，德军知道法军不会选择第一、第四种策略，德军和法军都知道博弈简化成下图。

2 4 1

法军胜利德军胜利 2

法军胜利法军胜利 3

德军胜利法军胜利

这个简化的博弈中，法军反而没有劣势策略，德军却有一个劣势策略，也就是第二种策略，选择分兵两路进攻法军防线。很明显，德军选择第二种策略的结局就是根本不可能胜利，理性的德军自然不选择这个劣势策略。博弈矩阵得到了进一步的简化见下图。 2 4 1

法军胜利德军胜利 3

德军胜利法军胜利

这个时候，德法双方的形势是相同的，即德军尽管在总兵力上劣于法军，但实际上它只要运用谋略，攻其不备，其获胜的可能与守方是相同的。在博弈论中，“以弱胜强”道理就是这样。比如在战争中，总兵力占优势的一方往往并不能保证在某个局部可以获得优势，处于弱势的一方则可以集中优势兵力，在某一个方向或某一场战斗中取得胜利，并逐步积累胜利成果达到最终整个战役的胜利。再如在企业竞争中，也是一样。资本、规模、品牌、人力等都处于劣势的企业，可以在某个局部市场上，集中自己所有的资源并加以整合，造成细分市场上对强势企业的优势，从而成为市场竞争的胜家。

4．公共地悲剧

有一个关于牧民与草地的故事，说的是当草地向牧民完全开放时，每一个牧民都想多养一头牛，因为多养一头牛增加的收入大于其养成本，明显这是有利可图的。尽管因为平均草量下降，增加一头牛可能使整个草地的牛的单位收益下降。

虽然对于单个牧民来说，他增加一头牛是有利的。但是如果所有的牧民都看到这一点，都增加一头牛，那么草地将被过度放牧，从而不能满足牛的需要，导致所有牧民的牛都饿死。这个故事就是公共资源的悲剧，即哈定悲剧，最初由英国留学生哈定（GarritHadin）1968年在《科学》杂志上发表的文章《Tragedy of Commons》(公共策略)中提出。哈定指出：“在共享公有物的社会中，每个人，也就是所有人都追求各自的最大利益。这就是悲剧的所在。每个人都被锁定在一个迫使他在有限范围内无节制地增加牲畜的制度中。毁灭是所有人都奔向的目的地。因为在信奉公有物自由的社会当中，每个人均追求自己的最大利益。公有物自由给所有人带来了毁灭。”

比如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均

衡”状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。

中国的经济社会发展与资源环境之间的关系更是印证了哈定的观点。中国的国家发展战略一波三折。上世纪五十年代，我们学苏联，走的是低就业、低消费、高消耗、自我封闭的重工业模式。然而，这个模式并不符合中国人均资源短缺、资本稀缺、劳动力资源丰富的基本国情，再加上政治动荡，走了一段就走不下去了，使我们延误了发展的黄金时期。八十年代，我们又学欧美传统的发展模式，用资源高消耗和生活高消费来刺激经济高速增长，这一模式追求资本生产率与利润最大化而忽视资源利用率与环境损失。25年后，中国成了世界上最大的制造业国家，也成了世界上自然资产损耗最严重的国家。45种主要矿产15年后将剩下6种，5年以后60％以上的石油依赖进口，我们单位GDP的能耗是日本的7倍、美国的6倍、印度的2.8倍。单位GDP污染排放量是发达国家平均水平的十几倍，劳动生产率却是人家的几十分之一。建国50多年来，我们的人口从6亿增长到了13亿，多了一倍，而可居住的土地由于水土流失从600多万平方公里减少到300多万，减少了一半。中国在人均GDP400～1000美元时，出现了发达国家人均GDP3000～10000美元期间出现的严重污染。按照目前的污染水平，若干年后我们的经济总量翻两番时，污染负荷也会跟着翻两番。

资源和环境作为公共自由物，是全体国民的公共财产，政府作为人民大众管理社会事务的工具责无旁贷的负有保护资源环境、实现经济社会自然协调发展的政治历史使命。针对不少政府官员和学者总是寄希望于通过技术手段来解决公共地悲剧问题，然而早在20世纪60～70年代在现代自然科学领域已经形成一种认识，那就是例如人口问题、核战争及环境污染等问题都只是一个局部问题，而这些是无法靠技术手段解决的。

要解决公共地悲剧，就必须要明晰公共地产权、牧民之间有效沟通形成共同愿景、采取违规行为之后的及时惩罚、牧民自身道德素质的提高、改善牛或者草的品种甚至是牧民也可以换个职业等都是可行的方法。这些解决方法对我国建设节约型社会也有很大的启发，比如增加资源环境危机的宣传和教育以形成大众心理暗示，对公共自由物中的不可再生资源采用国家管理的形式，严格控制使用；对可再生资源采取委托管理的形式，培育社会力量加以保护，国家起到监督和引导作用等。 5．少数人博弈与酒吧问题

酒吧问题(Bar problem)是美国人阿瑟(W.B.Arthur)1994年在《美国经济评论》发表的《归纳论证的有界理性》一文中提出来的。该问题是说：有一群人，假如总共有100人，每个周末均要决定是去酒吧活动还是待在家里。酒吧的容量是有限的，也就是说座位是有限的，如果去的人多了，去酒吧的人会感到不舒服，此时，他们留在家中比去酒吧更舒服。我们假定酒吧的容量是60人，如果某人预测去酒吧的人数超过60人，他的决定是不去，反之则去。这100人如何作出去还是不去的决定呢？

这是一个典型的动态群体博弈问题。这个博弈的前提条件还做了如下限制：每一个参与者面临的信息只是以前去酒吧的人数，因此他们只能根据以前的历史数据归纳出此次行动的策略，没有其它的信息可以参考，他们之间更没有信息交流。

酒吧问题所模拟的有可能是更接近于一个赌博者下注时面临的情景，比如股票选择、足球博彩。这个博弈的每个参与者都面临着这样一个困惑：如果许多人预测去的人数超过60，而决定不去，那么酒吧的人数会很少，这时候作出的这些预测就错了。反过来，如果有很大一部分人预测去的人数少于60，他们因而去了酒吧，则去的人会很多，超过了60，此时他们的预测也错了。因而一个作出正确预测的人应该是，他能知道其他人如何作出预测。但是在这个问题中每个人预测时面临的信息来源都是一样的，即过去的历史，同时每个人无法知道别人如何作出预测，因此所谓正确的预测几乎不可能存在。阿瑟教授通过真实的人群以及计算机模拟两种实验得到了两个迥异的、有趣的结果。对真实人群的是实验中，实验对象的预测呈有规律的波浪状形态，实验的部分数据如下：周别 n ?n+1 n+2? n+3 n+4 ??n+5?? n+6? n+7 人数 44 76 23?

?77? 45? ??66 ?78 22

从上述数据看，虽然不同的博弈者采取了不同的策略，但是其中共同点是这些预测都是用归纳法进行的。我们完全可以把实验的结果看做是现实中大多数理性人作出的选择。在这个实验中，更多的博弈者是根据上一次其他人作出的选择而做出这一次的预测。然而，这个预测已经被实验证明在多数情况下是不正确的。那么，在这个层面上说明，这种预测是一个非线性的过程。所谓这样一个非线性的过程是说，系统的未来情形对初始值有着强烈的敏感性，这就是人们常说的的“蝴蝶效应”：在北京的一只蝴蝶动了一下翅膀，华盛顿就下了一场大暴雨。

通过计算机的模拟实验，得出了另一个结果：起初，去酒吧的人数没有一个固定的规律，然而，经过一段时间后，这个系统去与不去的人数之比接近于60：40，尽管每个人不会固定地属于去或不去的人群，但这个系统的的这个比例是不变的。如果把计算机模拟实验当做是更为全面的、客观的的情形来看，计算机模拟的结果说明的是更为一般的规律。生活中有很多例子与这个模型是相通的。“股票买卖”、“交通拥挤”以及“足球博彩”等等问题都是这个模型的延伸。在现行的说法中，对这一类博弈统称为“少数人博弈。

少数者博弈是改变了形式的酒吧问题，是由一位定居瑞士的名叫张翼成的中国人在1997年提出的。少数者博弈可以运用于股票市场。每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于卖股票的位置，而你处于买的位置，股票价格低，你就是赢家；而当你处于少数的卖股票的位置，多数人想买股票，那么你持有的股票价格将上涨，你将获利。而股民采取什么样的策略则多种多样，而策略的得出完全是根据他们以往的经验归纳出来的，因而类似于这里的少数者博弈的情况。

少数者博弈中一个特殊的结论不具有普遍意义，即：记忆长度长的人未必一定具有优势，因为，如果确实有这样的方法的话，在股票市场上，人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。但是，这样一来，人们将争抢着去购买存储量大即硬盘空间大以及计算速度快的计算机了，在实际中人们还没有发现这是一个炒股票必定赢的方法。

交通拥挤问题的模型也是一个少数者博弈的问题。城市的交通越来越拥挤，选择行车路线也是不断的博弈过程。在交通高峰期间，司机面临两条路的选择时，往往要选择没有太多车的路线行走，此时他宁愿多开一段路程而不愿意在塞车的地段焦急地等待。司机只能根据以往的经验来判断哪条路更好走，而所有司机都不愿意在塞车的道路上行走。因此每一个司机的选择必须考虑其他司机的选择。这也是一个少数者博弈问题。

当然在司机行车的少数者博弈问题中，司机经过多次的选择和学习，许多司机往往能找到规则性，这是以往成功和失败的经验教训给他的指引，但这不是必然有效的规则性。在这个过程中，司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段；有的司机经验不足，往往不能有效避开高峰路段；有的司机喜欢冒险，宁愿选择短距离的路线；而有的司机因为保守而宁愿选择有较少堵车的较远的路线，等等。最终的路线的拥挤程度就由不同特点和不同经验的司机的选择所构成。

6．房地产市场的多人博弈

房地产市场是关系到国计民生的金融市场重要组成部分之一。总体说来，在房地产市场中，政府的作用举足轻重；再次，房地产开发过程中参与者众多，除政府管理协调市场外，银行等金融机构协调贷款、融资的作用也不可估量；当然还有房地产市场的主题，开发商与抱有不同目的的购房者。这说明房地产开发过程中是多方博弈，力量均衡的过程；房地产开发过程是一个复杂的过程，其参与者多，涉及面广，个中利益关系复杂难以言表。

为了简化问题，首先来看政府作为市场“裁判”时的情形，即房地产商与消费者、房地产商与银行等金融机构在房地产开发过程中的利益博弈。假设政府的宏观政策等不变，市场上仅两个参与主体，即房地产商与银行等金融机构。银行等金融机构有两种决策方式，即协作与不协作；房地产开发商也有两种决策，即优质产品与偷工减料，不难发现这个博弈有两个纳什均衡：金融机构不协作与开发商偷工减料，金融机构协作与开发商做出优质产品。事实上，上述两种情况都在不同阶段、不同城市都出现过，当然这也是房地产泡沫产生的原因之一。

一般来说政府的政策制定与执行需要经历很多时间才能产生效果，这就是时滞因素。政府在制定政策以后要通过银行等金融机构和房地产商共同实施，并在实施过程中通过收集各种市场信息的反馈来修改政策，如此循环往复，同时每一个博弈参与者都明白自己的利益所在并可以独立作出决策。

这个动态博弈的过程如下：首先，政府根据所收集的市场信息，选择紧缩或宽松的货币政策以调控市场繁荣程度。接着，银行等金融机构根据政府出台的政策，揣测政府意图，并结合自己对市场走向的判断，来增加或减少给房地产开发商与购房者的贷款。最后，房地产商根据银行等金融机构的操作过程来做出自己的投资规划：扩大投资规模或缩减投资量。

如果考虑到购房者，那么这个博弈就成了政府、开发商、购房者和金融机构的四方利益博弈。该博弈模型从国内的大前提下出发，从政策的制定到最终落实到购房者，讨论其利益的分配及决策。很明显，购房者在信息获取方面具有劣势，所掌握的信息既不及时，也不全面，仅仅是一些公开或较公开的信息，并且对于购房者整体而言，相互之间没有什么沟通能力，没有信息优势，处于房地产市场博弈各方最为被动的地位。

在这个动态博弈中，我们采用如下方式进行讨论。首先将四方参与者分为两类，设为A与B。其中A由政府与购房者组成，因为两者立场较为接近：政府目的是规范市场，以保长治久安；同时，政府的政策倾向于购房者的获益，公平的市场才不会使购房者盲从，这有利于规范化市场的形成。而规范化市场能为购房者提供良好的消费环境，如此形成良性循环，增强政府对市场的操控能力。B由房地产商与银行等金融机构组成，因为两者有共同的利益基础：房地产商的大部分资金是由银行等金融机构提供的，银行也是企业，都是以利益最大化为经营目标，因而这些金融机构监督房地产开发的全过程，并且拥有大量信息，以增强其监控能力，提高房地产开发过程的合理、规范操作可能性，预期获得高额回报。又由于房地产的开发上投入的自有资金也占相当大比重，也不想将项目“烂”在自己手中，但由于其信息优势，且规模较大，易于操纵市场，并变相哄抬物价，从而形成卖方市场，损害消费者利益，占有超额利润。

在这种情况下，政府面临两种选择：其一是有所作为，下大力度规范市场，其二是不作为，任由市场随意变化。同时，购房者也面临两个选择：其一是正常的根据自己的经济条件合理购房，特别是在房价居高不下时持币待购，其二是毫无理性可言，盲目购房。房地产开发商合理合法地开发新项目，或者投机取巧，开发不能保质保量的劣质品。银行也根据房地产商和政府的操作选择增加贷款以支持房地产投资或者减少贷款以维护自己的利益。可见，对于政府来说，当市场混乱，价格失调时，有所作为是一个理性的选择；对于购房者则根据自身条件购房，不为购置房产尔透支自己的消费能力方为上策。对于房地产开发商而言合法合理开发新项目，定价适中，满足大部分人的需求是收益最大的选择。对于金融机构来说，根据国家宏观政策的变更而改变贷款策略是保持稳定发展的良好方法。

想象一下在这种情况下，在政府的有序管理与金融机构的大力支持下，开发商能够充分洞察购房者的消费需求，科学规划、设计、建设、销售楼盘，那消费者自然趋之若鹜。于是，开发商安心赚取利润，赢得越来越好的市场信誉；消费者购得满意的房屋，心神俱爽，安居乐业；市场井然秩序，国家宏观经济形势良好。这不就是房地产市场皆大欢喜的多赢之局。第六章信息经济学基础 1.信息有价

我们前面所阐释的“囚徒困境”、“智猪博弈”、“斗鸡博弈”等各种模型都有一个前提条件，那就是博弈双方都有共同知识，也就是博弈参与者都知道对方所能采用的策略与各种可能发生的结局。在实际生活中，很多情况下并不是这么理想化。比如，人寿保险公司并不是投保人真实的身体状况如何，只有投保人自己对自身健康状况才有最确切的了解；政府官员廉洁与否，一般的公民并不是非常清楚；求职者向公司投递简历，求职者的能力相对而言只有自己最清楚，公司并不完全了解；最常见的例子就是买卖双方进行交易时，对交易商品的质量高低，自然是卖方比买方更加了解。这种情况在信息经济学中有一个专门的术语，叫做“信息不对称”。之所以有信息不对称，是因为存在“私有信息”。所谓“私有信息”，通俗地讲就是在博弈中，如果，某一方所知道的信息而对方并不知道，这种信息就是拥有信息一方的私有信息。有位专家说，信息就是信息，既不是物质，也不是精神。这似乎是什么都没说，又似乎已经说得很正确。广义的说，所谓信息就是消息。对人类而言，人的五官生来就是为了感受信息的，它们是信息的接收器，它们所感受到的一切，都是信息。然而，大量的信息是我们的五官不能直接感受的，人类正通过各种手段，发明各种仪器来感知它们，发现它们。信息可以交流，如果不能交流，信息就毫无用处。信息还可以被储存和使用。你所读过的书，你所听到的音乐，你所看到的事物，你所想到或者做过的事情，这些都是信息。

私有信息，简单地说，如商家的产品是否有严重缺陷的信息，这样的信息往往只被能接近和熟悉这种产品的人观察到，那些无法接近这种产品的人却无从了解或难以了解。相反，如果一则信息是大家都知道的，或者是所有有关的人都知道的，它就叫做“公共信息”或者“公共知识”。“私有信息”的存在导致了“信息的不对称性”，也就是某些掌握的信息要多于其他的人。私有信息的存在是信息不对称情况发生的根本原因。比如一个女孩面对好几个追求的男生，这些男生的人品、上进心等信息对于这个女孩来说都是私有信息，女孩与追求的男生之间就存在着信息不对称的现象，因此这个女孩到底选择哪一个男生往往就带有很大的不确定性。

私有信息掌握与否也是委托代理关系的重要概念。委托代理关系的概念来自法律。在法律上，当A授权B代表A从事某种活动时，委托代理关系就发生了，A称为委托人，B称为代理人。一般的委托代理关系泛指在任何一种涉及不对称信息的交易（合同、协议）中参与者之间的经济关系。掌握信息多、处于信息优势的一方称为代理人，掌握信息少、处于信息劣势的一方称为委托人。简单地说，“知情者”是代理人，“不知情者”是委托人。

社会是由众多个体构成的，人与人之间时刻发生着各种各样的联系。由于不对称信息在社会经济活动中相当普遍，所以许多社会经济关系都可以归结为委托代理关系。例如，政府与企业、股东与经理、雇主与雇员、消费者与厂家、计算机用户与服务商、信息经纪人与信息用户、病人与医生等等，他们之间都可以构成委托代理关系。除了正式的有书面合同（协议）的委托

代理关系，以及有口头委托的较为明显的委托代理关系外，社会经济关系中还有大量的隐含的委托代理关系，诸如老百姓与政府官员、选民与议员的关系等。

同一种社会经济关系中可能包含有多种不同的委托代理关系。例如软件生产商与软件用户的关系，对于软件的生产成本、软件性能等方面的信息，生产商掌握的比用户多，生产商是代理人，用户是委托人，从这一方面来说是“用户委托生产商进行生产”；对于需求欲望、支付能力等方面的信息，用户掌握的比生产商多，从这一方面来说又是“生产商委托用户进行消费”。可见，委托代理关系是与不对称信息相联系的，针对不同的不对称信息，可以构成不同的委托代理关系，对于参与各方，我们不能简单地说某一方是委托人、某一方是代理人。

一般来说，私有信息指的是现状，如买卖双方交易商品的质量状况、追求女孩的男生人品、健康状况、求职者的能力等。总而言之，私有信息是双方博弈时已存在的事实。在信息经济学中，一般把这种关于现存事实特征的私有信息，叫做“隐蔽特征”。

前面所说的私有信息造成的信息不对称是一种事前的信息不对称，举个例子说，消费者到商家去买商品，在购买之前就不清楚商品质量的好坏。然而，还有一种信息不对称是在一定的环境下，博弈的一方无法判断并观察到另一方未来的行为。在信息经济学中，这种未来别人难以判断或观察到的行为这种隐蔽信息，特别称为“隐蔽行为”。比如，一个民营企业雇佣了一个职业经理人，并授予此人极大的权力，然而这个资本所有者无法判断并观察到将来这个经理上任之后是否会偷懒甚至是将公司的利益据为己有。这种由于无法实现全天侯监督而产生的雇员进行欺骗或偷懒的可能性，就是隐蔽行为。又比如公务员都宣誓要一心为民、廉洁奉公，但是若无有效的监督机制，公务员寻租就成了一种隐蔽行为。

简而言之，隐蔽信息分为两大块，是合同前已经发生的和已经存在的有关事实，就叫做隐蔽特征，是合同后发生的有关事情，就叫做隐蔽行为。

正是因为参与博弈者掌握的信息并不完全，往往有很多私有信息的存在，其决策结果必然会有很大的不确定性。所谓“不确定性”，不管是对未来、现在或过去的任何决策，只要是我们不知道确切的结果的都具有“不确定性”。不确定性可分为两大类：主观不确定性和客观不确定性，主管不确定性是指决策者由于有关资料的缺乏而不能对事物的态度做出正确的判断，而这种不确定性的判断却是其它掌握资料的人可以有的。例如：消费者对商品的质量不如生产者更为了解，换句话说，商品质量对于消费者更加具有不确定性。和主观不确定性相关的信息常常具有不对称性，一些人掌握事物状态的信息，而另一些人则缺乏事物状态的信息。信息的不对称性可以通过信息的交流和公开以及寻找而消除；客观不确定性是指事物状态的客观属性本身具有不确定性，对此，人们可以通过认识去把握不确定性的客观规律，但是，认识本身并不能消除这种不确定性。

当存在不确定性时，决策者的决策就具有风险。不确定性和风险有密切的联系，但又是两个不同的概念。不确定性，直观上很容易理解，一件事情可能出现的结果越多，这件事情就越具有不确定性，结果越不明确（概率分布越分散），不确定性的存在就越显著。

风险的必要条件是决策面临着不确定性的条件。当一项决策在不确定条件下进行时，其所具有的风险性的含义是：从事后的角度看，事前做出的决策不是最优的，甚至是有损失的。决策的风险性不仅取决于不确定因素之不确定性的大小，而且还取决于收益的性质。所以，风险通俗地说，就是从事后的角度来看由于不确定性因素而造成的决策损失。

对个人来说，拥有信息越多，越有可能作出正确决策。对社会来说，信息越透明，越有助于降低人们的交易成本，提高社会效率。在绝大部分情况下，我们根本无法掌握影响未来的所有因素，这使得作确定性的决策变得困难重重。信息本身的价值正在于此。博弈参与者一旦掌握了更多信息，其决策获得更大收益的可能性就增大。比如，一个消费者买一部二手手机需要化1000元，而这部手机的真实价值也许只有500元，如果消费者购买了这部手机，就净损失500元，如果他和二手手机老板很熟，请老板吃顿饭支出100元，老板决定给这个消费者一部价值1200元的二手手机，很自然，获取这部手机真实信息的价值或信息成本就是100元，但是不仅没有亏掉500元，反而赚了200元，一反一复投入100元的信息成本所得到的收益是500+200＝700元。

因此，市场参与者的决策的准确性取决于信息的完整性，准确的决策需要更多信息的支持，所以信息的获取有减少风险的可能性。这就是说，信息的搜取有可能增加决策者的收益。信息的价值就可以用获取信息后可能增加的收益来衡量。当然信息的获取需要成本，有的时候这种成本可能会高到决策者无法承受的境地。 2. 从形象工程谈道德风险

《新京报》2004年9月26号的一篇文章说,建设部官员披露：中国662个城市、2万多个建制镇中，约有1/5的城镇建设存在“形象工程”。宽大的马路、宏伟的广场、豪华的政府办公楼等已经，这些现象无论是在经济发达地区还是落后地区都不同程度地存在。甚至有的地方，出现一个5万人口的城市，却要修能容纳6万人的大广场的笑话。尽管国家出台了各种政策严禁搞“形象工程”，然而很多地方政府搞形象工程却仍是屡禁不止、层出不穷，并有愈演愈烈之势。地方政府甘冒政策风险、屡闯中央禁区频频将一些耗资巨大的形象工程立项上马。在解释这种现象之前，我们先来看一下什么是“道德风险”（moral hazard）。所谓道德风险，就是人们利用市场的不成熟或者市场的扭曲，违背一般社会道德规范而做出符合经济理性的举动。道德风险始终存在，一个保过险的人在避免风险方面的积

极性普遍有降低的可能性。如果一个人对于他的行为后果只承担一部分责任，或者根本就不承担任何责任，那他的行为动机就被彻底改变了。

一般地，当交易双方签约后，如果代理人的行动选择会影响委托人的利益，而代理人选择了什么行动委托人又不知道，委托人利益的实现就有可能面临“道德风险”。道德风险是指代理人在使其自身效用最大化的同时损害委托人利益的行为，而代理人并不承担他们行为的全部后果。

“道德风险”这一术语产生于保险业。在保险市场上，购买了财产保险的人将不再像以前那样仔细地看管家里的财物，购买了医疗保险的人可能让医生多开一些不必要的贵重药品，购买了汽车保险的人可能更不注意保管自己的汽车。在这里，因为人们在投保后的行为保险公司无法观测到，从而产生了“隐藏行动”，保险公司面临着投保人松懈责任甚至采取“不道德”行为而导致的损失。

在人身意外伤害保险市场上，谁也不敢保证投保的人为了获得保险赔偿而不对自己的手脚四肢或眼睛“下手”；在人寿保险上也是如此，一个购买了大额保险的老人如果知道，万一他在保险期内去世，可以使子女得到一大笔补偿，他要动“死”的念头，谁也没办法。保险公司在制度设计上只是应当尽量避免那些可能出现。在这种情况下，保险公司将很可能由于多数的投保人是高风险类型人士而破产关门。比如很容易得病的人才投保健康保险，不容易得病的人不参加保险，于是保险公司需要赔给保户的钱将远远高于他们按照平均得病率计收的保费，从而带来损失。这里，私有信息的存在，使得投保人可以就他们本身的身体情况或风险程度说谎。这样一来，从保险公司的角度看，他们得到很多“逆向选择”得来的投保人。平常人们说“选择”，都是往好的方面选。保险公司的上述市场活动带来的选择，“选”出来的是比较不那么好的一群。所以这种选择叫做“逆向选择”。逆向选择会导致保险公司因风险过高而破产。实际上，“道德风险”在现实生活中是普遍存在的现象。病人到医院看病动手术，手术能否成功，大夫在手术过程中的尽心尽责非常重要；大夫不用心可能导致手术失败；如果不能将正常的手术风险和医疗事故区分开来，大夫将不承担“不用心”行为导致的全部后果。这时，病人面临着来自大夫的“道德风险”。学生选修某门课程，任课老师是否认真负责，这些行动的选择取决于老师，而这些行动又会影响到学生对知识的掌握。这时，学生即面临来自老师的“道德风险”。

现在我们再来用信息经济学的基本概念，来解释地方热衷于搞形象工程的原因。在目前的体制下，地方政府官员事实上是一个个存在相互竞争关系的经济体。无论是改善人民生活也好，显示自身政绩也罢，推动经济发展是必由之路。而推动经济发展，在一个越来越开放的环境下，投资尤其是外来的投资的作用越来越明显。因此，各个地方政府都会将吸引投资作为自己的工作目标。资本方也在寻找婆家，但是，往哪里投资却是个颇伤脑筋的事。这时，客观上就需要一种机制来帮资本方进行选择。地方政府热建形象工程，就是为了设计这样一种机制。宽马路、大广场对投资者来讲，是地方政府有经济实力的一种信号，有了经济实力才会为外来投资者创造良好的条件，也才可以保证不会引入资金后关门打狗，也就是人们惯常所说的增强投资者的信心。

但是，这样讲并不是说建形象工程就一定是合理的，恰恰相反，目前各地热建形象工程形成一种竞赛，这种竞赛的结果是一步步远离发展经济、造福百姓的根本目标，演化成一场劳民伤财、逼民治富的闹剧。引来凤凰并不是目的，留住凤凰才是根本，而这是需要条件的，即梧桐树能够很好地存活而且枝繁叶茂。而现在竞赛形象工程的结果是，由于不切实际地劳民伤财，不仅导致百姓怨愤，而且事实上降低了他们的购买力。 3．逆向选择的困境：二手车市场为何建立不起来？

美国经济学家阿克洛夫（G.Akerlof）1970年提出了著名的旧车市场模型，开创了“逆向选择”（adverse selection）理论的先河。

在旧车市场上，买者和卖者之间对汽车质量信息的掌握是不对称的。卖者知道所售汽车的真实质量；但一般情况下，潜在的买者要想确切地辨认出旧车市场上汽车质量的好坏是困难的，他最多只能通过外观、介绍及简单的现场试验等来获取有关汽车质量的信息，而从这些信息中很难准确判断出车的质量，因为车的真实质量只有通过长时间的使用才能看出，但这在旧车市场上又是不可能的。所以我们说，旧车市场上的买者在购买汽车之前，并不知道哪辆汽车是高质量的，哪辆汽车是低质量的，他只知道旧车市场上汽车的平均质量。在这种情况下，典型的买者只愿意根据平均质量支付价格，但这样一来，质量高于平均水平的卖者就会将他们的汽车撤出旧车市场，市场上只留下质量低的卖者。结果是，旧车市场上汽车的平均质量降低，买者愿意支付的价格进一步下降，更多的较高质量的汽车退出市场。在均衡的情况下，只有低质量的汽车成交，极端情况下甚至没有交易。

在旧车市场上，高质量汽车被低质量汽车排挤到市场之外，市场上留下的只有低质量汽车。也就是说，高质量的汽车在竞争中失败，市场选择了低质量的汽车。这违背了市场竞争中优胜劣汰的选择法则。平常人们说选择，都是选择好的，而这里选择的却是差的，所以把这种现象叫做逆向选择。

从上述分析过程还可以看出，产品的质量与价格有关，较高的价格诱导出较高的质量，较低的价格导致较低的质量。逆向选择使得市场上出现价格“决定”质量的现象。由于买者无法掌握产品质量的真实信息，这就为卖者通过降低产品质量来降低成本从而争取低价格提供了可能，因而出现低价格导致低质量的现象。逆向选择对经济是有害的：高质量的卖者和需要高质量

产品的买者无法进行交易，双方效用都受到损害；低质量的企业获得生存、发展的机会和权利，迫使高质量的企业降低质量，与之“同流合污”；买者以预期价格获得的却是较低质量的产品。如同“道德风险”一样，“逆向选择”这一术语也起源于保险行业。因为保险市场上的逆向选择现象相当普遍。以医疗保险为例。不同投保人的风险水平可能不同。有些人可能有与生俱来的高风险，比如他们容易得病，或者有家族病史；而另一些人可能有与生俱来的低风险，比如他们生活有规律，饮食结构合理，或者家族寿命都比较长。这些有关风险的信息是投保人的私人信息，保险公司无法完全掌握。如果保险公司对所有投保人制定统一保险费用（这属于总体保险合同），由于保险公司事先无法辨别潜在投保人的风险水平，这个统一的保险费用只能按照总人口的平均发病率或平均死亡率来制定，所以它必然低于高风险投保人应承担的费用，同时高于低风险投保人应承担的费用，从而使得低风险投保人由于保险费用过高而退出保险市场，保险市场上只剩下高风险的投保人，即出现高风险投保人驱逐低风险投保人的逆向选择现象。其结果是保险公司的赔偿概率将超过根据统计得到的总体损失发生的概率，这将导致保险公司出现亏损甚至破产。

资本市场上也存在着逆向选择。比如对于银行来说，其贷款的预期收益既取决于贷款利率，也取决于借款人还款的平均概率，因此银行不仅关心利率，而且关心贷款风险，这个风险是借款人有可能不归还借款。一方面，通过提高利率，银行可能增加自己的收益。另一方面，当银行不能观测特定借款人的贷款风险时，提高利率将使低风险的借款人退出市场，从而使得银行的贷款风险上升。结果，利率的提高可能降低而不是增加银行的预期收益。显然，正是由于贷款风险信息在作为委托人的银行和作为代理人的借款者之间分布并不对称，导致了逆向选择现象。

不仅在经济生活中存在很多“劣币淘汰良币”的现象，日常生活中的逆向选择也随处可见。比如人们常说“巧妇常伴拙夫眠”，漂亮女孩身边的男孩总是貌不出众、能力平常。而那些普通女孩倒是不乏优秀男生与之相伴。

造成这种情况的真正原因就是信息不对称下的逆向选择。那些对漂亮女孩向往已久的崇拜者们相互之间，以及和漂亮女孩之间都不能沟通信息。漂亮女孩的追慕者会这样想：这么漂亮的女孩，怎么轮得到我来追？肯定有那些比我有钱的阔佬，比如巴菲特，去追求她。于是长叹一声，转而追求其他女孩去了。而巴菲特在华尔街上巧遇来纽约观光的漂亮女孩之后，也颇为心仪，但是巴菲特转念一想：这么漂亮的漂亮女孩，怎么轮得到我来追？肯定有那些比我有年轻的阔佬，比如比尔·盖茨，去追求她。于是巴菲特长叹一声，转而与结发老妇相伴去了。漂亮女孩去微软公司面试时，巧遇比尔盖茨。面对如此佳人，比尔·盖茨再也不能正襟危坐了，心中一阵激动，但比尔·盖茨转念一想：这么漂亮的女孩，怎么轮得到我来追？肯定有那些比我更强壮的阔佬，比如乔丹，去追求她。于是比尔·盖茨长叹一声，埋头继续与司法部周旋。漂亮女孩去观看篮球比赛时，邂逅飞人乔丹。面对如此佳人，乔丹岂能坐怀不乱，脑海中翻起千层浪，但乔丹冷静下来一想：这么漂亮的女孩，怎么轮得到我来追？肯定有那些比我更英俊的小伙，比如她的什么同学同事，早就已经把她追到手了。于是乔丹长叹一声，转身来个空中走步。这就是漂亮女孩的困惑。

那些想追求她的人相互之间都不能互通信息，也不了解漂亮女孩的尴尬处境和真实想法。结果是每个想追求她的男人都根据自己的预期来决定是否要去追求漂亮女孩。由于大家都预期追求金发女郎一定是极高的门槛，最后造成大家都退缩不前。在这个困惑中，大家只观察到了女孩的美貌，只发现了自己的不足之处，而根本不知道其他任何信息。最后每个人都相信追求漂亮女孩的代价将是很高的，因而大家都不采取行动。最后反而是那些不知天高地厚、懵懵懂懂的男生追到漂亮女孩。 4.声誉、信号传递与制度设计

从上一小节我们可以知道，信息不对称是导致逆向选择的根源。要减少逆向选择，就必须解决信息不对称问题。解决思路是委托人或“高质量”代理人通过信息决策，减少委托人与代理人之间信息不对称的程度。解决的途径有两个：其一是委托人通过制定一套策略或合同来获取代理人的信息，这就是“信息甄别”，我们在后一节将会详细解释；其二是“高质量”代理人利用信息优势向委托人传播自己的私人信息，这就是“信号传递”。

记得有一部电视剧，其中有一个情节是一位武林豪杰在交通要道边开了一个酒馆。生产十分兴隆，引起另一位武林高手的垂涎。这位武林高手决定打败那位豪杰然后霸占酒馆。两强相遇，武林豪杰和武林高手相互之间不知对方底细，于是来一番比试。本来，他们俩可以通过打斗来解决问题，但打斗一场双方都会有所损伤，不如通过其他方式比较武功高低。豪杰拿来5块砖，一掌将其击碎，高手也不示弱，照样击碎5块砖。于是，豪杰又拿来十块砖，同样是一掌击个粉碎，高手见之，心中没底，于是明白自己武功较豪杰还差一截。于是，这位武林高手甘拜下风，放弃了原来的计划，弃剑而去。这个电视剧中的情节就是一个典型的“信号传递博弈”。豪杰身怀绝技、天下无敌。但其他人不一定会相信他是武林第一高手，除非亲自与之交手并败于他。交战虽然可以决出高下，但对双方都会有损失，打个头破血流对谁都不是好事。当然，豪杰可以对外宣布他的武功非凡，其他人不是他的对手，但即使豪杰没有什么本事，也可以如此对外宣布。所以，仅凭口头宣布是难以令人信服的。

俗话说，是骡子是马，拉出去蹓蹓。豪杰用过人武功劈掉别人难以模仿的10块砖，就向别人发出一个信号。这个信号向外传递的信息是：我的武功高强，你们可不是对手。这样，不用打斗就决出高下，避免了打斗带来的更大损失。

在商品市场上也是相同的道理。当人们进行交易时，产品的质量是重要的特征。在多数情况下，消费者在购买产品时并不能了解到每种产品的具体质量，真正了解产品质量的是卖者。不同的卖者提供的产品质量不同，那些劣质品的卖者为了自己的

利益将产品的质量信息隐藏起来。对于消费者来说，如果他们无法区分产品质量的优劣，就只能根据对整个市场的估计支付价格，即根据平均质量支付价格。当优质品和劣质品被消费者以同样的方式对待时，劣质品在成本上具有优势，从而有可能在销售上占据优势；优质品因其机会成本超过市场价格从而可能退出市场。但是，优质品的提供者不会甘心被劣质品逐出市场，为了使自己的产品与劣质品区分开来，他们会选择适当的信号，向消费者传递自己的产品是优质品的信息，以改善信息不对称的状况，减少逆向选择的不利影响。

优质品的提供者可以采用多种方式发送信号。如质量保证和承诺是一种成本低廉而且短期效果明显的信号传递方式，因为真正的优质品因质量原因退换的概率非常小，保修期内的返修率非常低，因此从整体上不会增加多少费用。而劣质品的卖者肯定提供不了这种保证和承诺，因为这对于他们来说成本太高了。

再如名牌效应是一种投入成本较高但长期回报十分丰厚的信号传递方式。如海尔电器、奇瑞汽车等，其品牌本身就传递了产品是优质品的信息。在消费者心目中，名牌代表优质。尽管不是每件名牌产品都是优质品，但是消费者在非名牌产品中搜寻优质品的成本通常很高，而在名牌产品中搜寻优质品的成本相对较低，因此，希望购买优质品的消费者通常会优先考虑选择名牌产品或自己熟悉的品牌。

广告也是一种信号传递的手段，是减少信息不对称的非常有力的工具。卖者通过广告信息的传播，以较少的成本获得较高的宣传效用；而消费者也可以通过非常小的成本，从卖者的广告信息中获得各种所需的市场知识。

还有些商品广告既无商品的价格信息又无售货地点信息，只有明星的表演。商业广告中通过一些电影明星使用新产品的图象，利用公众的“追星”心理打造市场。这种关于新产品市场引导的广告在国外的电视广告中特别常见，通常是一位当红明星在电视上用新产品表演一番，既无价格，也无售货地点的介绍，除了显示一下商标外，完全没有对产品性能的说明。

假设有一家企业A开发出一种很有市场潜力的饮料，该产品饮后对人的健康确实有好处。但同时，另一家生产假冒伪劣产品的企业B也准备向市场推出一种伪劣产品饮料。两个企业都会向公众宣布其产品是上乘的，如何如何的好。但公众是理性的，不会仅凭商业宣传就相信它们。但是，如果产品真的好，随着时间的推移，消费者能够识别出来。所以，生产好饮料的的企业A对自己的市场有信心，它相信随着时间的推移，企业B生产的伪劣产品终究会被消费者识破，顾客会跑到自己这里来，从而自己的市场会不断扩大，销售收入及利润会不断增长，而企业B开始可以蒙骗一部分消费者，但时间一长，产品的问题会暴露出来，市场会不断缩小，收入及未来利润都不会有企业A的大。这样一来，企业A的未来预期收入远大于企业B。因此，如果企业A请一位当红明星打广告，由于是当红明星，他们打广告有很高的市场价格，就可以使企业B不敢模仿。譬如，假定企业A的预期收入为3千万元，企业B的预期收入为1千万元。当红明星打广告的市场价格为2千万元，那么，企业A可以请明星打广告但企业B就请不起。

消费者也明白这个道理，从而会在一开始就识别出不能请当红明星打广告的企业B是生产伪劣产品的。这样，企业B一开始就没有市场。当企业A请了当红明星打广告时，企业B发现这位明星的市场价格太高，自己难以模仿企业A，开始就会放弃生产伪劣产品的计划。所以，企业A通过请当红明星打广告而清除掉了潜在的市场模仿者，它向公众传递自己是生产好产品的信号，这种信号的价值在于其所请来的当红明星有着较高的出场价格，而不在乎明星在广告节目中说了什么，表演了什么，当然更无所谓广告节目是否介绍产品价格等信息了。企业A请当红明星打广告就为公众传递了它是生产好产品的企业的一个信号。然而，并不是所有产品都适用于做广告。对于低质量产品，消费者最多只会购买一次，如果做广告的成本高于产品一次销售所得的利润，这时低质量产品做广告就不合算。可见，较高的广告成本将屏蔽掉一部分低质量产品。如果广告成本高于产品第一轮销售所得的利润，又低于多轮销售所得的利润，那么高质量产品做广告将有利可图。从这个角度说，高成本广告中的产品应该是高质量产品。结果，广告作为市场信号，传递了高质量产品的信息。 5．所罗门故事与信息甄别

人们都知道垄断企业可以获得垄断的超额利润，然而许多垄断厂商并未如人们所料想的那样高价格销售商品，而是以低价长期销售某种产品。譬如，发达国家的私营铁路、航空、海运码头等的价格都长期远低于按照其垄断定价方法定出的价格。其实，这个问题的解决方法就是差别定价，比如飞机、轮船等设立头等舱、经济舱。

无论是买票乘飞机、火车还是轮船，不同的人所愿意支付的价格实际上是不一样的。有的人收入高一些，或对花钱看得比较松一些，就可以支付较高的价格，相反，收入低的人或对花钱看得比较紧一些的人，就只愿支付较低的价格。但是，如果你问他们愿意支付什么样的价格，他们都必定说愿支付较低的价格，因为既使有钱人有也会在同样服务下以低价购买划算一些。飞机或轮船公司为了将这些在经济学中被称为具有不同支付意愿的人区分开来，让能支付较高价格的人支付较高价格，就设计了一种信息甄别机制。所谓信息甄别机制，用专业的术语来说，就是委托人事先制定一套策略或设计多种合同，根据代理人的不同选择，可以将代理人区分为不同的类别，这就是信息甄别。与信号传递不同，信息甄别是通过委托人的信息决策来获取代理人的信息，从而减少信息不对称。这是减少逆向选择的又一种途径。通过这种机制在飞机、轮船公司就是设立头等舱、二等舱、三等舱，??等。这种机制发挥作用的道理是这样的，我们可以用著名的“所罗门王断案”的故事来说明。

所罗门王是古代以色列国的一位智慧、英明的君主。有一次，两个少妇为争夺一个婴儿争吵到所罗门王那里，她们都说自己是婴儿的母亲，请所罗门王作主。所罗门王稍加思考后作出决定：将婴儿一刀劈为两段，两位妇人各得一半。这时，其中一

位妇人立即要求所罗门王将婴儿判给对方，并说婴儿不是自己的，应完整归还给另一位妇人，千万别将婴儿劈成两半。听罢这位妇人的求诉，所罗门王立即作出最终裁决：婴儿是这位请求不杀婴儿的妇人的，应归于她。

这个故事讲的道理是，尽管所罗门王不知道两位妇人中谁是婴儿的母亲，但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的。所罗门王正是了解这一点，很快就识别出谁是婴儿真正的母亲。所罗门王的这种方法在博弈论中被称为“机制设计”，即设计一套博弈规则，令不同类型的人作出不同的选择，尽管每个人的类型可能是隐藏的，别人观察不到，但他们所作出的不同选择却是可以观察到的。观察者可以通过观察不同人的选择而反过来推演出他们的真实类型。

当飞机或轮船的舱位条件和价格完全一样时，不同支付意愿的人都会以最低价格买票，不会有人愿支付比别人更多的钱去买相同的舱位的票。于是，航空公司或轮船公司将舱位分成头等舱、二等舱等，价格稍有不同，当然服务也不同，就将不同支付意愿的顾客区分开了。

头等舱比其它较低等级舱位的价格高许多并不主要是因为它的服务要比其它舱位的服务好很多，而是因为那些坐头等舱的人的支付能力比其它舱位的旅客的支付能力要强许多，说白了，就是坐头等舱的人比坐其它舱位的人更有钱或更能花钱而已。但是，如果航空公司或轮船公司不对舱位作如此区分，即使是有钱人也不会愿意坐同样的舱位而支付比别人支付的更高的价格。这里，支付能力是旅客的类型，选择舱位等级是他们的选择。支付能力无法观察，但买什么舱位的票却能够观察，航空或轮船公司因此而识别出可以支付更高价格的顾客而赚取更多利润。譬如，有两位旅客A和B乘飞机。A的最高支付能力为1000元，B的最高支付能力为1500元。经济舱的服务成本为800元，头等舱的服务成本为1200元。

经济舱带给A和B的消费满足感为1000元，头等舱带给A和B的效用为1800元。如果没有头等舱，航空公司最多把票价定到1000元，利润为2×（1000-800）=400元。因为票价一旦高于1000元，A和B就不会买票了。但当设立头等舱后，航空公司将经济舱票价定为1000元，将头等舱票价定为1500元。此时，A以1000元买经济舱。

B如果买经济舱，则其净效用（也就是获得的消费满足感减去付出的代价的净值）为1000-1000=0，但当B买头等舱票时的消费者剩余或净效用为1800-1500=300元，所以B会买头等舱。A的支付能力只有1000元，所以甲只有买经济舱。这时，航空公司的利润增大为(1000-800)+(1500-1200)=500元>400元。

通过机制设计增大了公司利润，在商品市场上也存在同样的甄别方法。大家都知道，消费者为了自身利益有时也会隐藏自己的私人信息，从而出现消费者信息在买卖双方间不对称的情况。例如，同一种软件产品对于不同的消费者其效用是不同的。一般来说，企业用户对软件的最新版本需求较大，自然其愿意支付的最高价格较高；高校用户的需求较低，愿意支付的最高价格也较低；对于普通用户来说，也许继续使用早期版本同样可以完成工作，因而他们对软件最新版本的需求更低，愿意支付的最高价格更低。再如，客户的需求信息在供应商与客户之间是不对称的。客户知道自己的需求，而供应商不完全知道，因为高需求客户为了以更低的价格成交，往往会隐藏这种“其具有高需求”的信息。在这种情况下，差别定价方式可以甄别出不同需求程度的客户，从而使供应商可以获取尽可能多的利润（对于高需求客户以较高的价格成交，对于低需求客户以较低的价格成交）。比如，在推出一本新书时，通过提供精装本和平装本两种版本，出版商可以将读者分为两大类：一类对书的评价较高，另一类对书的评价较低；在提供电信服务时，服务商可以对手机用户提供两种收费标准：一种是单位时间通话费用较低但需交纳一定的月租费，另一种是单位时间通话费用较高但不需交纳月租费。根据用户的不同选择，服务商可以将用户区分为高频率用户和低频率用户两类。

对于前面提到的保险困境的问题，也可以采用差别保险合同的方式解决。如果有高风险和低风险两种类型的潜在投保人，而保险公司无法辨别。为了获取投保人的信息，保险公司可以提供给投保人两种可供选择的合同，一种是“高保费高赔付”，一种是“低保费低赔付”。显然，高风险投保人更愿意选择前一种合同，而低风险投保人则愿意接受后一种合同。这样一来，保险公司就可以从投保人的挑选中获得潜在投保人的类型信息，将两类投保人区分开来，从而降低了逆向选择的。第七章讨价还价的策略 1．从情侣博弈谈起

有这样一对热恋中的情侣，不妨称为男A和女B，他们都是工作繁忙的公司主管，下班的时候他们约好去看电影。男A想看战争片，对艺术片毫无兴趣；女B则想看艺术片，对战争片没有一点兴致。不妨用定量地来分析，假设男A看战争片的满意程度为10分，而看艺术片的满意程度为2分；女B看艺术片的满意程度为10分，而看战争片的满意程度也为2分；两人在一起看电影满意程度各会提高10分。这个时候，我们可以得到如下的图。

20 12

2 2

12 20

很显然，男女都要么都去看战争片，要么都去看艺术片，这两种情况达到了该博弈的纳什均衡。这个博弈还有一个特征就是，每一个参与者都不存在优势策略，因为不管是男A或是女B，都会发现自己的最优策略取决于对方的选择。如果男A选择看战争片，那么女B选择看战争片的满意程度最高；如果男A选择看艺术片，那么女B选择看艺术片的满意程度最高。男A的策略选择亦然。另外，这个博弈的两个纳什均衡点都达到了帕累托最优的结局。当处在两个纳什均衡点时，如果男A或女B改变他们的策略选择，导致的结果是让双方都不满意。

如果时间紧迫，双方来不及联系并且事先也没有商量好，每个人只好单独决定自己去看什么电影。这个时候，很可能会出现的情况是男A去看战争片，女B去看艺术片，更糟糕的情况是，男A和女B都很尊重对方意见反而各自去看对方想看的而自己不想看的电影，这时的整体满意程度只有4分。很明显的，尽管情侣博弈中的两个纳什均衡都是有效率的，但这个博弈的不确定性却导致低效率的情况可能发生。

当然，这对恋人约会看电影事先打个电话，商量好再约定看什么，这比双方不进行沟通而私自决断要好的多。比方说，情侣双方可以随便定个规则，如双方商议，在看电影的前一天猜硬币，谁猜中了就听从谁的意见。说到猜硬币，笔者想到在历史上，曾经发生过堂堂一朝宰相录用官员竟然用抽签的方式去决定，这实在荒谬透顶。假如这对恋人都是非常较真的人，根本就不可能用猜硬币的方式，而是强行承诺，比如男A是个大男子主义者，直接告诉女B他是一定会选择战争片，完全不会去看艺术片，如果这个女主角B是个柔顺的小女人，结果当然仍是达到纳什均衡：双方都去看战争片。女B用威胁的手段亦然。问题是，男A是大男子主义者，女B是女权主义者，双方都威胁对方不会去选择去看对方喜好的电影。这样的结果将达到次优，也就说无法达到帕累托最优的纳什均衡局面。好心办坏事，更糟糕的情况是，双方虽然在口头上严辞相对、威胁对方，但内心里反而是相互体谅对方，最后进行策略选择的时候反而都作出让步，各自选择了对方所爱看的电影。最终的结果很显然是效率最低的局面。

?更进一步地分析这个问题，男女恋人任意一方在谈判（男女双方对片子选择的协商本质上就是一种讨价还价的谈判）中承诺要看什么电影，关键是其可信度取决于作出诺言的一方是否证明，除了遵守承诺以外，其它的选择并不是更痛苦。比如说，女B能够向她男朋友A证明：即使她一个人独自欣赏艺术片，也能津津有味地享受电影的乐趣，获得极大的满足感。这个时候，女B所作的一定要看艺术片的承诺就是可信的。

但是，假设男A正在追求女B，男A对女B的依赖性就会增强，他要考虑如何让女B开心来获得她的欢心。反过来说，男A向女B提出要求的能力自然就下降了。生活当中就是这样的道理，所谓“吃别人的嘴短，拿别人的手短”，不同的人在一起合作，有求于对方的人在讨价还价的谈判中一定是处于劣势的。 2．先发优势与后发优势

为了更清楚的了解讨价还价的谈判，我们来看切蛋糕的故事。如果男女双方不是看电影，而是在切一块蛋糕，怎么才能保证分配的公平合理呢？很简单的一个方法，就是一方将蛋糕一切两半，另一方则选择自己分得哪一块蛋糕。不妨假设切蛋糕这种累活分配给男A，女B则在两块蛋糕中选择一块。很显然，男A在这种切冰淇淋蛋糕的规则下一定是努力让两块蛋糕切得尽量相同大小。这就是著名的最后通谍博弈（Ultimatum games）。然而在现实中，谁都不可能将两块蛋糕切得完全一样大，就算使用精密仪器去测量，用精密刀具去切割，这样做的成本太高，还不如用手去切。如果这个男A与其女朋友B都是个斤斤计较很小家子气的人，那么在这种规则下，男A分得的蛋糕一定是小的那块。

我们不妨假设，男A与女B都不愿意先去切这块蛋糕，于是又出现了另一种分配蛋糕的规则。不妨假设蛋糕总量为1，男A和女B各自同时报出自己希望得到的蛋糕的份额，如4/5，8/9。他们之间约定，两人所报出的份额相加总和必须等于1，否则从新分配。从数学上可以得到，这个两人博弈的纳什均衡点会有无数个，只要两人所报出份额相加为1的组合都是均衡结局，比如男A报1/2，女B报1/2；男A报2/3，女B报1/3,依此类推。这里的问题是在于如果女B报8/9，男A报1/9，这个时候男A也只有接收这个条件，因为这是一次性博弈，如果男A不接收那么双方连一丁点的蛋糕都分不到，从理性人的角度来看这显然不存在的。

在实际生活中，除了绝对的利他主义者，或者带有其它目的的博弈参与者，显然8/9的蛋糕归某一参与者，剩余的部分仅仅1/9的蛋糕留给另一参与者的情况是很难发生。就这个例子来看，男A一定不满足于只能分到1/9的蛋糕，他一定要求再次分配。这种情况下，分蛋糕的博弈就不再是一次性博弈。

事实上，当分蛋糕博弈成为一个动态博弈时，这就形成一个讨价还价博弈的基本模型。在经济生活中，不管是日常的商品买卖还是到国际贸易乃至重大政治谈判，都存在着讨价还价的问题。比如中国加入WTO的时候，为了国家或民族利益与许多发达国家的讨价还价，进行了漫长而又艰难的谈判。我们从这个漫长过程的谈判中可以发现，讨价还价的过程实际上就是一个谈判的过程，比如发达国家首先对中国提出一个要求，中国决定是接受还是不接受，加入中国不接受，可以提出一个相反的建议，

或者等待发达国家从新调整自己的要求。这样双方相继行动，轮流提出谈判要求，形成了一个多阶段的动态博弈。

我们先来看这样一个故事。在某个朝代有个破落贵族的后代A，穷困得实在没有办法过下去，不得不将家中主传的古字画拿到一个大财主B家去卖。这副字画在A看来至少值200两银子，财主B认为这副字画最多只值300两银子。这样看来，如果顺利成交，字画的成交价格将在200～300两银子之间。这个交易的过程不妨简化为这样：首先由B开价，A选择成交或还价。这个时候，如果B同意A的还价，交易顺利结束；如果B不接受，则交易结束，买卖没有做成。这是一个很简单的两阶段动态博弈的问题。

我们应该解决动态博弈问题的倒推法原理来分析这个讨价还价的过程。首先看第二轮也就是最后一轮的博弈，只要A的还价不超过300两银子，B都会选择接收还价条件。回过头来，我们再来看第一轮的博弈情况，A拒绝由B开出的任何低于300两银子的价格，这是很显然的，比如B开价290两银子购买字画，A在这一轮同意的话，只能卖得290两；如果A不接受这个价格反而在第二轮博弈提高到299两银子时，B仍然会购买此副字画。两项比较，显然A会还价。

细心的读者可以发现，这个例子中的财主B先开价，破落贵族A后还价，结果卖方A可以获得最大收益，这正是一种后出价的“后发优势”。这一优势在这个例子中相当是分蛋糕动态博弈中最后提出条件的人几乎霸占整块蛋糕。

事实上，如果财主B懂得博弈论，他可以改变策略，要么后出价，要么是先出价但是不允许A讨价还价，如果一次性出价，A不答应，就坚决不会再继续谈判来购买A的字画。这个时候，只要B的出价略高于200两银子，A一定会将字画卖于B。因为200两银子已经超出了A的心里价位，一旦不成交，那一文钱也拿不到，只能继续受冻挨饿。在博弈理论上，已经证明出，当谈判的多阶段博弈是单数阶段时，先开价者具有“先发优势”，而双数阶段时，后开价者具有“后动优势”。这在我们的生活中是非常常见的现象：非常急切想买到物品的买方往往要以高一些的价格购得所需之物；急切于推销的销售人员往往也是以较低的价格卖出自己所销售的商品。正是这样，富有购物经验的人买东西、逛商场时总是不紧不慢，即使内心非常想买下某种物品都不会在商场店员面前表现出来；而富有销售经验的店员们总是会劝说顾客，“这件衣服卖得很好，这是最后一件”之类的陈词滥调。 3．谈判的要诀:掌握对方心理与妥协

上一节中的博弈仅仅是模拟实际生活，实际上任何讨价还价的过程都不可能无限制地进行。因为讨价还价的过程总是需要成本的，在经济学上这个成本称之为交易成本。比如前面说的恋人之间是看战争片还是看艺术片的谈判所耗费的时间就是有成本，而恋人之间的争执对双方心理的伤害也是巨大的，这些成本往往远高于交易所带来的收益。事实上，很多家庭中夫妻感情破裂，情人分手，就是因为这种小事无法妥协而造成的。如果是恋人分手还好说，夫妻离婚随之而来的财产分割、小孩的处理等问题又将会引起耗费交易成本的讨价还价问题。

为了能够简单说明这种耗费交易成本的讨价还价过程，我们不妨假设男女恋人之间不是分配一般的奶油蛋糕，而是分配冰淇淋蛋糕。冰淇淋蛋糕会随着男女恋人之间的讨价还价过程而融化，不妨仅简单地认为被融化的那部分蛋糕就是这个讨价还价过程的交易成本。这时，讨价还价的过程和前面买卖古字画的过程相同：女士优先，第一轮由女B提出要求，男A接受条件则谈判成功，若男A不接收条件进入第二轮；第二轮由男A提出分蛋糕的条件，女B接受则谈判成功，女B不接受，于是蛋糕融化，谈判失败。

对于女B来说，刚开始提出的要求非常重要，如果她所提的条件，其男友完全不能接受的话，蛋糕就会融化一半，即使第二轮谈判成功了，也有可能还不如第一轮降低条件来得收益大。因此女B第一轮提出要求要考虑两点，首先要考虑是否可以阻止谈判进入第二阶段，其次，考虑她自己的男朋友是如何考虑这个问题的。

首先看最后一轮，蛋糕在第二阶段只有原先的1/2的大小，因此，女B在第二阶段即使谈判成功，也不只得到1/2蛋糕，而谈判失败则什么都得不到。从最后一轮再反推到第一轮，男A知道女B在第二轮时所能得到的蛋糕最多为1/2，，因此当女B在第一轮时只要占据的蛋糕大于1/2，他都可以表示反对将这个谈判延续到第二轮。女B对男A的如意算盘都很清楚，经过再三考虑，她在第一阶段的初始要求一定不会超过1/2的蛋糕大小。因此女方B在初始要求得到1/2个蛋糕时该谈判顺利结束，这个讨价还价的结果则是男女恋人双方各吃一半大小的蛋糕。

这种具有成本的博弈最明显的特征就是谈判者整体来说应该尽量缩短谈判的过程，减少耗费的成本。就分冰淇淋蛋糕谈判来看，就是尽量不让蛋糕融化太多。

我们再来看看当谈判有三个阶段时是什么样的结果。为了便于论述，不妨假设这个时候，蛋糕每过一个讨价还价的轮次就融化1/3大小，到最后一轮结束时由于过了两个谈判的阶段，蛋糕全部融化。动态博弈一般都是采用倒推法，从最后一个阶段看，即使谈判成功，女B最多只能得到剩下的1/3个蛋糕。男A知道这一点，因此在第二阶段轮到自己提要求时要求两人平分第一轮剩下的2/3个蛋糕。女B在第一轮时就知道男A第二轮的想法，于是在第一阶段刚开始提要求时，直接答应给男A蛋糕的1/3大小，男A知道即使不同这个条件，进入第二轮也一样是最多得到1/3个蛋糕，到了第三轮几乎就分不到蛋糕，因此男A一定会接受这个初始条件。这个三阶段的分蛋糕谈判最终的结果是男A分得1/3的蛋糕，女B分得2/3个蛋糕。

从数学上可以证明，分蛋糕博弈只要博弈阶段是双数时双方分得的蛋糕将会是一样大小，博弈阶段是单数时，后提要求的博弈者所得到的收益一定会好于先提出要求的博弈者，然而随着阶段数的增加，双方收益之间的差距会越来越小，每个人分得

的蛋糕将越来越接近于一半。如此看来，对于任何实际的谈判，谈判者要注意，首先采取后发制人的方法，根据对方的行动来行动；其二，尽量摸清对方的底牌，了解对方的心理，根据对方的想法来制订自己的谈判策略；其三，就是耐性，谈判者中能够忍耐的一方将获得利益，这一点凭借直觉可以判断，越是急于结束谈判的人将会越早让步妥协，或作出越大的让步，在前面分冰淇淋蛋糕的博弈中，如果考虑每一方谈判时间的价值，就可以在数学上严格地证明这一直觉的合理性。 4．独裁者博弈与劳资谈判

实际上，在前面的博弈案例中，都隐含了这么几个假设条件，首先博弈双方都是完全追求收益最大化的理性人，其次博弈双方都是处于均等且相同的地位。然而在实际生活中，参与博弈的双方不可能绝对的平等。比如，正常的恋人之间往往是女方先吃蛋糕，吃不下了才将剩下的蛋糕留给男方，这才像对如漆似胶、爱意浓浓的的恋人。再比如，对于国内的劳动力市场来说，由于人力过剩，雇员对老板的谈判地位明显是处于劣势。即使是在菜市场买菜，经济困难的人常常会与小贩一而再、再而三的讨价还价，而富人则山珍野味，一掷千金不在话下。

来看不平等条件下谈判博弈的一个经典案例，那就是独裁者博弈（Dictator games）。假想，一个独裁者与一个无权者之间分配一笔固定资产。讨价还价只能进行有限次，最后一次博弈的决定者理所当然是独裁者。按照理性人假设，自私自利的独裁者一定是独吞这笔财富。然而，从历史上来看，大部分的当政者并不会这么做。实际上，这个博弈的独裁者并不仅仅只是考虑资产多少，他还要考虑名誉、地位与统治的稳固与否。如果将这些因素都考虑成收益，从广义上来说，这样的独裁者仍然是理性的。可见，对于平民来说，收益可能仅是资产分得多少，而对于当政者来说，资产并不是其全部的收益。反过来说，仅仅考虑自身经济收益的当政者反而是非理性的人。

劳资谈判与独裁者博弈倒是有些类似。在劳动力市场上，劳动力价格是在综合考虑知识、技能、劳动强度等因素的基础上通过博弈机制来最终确定的。这一过程虽然并不能保证完全实现按劳分配，但确实是一种在现实中可操作的而且分配结果比较符合按劳分配原则的分配方案。掌握特殊技能的、技术好的或付出劳动较多的劳动者有条件得到相对较高的工资；而技术差、知识少、工作少的劳动者只能得到相对较低的工资。但劳动力市场的“按劳分配”是有局限的。劳动力市场在基本可以实现劳动者之间的“按劳分配”的同时，在买卖双方之间却存在系统性的不公平交易。为了说明这一问题，让我们先看看资本主义社会劳动力市场的情况。

市场决定劳动力商品价格的机制与一般商品市场是相同的，劳动力的成本就是生产这一劳动力所需的生活费用和教育费用。劳动力商品的使用价值很特殊，是产生价值，所以劳动力商品的价值也是可以用货币来量化的。劳动力市场上的卖方是劳动者，劳动者能够接受的最低报酬是劳动力的成本价值。如果仅得到这个价值，劳动者的生活将非常艰苦，仅够维持劳动力的再生产。劳动力市场上的买方是资本家，资本家能够接受的最高价格是劳动力商品的使用价值，如果按照劳动力使用价值成交，资本家将没有利润。交易之所以能够发生是因为劳动力的使用价值和成本价值之间存在差距，因而存在高于劳动力的成本价值而低于劳动力的使用价值的价格区间。最终，劳动力的实际价格将处于这个区间，具体为多少则由博弈机制决定。资本家所赚取的就是劳动力价格和使用价值之间的差价。

劳动力市场上买卖双方的不公平交易就产生于博弈环节中。在博弈中，作为卖方的劳动者自然要争取尽量高的工资，而作为买方的资本家为了获取更多的利润也要尽量压低工资，这是可以理解的。问题在于，从博弈的观点看，劳动力市场上买卖双方在博弈中的地位是不平等的。资本家先占有了商品交易过程中实现的全部价值，再由他决定分配，而劳动者则只能被动的选择接受或不接受这份工作。资本家在博弈中处于较有利的地位，而劳动者处于不利地位。在这种情况下，资本家可以出这样一个价格：与劳动者的贡献相比明显偏低，但是比他在别处可能得到的工资略微多一点点。此时，劳动者将面临这样一个处境：自己得到的报酬低于自己的贡献，但如果不接受这个价格，则得到的将更少，甚至什么都得不到。从博弈角度讲，虽然这个价格并不公平，但此时最明智的选择还是接受这个价格。

所以，即使不考虑在现实博弈中资本家还经常可以利用劳动者的其他弱点扩大胜利，就像在零和竞局的股市中庄家照样可以利用散户的弱点获利一样，仅仅博弈地位的不平等已经足以让资本家得到一个有利的价格了。取得这个价格用不着特殊的博弈技巧，因为这是博弈地位本身提供的。这种不公平的报酬体现了资本家对劳动者的剥削。第八章如何做好一个老板 1．管理需要建立预期

很多人都认为：在计划经济时代，企业员工缺乏激励，偷工减料，效率低下，因为都是吃大锅饭没有足够的动力；而在市场经济下，企业有赚取利润的驱动力，自然企业都会努力降低成本，提高效率以赚得更多的利润。实际上，即使在市场经济体制下，企业员工业并不都是个个勤奋，人人努力。一般的企业领导人采用的不过是古已有之的胡萝卜加大棒的方法来统驭下属。管理学家孔兹对领导的界定是：“领导可定义为影响力。它是影响他人，并使他们愿意为达成群体目标而努力的一种艺术或方法。这种观念可以更扩大到不仅是使他们愿意工作，同时也愿意热诚而有自信地工作。”其中最关键的理念是“影响他人使他们愿意为达成群体目标而努力”。管理者为了对组织的目的负责，达成企业“群体目标”，必然用一种艺术或方法去影响被领导者，使之愿意工作，甚至是热情而自信地工作。

对于下属来说，管理者的信用、权威必须要通过管理者长时间发给下属的各种信号与相互之间的良好交流才能达到。比如

一个民营企业的老总若要建立起良好的名誉，必须乐意给下属高出劳动力市场上一般的福利待遇，让下属认识到企业对员工的关心与认可。

权威本身也要具有伟大的人格，优良的品质和出众的才能。权威并不是脱离群众的，他也要采纳群众的意见。只有部属能尊重上司的权威，而上司也能采纳部属意见的公司，一切才可以顺利推动。

管理者与员工交流能够大大提高领导者建立信誉的能力。如果员工发现分享管理者的私人信息和代价很高的努力是值得而理性的，这种信任就是必不可少的。管理者若无法得到员工的尊敬，上下级之间就会相互猜疑，信息沟通极少。用于尊敬员工以及敢于谈论他们自身缺点的领导者将赢得下属的尊重。一旦员工信任并尊敬一个管理者，真正的进步就成为可能。

管理者应该能够帮助员工建立对未来的预期。对未来的预期，是影响员工行为的重要因素。预期分为预期收益和风险，也就是员工这样做将来会有什么好处，同时这样做又可能面临的问题。这些将影响员工个人的策略，如员工是否会将精力真正的投入到企业的成长中。

有这样一个有趣的故事。一只绰号叫“无敌手”的猫打得老鼠溃不成军，最后老鼠几乎销声匿迹了。残存下来的几只老鼠躲在洞里不敢出来，几乎快要饿死。“无敌手”在这帮悲惨的老鼠看来，根本不是猫，而是一个恶魔。但是这位猫先生有个爱好：喜欢向异性献殷勤。

有一天，这只猫爬得又高又远去寻找相好。就在它和相好癫狂时，那些残存的老鼠来到了一个角落里，就当前的迫切问题召开了一个紧急会议。一只十分小心谨慎的老鼠担任会议主席，一开始它就建议必须尽快地在这只猫的脖子上系上一只铃铛。这样，当这只猫进攻时，铃声就可以报警，大伙儿就可以逃到地下躲藏起来。会议主席只有这么个主意，大伙儿也就同意了它的主张，因为它们都觉得再没有比这个主张更好的建议了。但问题是怎样把铃铛系上去。没有哪只老鼠愿意去栓这个铃铛。到了最后，大伙儿就散了，什么也没做成。看来，给猫系上铃铛无疑是一个绝妙的主意，但对于一群已经被吓破胆的老鼠来说，这个主意意味着只是无法实施的美好梦想而已。在企业中，也是一样的道理。

对于一个管理者来说，应该本着务实的精神，制定切实可行的计划，让他的团队有一个可以实现的目标，而不是做出一个不可能实现的决定，同时管理者要对这个目标做出承诺。在承诺的同时，上级下之间要能够相互沟通，建立一个交流网络来寻求共同的价值观与信念。同时，管理者能够以身作则，以自己的个人行为作为员工学习的典范。

许多公司现在也开始在一些社会议题上彼此互相合作，同时也透过一些公有与私有合伙关系的重组，以及制作各种保护环境，改善教育水准，发展提升医疗保健等计划，来回馈社会。在这里，就有许多机会，可以吸引各行各业以及各层面的优秀分子的注意。

通过领导者自己与下属之间的“互动过程”，有效地协调了子系统之间的竞争与合作关系，树立了领导权威，促进了系统的有序化，这才是现代领导的本质所在。显然这种领导权威不是领导者个人素质的单独结果，而是领导者与下属双方相互作用的结果。这也是有别于传统的新理念。

在中国企业发展的进程中，管理者更应该从博弈论中学习到发挥更大作用的方法与技巧。当然，由于职业化管理的条件不成熟，因此，企业家主导经营管理的管理模式还将一直持续相当的时间。 2．奖罚分明兵法上说，“用赏贵信,用刑贵正。”从我国企业的实践来看，对员工的管理激励与约束机制还没有很好地建立起来。如在一些企业中，不仅缺乏有效的培育人才、利用人才、吸引人才的机制，还缺乏合理的劳动用工制度、工资制度、福利制度和对员工有效的管理激励与约束措施。当企业发展顺利时，首先考虑的是资金投入、技术引进；当企业发展不顺利时，首先考虑的则是裁员和职工下岗，而不是想着如何开发市场以及激励职工去创新产品、改进质量与服务。

我们不妨先从一个例子入手，来看企业如何制订有效的激励制度才可以有效的驱动员工工作。设想有一家游戏软件企业老总，打算开发一种新的网络游戏，不妨叫做“大话水浒”。如果开发成功的话，根据市场部的预测将得到2000万人民币的销售收入。如果开发失败，那将是血本无归。而企业新网络游戏的成功与否，关键在于技术研发部员工是否全力以赴、殚精竭虑来做这项开发工作。如果研发部员工完全投入工作，有80％的可能，这款游戏的市场价值将达到市场部所预测的程度；如果研发部员工只是敷衍了事，那么游戏成功的可能性只有60％。

研发部全体员工在这个项目上所获得的报酬如果仅有500万元，那么这些员工对于这款游戏的激励不够，他们都是得过且过，敷衍了事。老板要想让这些员工得到高质量的工作表现，就必须要给所有员工700万元的酬金。

这样的话，如果老板仅付500万总酬金，那么市场销售的期望值有2000万?60％＝1200万元，再减去500万的固定酬金，老板的期望利润有700万元。如果老板肯出700万的总酬金，则市场销售的期望值有2000万?80％＝1600万元，再减去总酬金700万，老板最终的期望利润有900万元的剩余。

然而困难在于，对于研发部的员工，老板很难从表面了解到这些员工在进行工作时到底有未敬忠职守，兢兢业业地完成任务。即使给了全体员工700万的高酬金，研发部员工也未必就尽心尽力地完成这款游戏。由此看来，一个良好的奖罚激励机制对于企业极其重要。

公司最好的方式就是若是游戏市场反映良好，员工报酬提高，若是不佳，则员工报酬缩减。“禄重则义士轻死”，如果市

场部目标达到，则付给全体研发人员900万元，若是失败，则让全体研发员工付给企业100万元的罚金。这种情况下，员工酬金的期望值是900万?80％-100万?20％＝700万元，其中900万元是成功的酬金，成功的概率为80％，1万元则是不成功的罚金，不成功的概率为20％。在理论上，采用这样的激励方法会大大提高员工工作的努力程度。

从某种意义上来说，这种激励方法相当于赠送一半的股份给企业研发部员工，同时员工也承担游戏软件市场失败的风险。然而这种方法在实际中并不可行，因为不可能有任何一家企业能够通过罚金的方式来让员工承担市场失败的风险。可行的方法就是，尽量让企业奖惩制度接近于这种理想状态。更加有效的方法，就是在本质上类同于奖励罚金制度的员工持股计划。我们可以将股份中的一半赠送给或者销售于研发部的全体员工，结果仍然是和罚金制度是相同的。

通过这个例子，我们可以看到，员工工作努力与否与良好的激励机制密不可分。然而我们现实中的很多公司却不明白这个道理。比如很多公司的奖惩制度上写着：“所有员工应按时上班，迟到一次扣10元，若迟到30分钟以上，则按旷工处理扣50元。”国外有弹性工作制，即不强求准时，但是每天都必须有效地完成当天工作。笔者认为，即使有人迟到、早退、被扣除工资，但是在实际工作中很有可能并不是努力工作，其因扣除工资而产生的逆反心理导致的隐性罢工成本反而有可能高于所扣除的工资。从表面上看，老板似乎赚得了所扣工资的钱，实际上是损失更多。可见，这并不是一个有效的奖罚激励制度。再比如有的公司规章条例写着：“公司所有员工应具有主人翁意识，应大胆向公司领导提出合理化的建议，可以直接提出也可以以书面形式提出，若被采纳后奖励50元。”笔者试问，不同的合理化建议对公司所创造的效益是不同，假设一个人所提建议可以提高效益5万元，另一个人所提建议则只能提高效益500元，都用50元的奖金来进行物质激励，其条例本身明显就不是合理化的制度。

总而言之，一个良好的奖惩制度首先要选择好对象，其次要能够建立在员工相对表现基础之上的回报，简单的说，就是实际的业绩越好，奖励越高。只有这样的奖罚分明的制度才能够对员工创造出合适的激励。 3．强强如何有效联合？

一个企业按照系统论的说法，是一个开放耗散结构系统，与外部环境不断发生联系与交换，如寻找供应商采购，寻找销售商销售，在企业外部招聘员工，和其它企业进行合作等。在企业合作推出品牌的例子中最著名的莫过于1990年4月，由安徽省烟草专卖局（公司）大力推荐，国家烟草专卖局（总公司）出面牵线搭桥，英美烟草（香港）有限公司与芜湖卷烟厂的合作。1991年，双方合作生产的“都宝”牌卷烟非常顺利地占领了首都市场，成为北京的畅销品牌，并远销内蒙古、河北等18个省市自治区。

一般来说，两家企业达成合作协议，推出双方共同拥有的新品牌，就意味着在很大程度上，合作双方开始相互依赖。没有任何一方可以在不牺牲自身利益的情况下回到原来独立经营的轨道上去。芜湖烟厂与英美烟草合作的都宝就是这样，如果其中有一方放弃合作，希望从对方身上榨取好处，整个合作的进程就会中断，造成许多不必要的损失。

我们不妨认为，英美烟草公司的技术水平要高于芜湖烟草，而芜湖烟草本土化的营销手段与网络则是英美烟草所缺乏的。因此，英美烟草与芜湖烟草之间的合作主要是英美烟草提供技术，而芜湖烟草开发市场。设想英美烟草支持芜湖烟草的技术开发分为低技术开发与高技术开发两种，技术开发成本分别为9000万人民币与1.5亿人民币；芜湖烟草上新生产线的投入也分为低投入与高投入两种，开发成本分别为1.8亿人民币与3.0亿人民币。因此，我们可以得到双方合作的总成本有四种可能，见下图。

3.3亿 2.7亿 4.5亿 3.9亿

不妨双方合作都预期到，都宝香烟的市场利润在一年内可以达到3.9亿人民币的利润。双方都以一年内收回成本为目标，但赚取多少钱并不在考虑之列，主要是试探性地进行这个项目。很显然，芜湖烟草高投入上生产线，英美烟草采用高技术投入，此时的总成本达到4.5亿，明显一年内这个合作项目的成本无法收回。

我们不妨假定合作双方采用两种策略的概率都是1/2，由此，双方总成本为3.3亿、2.7亿、4.5亿和3.9亿的概率都是1/4。那么，双方总成本的期望值为（3.3亿+2.7亿+4.5亿+3.9亿）?1/4＝3.6亿元，因此双方的预计利润为3.9亿-3.6亿＝0.3亿元。那么在英美烟草与芜湖烟草进行合作协商的时候，就要考虑到项目启动成本是否高于0.3亿元。这个例子中的项目启动成本包括双方谈判成本、人员培训成本、沟通成本等。如果项目启动的初期投资超过3000万，双方就没有合作的可能性，项目自然被否定掉。

在企业的实际合作中，最大的困难并不是作出这样的预期，关键在于每个企业是否真实地提供自己所负担的投入成本。比如这个例子中，英美烟草可以将其技术开发成本报为最高的2.5亿元，芜湖烟草报为最高的3.0亿。这种情况下，很明显合作双

方的项目第一年的目标无法达到，更谈不上弥补先期的项目启动成本。自然，项目只会泡汤，双方无法达成合作。

看来让两个公司有效地合作一个项目，并不是一个简单的事情。我们不妨采取这样一种策略：加入芜湖烟草决定将合作项目继续下去，它必须要补偿英美烟草的成本，然后保有余下的利润。无论双方的成本总和是不是低于利润目标，芜湖烟草都将决定继续下去，它的收入为总收入减去自身上新生产线的成本，再减去对英美烟草的补偿之后的剩余。

双方不妨同时宣布自己投入的成本，并且在总成本低于利润目标的前提下，项目才能进行下去。对于芜湖烟草来说，补偿英美烟草成本的剩余利润必须要高于它实际付出的成本，它才能继续这个项目。由此看来，芜湖烟草最好的作法就是报出真实的投入成本。如果芜湖烟草所报的是虚假数字，很有可能这个项目就无法进行，芜湖烟草就失去了一个赚钱与技术更新的好机会。因此，芜湖烟草报出真实成本是一个优势策略。

同理，这种激励机制当然也可以用在英美烟草身上，报出真实成本自然也是英美烟草的一个优势策略。

然而，这种方法的局限在于，不管用在哪一方身上，都只能保证其中一方报出的是真实成本，无法约束另一方也是说真话。为了让双方都能够真实报出真实成本，在设计合作协议的时候是最重要，这份协议要能够激励两家公司都报出真实成本；这份协议要有确保有效继续项目或取消的决策。能够让大家精诚团结的协议，就是要使公司将它们通过自身行动加在对方身上的成本考虑进去。比如在这个例子中，一旦公司夸大自己的成本，项目不得不取消，反而自己所获收益减少。 4．如何接到一个项目？

很多公司，尤其是工程公司的项目，都是通过公开投标的方式来获得。随着我国政府办公公开化、透明化进程的不断加快，政府项目公开招投标方式的应用也会越来越广泛。

在招投标中，最常见的是片面的、无标底的“最低价中标”。项目招投标可以通过竞争性的公开一次性报价，选择报价最低者中标，以达到降低投资的目的。有这样一个故事，称为“旅行者困境”就说明了这种方法的好处。这个故事说的是有两个旅行者A和B从一个以出产花瓶的著名旅游胜地回来时，他们都买了花瓶。提取行李时，发现花瓶被碰破了。他们向航空公司索赔。航空公司估计花瓶的价格在80～90元的价位左右，但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内自己写下花瓶价格。若两人写的相同，说明他们说了真话，就照他们写的数额赔偿；如果两人写的不一样，那就认定写得低的旅客讲的是真话，按这个低的价格赔偿，但是对讲真话的旅客奖励2元钱，对讲假话的旅客罚款2元。

如果两人都写100元，他们都会获得100元。但是，给定B写100元，A改写99元，则他会获得101元。B又想，若A写99元，他自己写98元，比写100元好，因为这样他获100元，而写100元当A写99元时自己却只获97元。而给定B写98元，A又会写97元，??这样，最后落得每人都只写1、2元的境地。当然这个博弈是一种理想状况，实际的企业招投标往往都有一个成本底线。

比如现在有一个政府项目，是公开招标选择网络公司建立政府网，某公司是投标者之一。对于这个公司来说，根据过去的经验能够预算出接手这个项目的真实成本是100万人民币，然而这个公司并不了解其它竞争对手的真实成本。该公司根据市场行情推断，其他公司的真实成本在50万～150万元之间。从概率的角度去看，在50万～150万之间的任何一个价格都有可能是最终的胜利者。我们简化这个问题，假设每个公司的成本只能是50～60万、60～70万、??120～130万、130～140万、140～150万这样的整数，总共有10种可能，因此最终获得胜利的公司落在这10种价格区间中的任何一个的概率是1/10。

如果这个公司报价90万，很显然，公司即使胜出，仍然要亏本10万元，看来100万的报价是底线，低于这个价格的报价对于该公司毫无意义。当然这只是这一机制的理想状况。实际当中，如果价格低于成本，破坏了市场均衡，毫无疑问会影响项目质量，不但损害中标者利益，最终还会损害招标政府自身利益。

自然从理论上说，该公司投标报价一定要高于100万元，不妨假设报价120万，根据这10种价格的概率，其他公司报价低于120万该公司惜败的概率是3/5，即使开价100万，该公司不能中标的概率也有2/5。当然开价120万胜出时可以赚取20万利润，而开价100万时即使胜出也仅仅是能够弥补成本而已。由此可见，开出一个较高的价码是该公司的优势策略。每一个投标公司都这么考虑的话，所有公司的报价都会高于实际成本，结果就是所有的开价都被人为抬高。

如何让公司投标报价接近于真实成本的问题关键在于采用某种激励机制来驱动投标者不说谎。比如这里有这样一种激励方式，就是将合同判给开价最低者，但是却让他付开价第二低者的价格。这个时候该公司如果开出的还是120万的报价并且时第二低的价码，而另一家公司开出的价格比这个公司要低，比如是低于该公司成本价的90万元，该公司最终的价格120万反而成了这个胜出公司的最终项目价码。在这种招投标方式下，任何一个公司的优势策略就是开出一个接近其真实项目成本的价格。按照博弈论的观点具体分析招投标行为我们还可以发现：就象博弈的参加者独立决策、独立承担后果那样，投标各方也如同分别隔离审问，而不能串供，是处于“两难困境的囚徒”，各家只能依据自身实力、期望利润和所掌握的市场信息，自主报价，独自承担风险。

不难看出，机制设计的关键是如何让每个公司的报价有利于集体选择，并最终达到“纳什均衡”。这里其实靠的是两个制度安排。其一是阻止公司之间的合作，其二是制订了一套“坦白从宽，抗拒从严”的赏罚规则。可见在招投标的机制设计中，通过博弈竞争使中标价接近成本价，达到均衡合理，为招标人节约投资，提高经济效益；通过优胜劣汰，使市场竞争力低下的投标人无力参与竞争而退出市场，让有实力的投标人脱颖而出，使资源达到均衡配置，市场秩序得以规范。

第九章民主的悲剧 1.社会选择的形式

人类社会一经出现便存在者社会选择的问题，如重要职位的人选、政策的制订甚至是国家政治体制的确定等。一般来说，这些问题的解决主要有4种方式，即社会传统习惯、个人或集团的专制独裁、投票表决和看不见的手的市场机制。

传统习惯可以是社会的风俗习惯乃至宗教法规等包罗甚广的惯例。如我国古代的以孝治天下的王朝就是以孝道这种社会习俗作为整个国家大政方针制订的原则与标准。从中世纪欧洲各国的宗教裁判所到当今中东国家的政教合一，都是典型的根据神的意志也就是宗教法规来进行社会性选择。

独裁专制是由个人或少数人集团对社会进行统治，按照个人或少数人集团的意志进行行政管理并代替公众进行社会性选择。中国长达2000多年的封建专制统治的本质就是以独裁方式进行社会选择，各个封建王朝的更迭不过是“皇帝轮流坐，明天到我家”换汤不换药的独裁权力交替而已。中国几千年的独裁专制统治并不是天上掉下来的，而是有其深刻的历史、地理、文化原因的。先哲马克思认为，水利灌溉在亚洲地区的生产方式当中占有重要的地位，“气候和土地条件，特别是从撒哈拉经过阿拉伯、波斯、印度和鞑靼区直至最高的亚洲高原的一片广大的沙漠地带，使用水利工程的人工灌溉设施成了东方农业的基础。”亚洲高原干旱的自然环境，与沙漠地带是几近相似的。这使得兴修水利灌溉渠道成为亚洲农业生产方式的首要条件。治水产生了公共行政管理机构。马克思说：“那些通过劳动而实际占有的公共条件，如在亚细亚各民族中起过非常重要作用的灌溉渠道，以及交通工具等，就表现为更高的统一体，即高居于各小公社之上的专制政府的事业。”亚洲社会的政府起源于兴修灌溉的需要。因为灌溉渠道工程的规模之大，决不是局部的生产机构或个人所能够进行和完成的，必须由能够跨越地区和个别组织的社会公共机构来承担，所以只能是“专制政府的事业”。这正如马克思所说：“但是在东方，由于文明程度太低，幅员太大，不能产生自愿的联合，所以就迫切需要中央集权的政府来干预。因此亚洲的一切政府都不能不执行一种经济职能，即举办公共工程的职能。”亚洲社会的公共权力机构由治水而产生，因此其产生的公共权力机构不是议政机构，而是作为行政机构的政府。行政本位而不是议会本位，才是亚洲国家政治机构的基本模式和特征。

德国学者卡尔·威特福格在1957年出版了《东方专制制度》一书，试图就马克思的理论提出了“水利文明——水利垄断——水利官僚制”的观点。他认为对灌溉用水进行控制和集中管理是亚细亚生产模式和东方专制制度的基础。这种模式在埃及、两河流域、印度、中国等都发生过，它所造成的中央专制是国家、城市、手工业和文字的起源，也是社会停滞不前的基本原因。独裁专制一旦与传统习俗相融合，社会往往就僵化成铁板一块，文明的发展将停滞。中国传统文化是以儒家为代表的。儒家亚圣孟子说过，“民为贵，社稷次之，君为轻。”按理说，这是典型的民主思想。在中国源远流长的历史中，闪烁着无数这样可贵的思想火花，在中国文化习俗中也包含这种民主思想的萌芽。在这种传统思想的影响下，历朝历代的王朝法律中也白纸黑字的写着类似于“王子犯法与庶民同罪”的条款。似乎中国古代就有了法律面前人人平等的观念。然而这些法律法规只能由上层少数人的统治集团作出明确解释，这些掌握解释权的人就成了以天地良心为幌子的事实上的独裁者。正如柏杨先生所说：“中国古代统治者也爱护人民，也喜欢人民，也需要人民。可是，他和人民的关系，他是用什么心态来保护人民呢？他用一种‘我是牧羊人，你是羊’那样的心态。所以，古代的‘民主’的观念，爱护人民的观念，是统治者作为一个牧羊人的姿态来爱护他的羊。基督教里面有所谓‘耶稣是我的牧者’。为什么耶稣是我的牧者呢？耶稣等于是牧羊人，那么我呢？是他的羊。如果一个人是羊，一个人是牧羊的，这种关系不是民主关系。它指的是民本，民为邦本，是本，人本关系，而不是民主的关系。”

在西方资本主义社会，社会选择的方式则又有两种，那就是投票制度与市场经济。投票制度往往用于政治决策，市场机制毋庸多言即用于经济决策。在德国、法国以及北欧诸国，投票制度使用范围极其广泛，常常直接或间接地通过投票作决策而较少采用市场机制，难怪很多人将这些国家称为社会市场经济国家，或福利国家。实际上，市场机制是投票的一种特殊形式，市场机制中人们手中的选票就是货币。 2.非排序式投票

大家都知道，原始社会时，部落内部的重大事务，如各个部落的酋长与部落联盟之间的统领都是通过投票表决的方式完成的。马克思称这种社会形态为“原始共产主义”。可见，投票表决是一种古老的表达民意的制度。最近湖南台的“超级女声”冠亚季军的产生则是通过短信投票的方式评选出的，经常上新浪（www.sina.com）或搜狐（www.sohu.com）的网民们经常会看到这些网站会在通过网络投票方式就某一问题调查人们的意愿。投票在当代中，已经成为我们生活中必不可少的要素之一。

投票制度最根本的思想是少数服从多数。或者说，通过投票制度，绝大多数人的意愿得以表达，当然这要建立在投票者确确实实的表达了自己真实意愿的基础上。在这个前提条件下，投票的过程又分为投票和计票。投票涉及到所有投票者，有些时候比如政治选举，投票者人数太多，容易产生混乱局面，这就要求投票的过程应该尽量简捷快速。计票和投票不同的是，其参与者是少数人，如公共管理的专家和政府公务员等。计票过程则要求计票人不能徇私舞弊，计票数据真实可靠。

一般来说，投票分为两种方法，非排序式投票与排序式投票。在2004年美国小布什与戈尔两人在最终的总统竞选中，采用的就是非排序方法的计点式选举，这种方法式有多个候选人参加选举，每个投票人只有一票，并且以无记名投票方式给自己喜好的总统候选人投上“神圣”的一票。这种方法的计票方式式最简单的多数票法则，也就是获得票数较多的候选人当选。

当候选人的数目超过两个人时，这种方法就不可靠了，这时，往往采用两种方法：其一，得票最多的候选人获胜，这叫简

单多数法则或相对多数法则，有的时候采用半数代表制时，候选人必须要获得1/2以上的选票才算胜出。其二，采用二次投票或反复投票表决等方法来产生获得半数选票的人选。二次投票法规定，在第一次投票后若无任何候选人获得半数选票，则应对在第一次投票中得票最多的两个候选人之间进行第二此投票，从中选出一位得票超过半数的获胜者。反复投票表决法对每次投票表决中候选人的人数不做规定，而希望得票太少的候选人自动退出竞选，或由投票人因自己原先所支持的候选人得票太少，当选无望，转而支持其它得票较多的候选人。就这样，投票反复进行，直到产生某个得票超过半数的当选者为止。美国共和党和民主党选举总统、副总统候选人时就采用这种方法。如在北京申办2000年奥运会时，前几轮都是北京遥遥领先，但在最后以一票之差惜败于悉尼，当时所采用是取舍表决法。这种方法规定在第一次投票后若无过半数者，就将得票最少者淘汰，对其余候选人则进入下一轮投票，如此继续不断直到产生过半数的候选人为止。

这种不具有投票人偏好排序的方法是由内在缺陷的。所谓偏好，就是说在现有苹果、香蕉、桔子，你喜欢吃哪一个，比如说有的人最喜欢吃香蕉，其次苹果，再次桔子，而有的人则是最爱吃苹果，其次桔子，再次香蕉。这就是他们的偏好不同。我们来看一下中国申办2000年奥运会失败的例子。北京1992年开始大张旗鼓、志在必得地申请主办2000年奥运会。申办奥运会的投票规则是取舍表决法。前两轮投票中北京一直领先。经过两轮投票，最后剩下3家：德国的柏林、澳大利亚的悉尼以及中国的北京。在第三轮投票时，北京获得最多的票，悉尼第二，柏林第三。这一轮投票结束后，柏林被淘汰掉。如果就这一次投票，北京就获胜。但问题是还得再投一次票。当在北京与悉尼之间角逐时，北京输了，悉尼获得了举办2000年奥运会的主办权。之所以这样的原因就是原来支持柏林的投票人大多数转而支持悉尼。这就是悉尼获胜的原因。没有人敢说这是公平的投票方法，这种不公平的内在原因正是非排序的投票规则不反映投票者的偏好排序。

再比如，2000年台湾所谓“总统”选举的结果是民进党的陈水扁上台，台湾第一大党国民党输给了弱小的民进党。这次选举是汉贼李登辉“弃连保扁”阴谋得逞的结果。李登辉做国民党主席时，主张统一的宋楚瑜被李登辉开除出党。宋楚瑜原来是李登辉政治上坚强的合作伙伴，因为他的资历，他得到大批的国民党党员的拥护。李登辉与宋楚瑜分道扬镳使得宋楚瑜另立山头，成立了新党。国民党被李登辉肢解。

李登辉推出连战作为国民党的“总统”候选人，但是身为国民党主席却在不同场合下支持陈水扁，使得民进党得以快速发展。“总统”的竞争最后在宋楚瑜、陈水扁、连战以及独立候选人李敖四者之间角逐。最后，陈水扁以微弱优势获胜，而宋楚瑜和连战均告失败。如果李登辉不耍“弃连保扁”的政治伎俩，或者维护国民党的统一而不使其分裂，使得国民党只有一人参加竞选，那么支持宋楚瑜加上连战的总票数肯定超过陈水扁。

另外一种情况是，假如台湾选举不是直选，选举规则是先角逐出两个而不是多个候选人，然后再在这两个候选人之间进行竞选，会出现什么结果呢？我们可以看一下，假定陈水扁能顺利过第一关而成为两个候选人之一，而宋楚瑜、连战有一个成为候选人，假定是连战，在连战与陈水扁之间的最后角逐中，支持宋楚瑜的选民这次会支持连战——因他们的政治主张相近，那么连战获胜的机会肯定大于陈水扁。但是事实上不是这样，选举中各候选人同时竞选，国民党因分裂而使陈水扁得以上台。以上所说的都是投票选出一个人的情况，当投票要选出两人或多人的投票表决就不能应用简单多数原则。一般说来，有以下几种投票方法。

一次性非转移式投票表决方法，这种方法规定每个投票人只有一票，用无记名投票方式，按照简单多数法确定当选者。在日本议员选举中采用的方法就是这样，在若干个候选人中根据得票多少排序，选取其中的前几位当选。复式投票表决。在选举中要产生多少当选者，每个投票人就可以投多少张票，但对每个投票人只能投一票。但是这种方法有一个巨大缺陷，由于一个人有多张选票，选票具有了放大效应，就是在投票中，当各利益集团的实力相差不大，利益冲突却白热化时，很有可能所有当选者都集中于实力稍强一些的某个集团。比如，在投票时，有两个利益集团，其中一个利益集团的派别可获得稍微超过50％的投票人，当选人就将全部选自这个集团。显而易见，这种投票方式的效率是不高的。为了克服这种方法的缺陷，又出现了受限制的投票表决方式。这种方法规定每个投票人可以投的票数必须小于当选人数。在1868年英国大选中，这种方法被实际应用，可惜的是最终却以失败而告终，该方法仅仅稍稍改进而无法从根本上克服复式投票方法的缺陷。

其实这些非排序的投票方法很容易被某些野心家所操纵，非排序投票的任何一个法则都不能保证人民当家作主的真正实现。假设有一个由3000人组成的原始部落，对部落酋长候选人A和B进行选举，并假定进行一次性投票，此时有2/3的人反对A而选举B，1/3的人选A而不选B。我们完全由办法设计另一个制度，通过“民主”的投票规则使A能够当选。

假定大家都同意服从大多数原则，但程序可以商量。我们把这300人构成3组——这3组既可以天然地形成，也可以设计。每组中候选人获得该组的大多数选票，他就赢得这组的选举，3组中赢得2组即赢得大多数，就算赢了。我想，在实际中这些是任何候选人都能同意的，并且也认为是公平的。我们假定每组的人数不是一样的：第一组是50人，第二组是100人，第三组是150人——我们这里人数的确定完全是随意的。假定第一组中有30人赞成A而反对B，第二组中有60人赞成A而反对B，第三组中10人赞成A而反对B。即：第一组A与B的比例是：30∶20；第二组A与B的比例是：60∶40；第三组A与B的比例是：10∶140。

在这样一种规则下进行投票，A获得了3组中2组的赞成票。A获胜。在这个例子中，如果不分组就选一次，那么B肯定获胜。这个例子中，使B获胜的是直选机制，使A获胜的是间接选举机制。台湾采取的是前者，美国采取的是后者。

本文来源：https://www.bwwdw.com/article/hlcg.html

相关文章：

正在阅读：

发生在我们身边的博弈04-27

学校后勤工作心得体会03-31

2022军训的收获与感悟300字15篇03-24

郑码输入法字根表02-09

《汽车理论》课程标准01-21

新人教版五年级数学下册教案及教学反思05-25

给教师的建议读书心得感悟07-17

党员要加强党性修养、作风养成、纪律遵行03-08

CPA考试会计科目学习笔记-第十一章收入、费用和利润0107-19

驯龙骑士观后感12-11

上一篇：第八章主要组织相容性抗原下一篇：桂林污水管施工专项施工方案