首页资料文库正文

博弈论的概念十篇

时间：2023-08-16 17:39:24

博弈论的概念

博弈论的概念篇1

本文以进化博弈理论的基本均衡概念----进化稳定策略的提出、发展及不断完善为主线，在指出原初概念缺陷的基础上，文章从非对称博弈、有限群体、随机因素及动态过程四个方面分别介绍了博弈论理论家们对该概念的拓展。

关键词：进化稳定策略；渐近稳定性；严格N群体ESS；随机稳定集；群体稳定集

引言

进化博弈理论来自于达尔文的生物进化论，至少自雷威丁(Lewontin 1960）用于解释生态现象 ②就已经产生了。但直到1973年梅纳德·史密斯和普莱斯（Maynard Smith and Price）、梅纳德·史密斯（1974）提出了该理论的基本均衡概念----进化稳定策略[3]（evolutionary stable strategy, ESS）及泰勒和乔克（Taylor and Jonker）提出该理论的基本动态概念---模拟者动态以后，进化博弈理论得到了理论界的普遍关注。特别是1992年关于进化博弈理论发展的国际学术会议在康奈尔大学的召开，正式确定了进化博弈理论在经济学上的学术地位，此后，该理论在经济学便上获得了迅速的发展及广泛的应用。越来越多的经济学家运用进化博弈理论来分析诸如社会制度变迁[阿克赛尔罗德和米尔顿(Axelrod and Hamilton 1981)；阿克赛尔罗德（1984)]、行业发展趋势[波特Porter 1980)]、股市发展方向［康利斯克（Conlisk 1980）；利奈尔和罗尔（Cornell and Roll 1981)］、消费者对品牌的选择[凯思和史培罗（Katz and Shapiro 1985）]、社会学习过程[弗登博格（Fudenberg 1995）]及社会习俗形成[彼特·杨，（H. Peyton Young 1993，1998）等领域的相关问题。进化稳定策略是进化博弈理论最基本的均衡概念，它具有广泛的应用并在发展中得到了不断完善。本文以进化稳定策略概念的发展为主线来介绍博弈论理论家们对它在不同条件下的拓展。

一、原初ESS定义及其缺陷

在梅纳德·史密斯和普莱斯(1973）；梅纳德·史密斯(1974）提出进化稳定策略概念以前，进化博弈理论的发展还仅仅处于萌芽阶段。在这一时期生态学家们主要应用纯数学理论如极限环、分岔、奇异吸引子（罗森，Rosen 1970）等概念来描述生态演化系统并用于解释生态现象，同时把生物之间的互动行为纳入到进化模型之中(威尔·艾德瓦兹，Wynne-Edwards 1962)，他们处理问题的方法已经蕴含了进化博弈理论的基本思想。

在七十年代，生态学理论和博弈理论在各自领域中都获得了迅速的发展，同时实验经济学作为一门学科也获得了经济学界的一致认同，这些条件为进化论与博弈论的结合提供了理论和现实基础。生态学家梅纳德·史密斯和普莱斯(1973）在总结以前理论的基础上，提出进化博弈理论的基本均衡概念----进化稳定策略③ ，该均衡概念的提出使得进化博弈理论的研究有了明确的方向，为进化博弈理论的进一步发展奠定了坚实的基础。

所谓进化稳定策略就是指：如果占群体绝大多数的个体选择进化稳定策略，那么小的突变者群体就不可能侵入到这个群体。或者说，在自然选择压力下，突变者要么改变策略而选择进化稳定策略，要么退出系统而在进化过程中消失。下面我们给出梅纳德·史密斯和普莱斯(1973）所定义的进化稳定策略（文献[3]对此有详细的介绍）：

说是进化稳定策略，如果，存在一个④，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入界限（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。从定义可以看出，当系统处于进化稳定状态时（群体选择进化稳定策略时所处的状态就是进化稳定状态），除非有来自外部强大的冲击，否则系统就不会偏离进化稳定状态，即系统会“锁定”（Lock in）于该状态。定义的直观意思就是，当一个系统处于进化稳定均衡的吸引域范围之内时，它就能够抵抗来自外部的小冲击。显然，进化稳定策略是一个静态概念，但它却可以描述出系统的局部即吸引域内的动态性质。

原初进化稳定策略定义为以后的研究者提供了理论基础，但它是建立在许多理想化的假定之上，存在着许多不够完善的地方：第一，梅纳德·史密斯等是在研究生态现象时提出的进化稳定策略概念的，由于动植物的行为完全是由其基因决定的。因而，每个种群体都被程式化为一个纯策略，整个生态环境的所有种群也被看作一个大群体。然而，同一种群的个体由于其性别不同、需要不同、能力不同、基因突变或基因遗传⑤ 等因素都会影响到它们的行为，把每一个种群行为程式化一个纯策略是没有太强说服力的，把一个生态环境中所有种群看作一个大群体也存在不妥之处；第二，从梅纳德·史密斯等提出的进化稳定策略定义可以看出，它仅适应于互不重叠且相互独立的突变因素的影响，其吸引域半径只与单个突变因素y有关，也就是说只有等到一个突变因素对群体的影响消失之后，才能出现另一个突变因素，现实中出现这种现象是非常偶然的；第三，梅纳德·史密斯等为了技术上处理的方便及更好地利用数学工具和博弈论来描述生态演化过程而假定群体规模无限大 ⑥，即隐含地假定博弈的支付⑦ 空间是一个连通、闭集，这个假定不符合现实；第四，从原初的进化稳定策略定义可以看出，它是一个静态概念，只能描述系统的局部动态性质，没有涉及到动态系统整体的调整过程，而现实中许多系统的均衡依赖于系统的整体动态性质。

从生态意义上说，进化稳定策略把种群之间的互动行为纳入到模型之中，推广了达尔文的优胜劣汰理论，然而与纳什均衡概念相比，进化稳定策略并不能解释群体如何达到稳定的。它只能回答一旦达到了这种稳定状态，原群体就对突变者群体者具有较强的抵抗力。也就是说，它只能回答当系统处于某一个均衡点的吸引域时，在一定条件下，随着时间的演化,该系统就会趋于这个均衡点，而当系统有多重均衡或者多个吸引域时，原初的定义就显得无能为力了。事实上梅纳德·史密斯和帕克（Maynard Smith and Parker 1976）、梅纳德·史密斯（1978；1979）已经识到原初定义的某些缺陷，梅纳德·史密斯（1982）给予了一定程度的修进并提出了修进的ESS（Modified ESS）概念。下面我们从四个方面来介绍理论家对进化稳定均衡所作的拓展。

二、非对称群体中的ESS概念

梅纳德·史密斯早在1979年就已经意识到，原初的进化稳定策略在处理多群体非对称博弈时遇到了困难。他发现，在现实中，如生态学、经济学和其他社会科学中的许多策略互动行为可能发生于两个或多个群体的个体之间，个体之间进行的是非对称博弈，单用原初定义不能很好解释现实中的这些现象。如何把静态的单群体进化稳定标准拓展到多群体情形呢？在单群体中，所有的个体都被程式化了一个纯策略（梅纳德·史密斯假定只有纯策略是可以遗传的），个体之间进行的是两两重复匿名博弈；并且在单群体中，规模很少的突变因素对群体所产生的影响是可以忽略的，因此，非严格纳什均衡策略不可能侵入到最优反应的严格纳什均衡策略群体。在多群体中，突变因素可能来自于各个群体，突变策略者的互动行为会对群体行为产生不可忽略的影响。因此，原初的进化稳定标准仅仅限于严格纳什均衡之间的选择就不能运用于解释多群体情形。Selten(1980)认为，把均衡概念由单群体拓展到多群体不是一个简单的过渡，而是涉及到系统的动态调整过程及动态稳定性等一系列的变化。哈曼斯顿（Hammerstein 1981）认为，在非对称博弈中，个体更加倾向于应用稳定策略来选择行为并决定竞争结果，而这些稳定策略与进化稳定策略相比，可能会有更少的“吸引域”。因此，由进化稳定策略定义所得的结论就显得有点似是而非了，但他没有作出进一步解释。

泽尔腾(Selten (1980))首次深入地研究了非对称博弈动态稳定性并利用两群体博弈情形证明 “在非对称博弈原初进化稳定策略必定是严格纳什均衡”。后来，Van Damme（1987）在更一般的情形下证明了这个命题⑧ 。我们知道，严格纳什均衡本来就显示出很好的性质，如果一个理论把其主要的注意力集中于研究严格纳什均衡，那么它就没有任何理论价值；更重要的是许多非对称博弈根本就不存在严格纳什均衡，因而也就无法研究动态系统的稳定性；在非对称博弈中，渐近稳定性（Asymptotic Stability）实质上也蕴含了严格纳什均衡，因此，渐近稳定性在非对称博弈中也不是一个合适概念；进化稳定策略是一个静态概念，虽然能够描述系统的局部动态性质，但在非对称博弈中，原初的进化稳定均衡与动态演化过程极限结果之间的对应关系却不明显（即出现了局部与全局的矛盾）。因此，要研究非对称博弈的动态稳定性就必须通过考察系统的动态演化过程来寻求能够适应于对称博弈与非对称博弈的稳定性概念。为了能够更精确地描述非对称博弈，泽尔腾（1983,1988）通过对引入角色限制行为（Role Conditioned Behavior）而提出了适应于非对称博弈的ESS概念。

他的定义如下：在有角色限制的博弈G中，一个行为策略称为进化稳定策略，

如果（ⅰ）对任意的，满足

（ⅱ）如果那么对任意的有。

然而，泽尔滕的ESS概念尽管适应于描述两群体非对称博弈的情形，但它只能描述系统的局部动态性质，而且该定义并不能够显示出均衡概念与动态演化过程极限结果之间的关系。因此，要更好地描述非对称博弈均衡，就必须正确处理好均衡概念与动态演化过程均衡结果之间的关系。于是，弗里德曼（Friedman 1991）考察了非对称博弈的更一般的单调调整过程并得出了四个基本结论：（1）每一个纳什均衡都是动态系统的静止点（rest point）⑨ ；（2）渐近稳定结果必定是纳什均衡；（3）在对称和非对称博弈中，对所有单调调整过程而言ESS不一定是渐近稳定的；（4）对某些单调调整过程而言，正规ESS是渐近稳定的。在此基础上，他得出了“渐近稳定结果必定是纳什均衡”结论。莱瑞·萨谬尔森和张建波（Larry Samuelson and Jianbo Zhang 1992）在弗里德曼（1991）的基础上进一步考察了非对称博弈的累积单调选择动态（Aggregate Monotonic Selection Dynamic）并得出：在非对称博弈中，单调调整过程能够剔除所有严格劣的纯策略,并且能够确保均衡结果必定是纳什均衡。同时，他们证明了“稳定点必定是纳什均衡”及“渐近稳定结果必定是严格纳什均衡”，进而强化了弗里德曼（1991）的“渐近稳定结果必定是纳什均衡”的结论。

Swinkels(1992)认为，进化稳定标准不对突变策略组合给予适当限制是说不过去的。特别地，在处理某些经济问题时，突变策略可能来自于参与人或者企业的创新、试验等活动，这些突变策略组合本身可能会影响系统的稳定性。因此，考察相对于后进入突变群体最优反应策略组合的稳定性可能会更合理，并且这些稳定性概念很容易由单群体情形推广到多群体N-人非对称博弈。于是他定义了适应于非对称博弈的策略稳健性概念。

定义：称之为相对于均衡进入者的稳健策略（Robust against Equilibrium Entrants REE），如果存在对所有的策略组合及满足：。其中表示突变策略；表示选择突变策略者在群体中所占的比例；表示混合群体；表示突变策略相对于策略x的最优反应策略，他并且证明了REE是ESS的一个子集。然后，他又把REE概念推广到了N-人非对称博弈的情形而提出了均衡进化稳定（Equilibrium Evolutionarily Stable EES）概念：

定义：称集合是均衡进化稳定的（EES），如果它是相对于下面性质的最小集： X是纳什均衡策略集合一个非空闭子集，存在，如果及，那么。

换句话说，EES集是纳什均衡策略集的最小闭集，它能够保证任何小规模的均衡进入突变者不可能使得群体离开进化稳定均衡的吸引域。

三、有限群体上的ESS概念

梅纳德·史密斯等提出的ESS概念另一个缺陷就是，他们为了在技术上处理的方便而认为群体规模无限大，这个假定与现实尤其应用于解决经济问题时并不相符。为了使理论与现实更接近，许多博弈论理论家对有限群体的均衡问题进行了深入的研究。沙弗尔（Schaffer 1988)首次放开群体规模无限大的假定，考察了有限规模群体的进化稳定性并提出了有限群体ESS（Finite Population Ess）概念。他证明“在一般情况下，有限群体ESS并不是纳什均衡策略”。汉森和萨谬尔森（Hansen and Samuelson 1988）分析了经济博弈的演化过程，并把有限群体ESS称之为“普遍生存策略”（universal survival strategy）。他们认为，在现实世界竞争中，未来的利润和可供选择的策略具有不确定性，这就会阻碍企业选择最优化策略，企业必须通过不断的试验、学习过程来寻求有利可图的满意策略 ⑩（不一定是最优策略）。沙弗尔(1989)应用“普遍生存策略”来研究寡头企业之间的竞争并得出结论：通过经济自然选择过程 ⑾而得以生存下来的策略是相对的而不是绝对的利润最大化策略。泰尼克（Tanaka 2000）利用模拟者动态，考察了差别产品对称寡头企业竞争的情形并定义了“全局生存策略”（Globally Surviving Strategy GSS）。他得出结论的是：在价格与数量竞争的寡头模型中，GSS都是随机稳定的并且在两种情况下它们是等价的。

以上所得到的均衡概念基本上是适应于单群体有限个体情形，并不适应于有限个体多群体博弈。哈佛保尔和西格蒙德（Hofbauer and Sigmund 1988）证明了“两群体对称博弈中不存在混合策略ESS”。泽尔腾(1988)在考察了大量的两人对称博弈的基础上也得出了类似的结论。克瑞斯曼（Cressman 1992）定义了有限两群体非对称博弈的进化稳定策略，1996年对他所定义的概念作了进一步说明。他认为，在模拟者动态下，至少一个群体的突变者所得到的平均支付少于选择稳定策略者所获得的支付，才能保证静止点的渐近稳定性。Garay and Varga(2000)认为，定义有限数目多群体的均衡概念应该满足如下三点：其一是突变者不能侵入他自己的群体；其二是现有群体对来自外部的随机冲击具有较强的抵抗力；其三是多群体ESS定义应该与非对称博弈理论的基本结论一致。众所周知，纯策略模拟者动态的渐近稳定集并不一定是ESS。那么，哪一种动态稳定概念等价于ESS呢？克瑞斯曼(1990)指出，在单群体条件下强稳定性等价于ESS，那么多群体的ESS定义也应该满足多群体稳定性概念等价于多群体ESS。根据这个标准，Garay and Varga(2000)定义了严格N群体ESS概念。其定义如下：

定义：策略组合称之为N-群体进化稳定策略，如果对每一个，存在，对所有的都有：

框架。

四、随机因素影响下ESS概念

梅纳德·史密斯等提出的ESS概念第三个缺陷是要求突变因素是不连续且不重叠的。原初ESS定义由于仅仅考虑单个因素对系统的影响，所以任何偏离均衡状态的行为都会随着时间的演化自动回复到原来的进化稳定状态。帕克和菲尔德曼（Peck and Feldman 1988）认为，由于群体规模和后代数目很大，因而随机因素对动态系统的影响是可以忽略不计的。现实并不是这样，经济演化系统常常会受到来自突变和其他偶然事件的冲击，这些因素可能会对系统产生不可忽略的影响。福斯特和杨（Foster and Young 1990)认为，首先，ESS概念把影响系统的因素都看成是一个个孤立的事件，而在现实中系统常常会受到连续的随机冲击。如果假定有一个因素的影响消失以后，再考虑另一个因素对系统的影响，那么，系统当然就不会远离原来的均衡状态；其次，现实中出现上述情况纯属偶然现象，一个只能处理偶然现象的理论是没有任何存在价值。现实中，尽管单个随机因素对动态系统的影响较少，但它们却可能对系统产生累积作用而定量地改变系统的稳定性，使得系统离开进化稳定状态，系统什么时候回复到当初的进化稳定状态，依赖于动态过程的全局结构，而ESS定义是一个局部概念，因此在考虑随机冲击时就不能作为判断系统稳定性的标准；再次，由于系统的极限行为依赖于初始条件，同时在吸引子集合中只有一部分状态是随机稳定的，且随机稳定状态的选择还依赖于随机过程特定的结构，因此，ESS和一般意义上的吸引子（Attractors）由于没有充分地考虑到随机因素对进化系统的影响，在描述随机系统的稳定性时也很不理想。于是，他们首次把影响系统的随机因素纳入到进化模型之中并提出了一个既不同于传统ESS也不同于吸引子（Attractor）概念的随机稳定性（Stochastic Stability）概念。他们的定义如下：

定义：群体向量是随机稳定的，如果随着随机影响，极限密度对的每一个小邻域都赋有正概率；更精确地说，其中。其中是当时，的极限分布，表示随机因素对系统所产生的影响。

粗略地说，一个状态P是一个随机稳定的，如果在长期中，随着随机冲击因素影响的不断变少，系统几乎一定（nearly certain）不会离开P的任意少的邻域。随机稳定的群体向量总是存在的，它有如下性质：随着及，它是一个最小闭集。接着，他们又提出了更一般的概念----随机稳定集（Stochastic Stable Set）。随机稳定集是一个满足如下条件的状态集合，即从长期来看，随着随机冲击的不断变少，系统几乎一定处于包含于S的任何一个开邻域中。随机稳定集概念的提出把传统确定性动态模型中的ESS拓展到随机性动态系统中，并且它是一个比进化稳定策略集更精练的概念，是进化稳定集的子集。随机稳定集已经成为描述随机动态系统的基本均衡概念。

五、ESS与动态的结合

从ESS的定义可以看出，它只能描述系统的局部动态性质而与系统的全局动态过程无关，然而，要更准确地描述一个系统的动态性质就必须对仔细考察整个系统的动态调整过程。泰勒和乔克(Taylor and Jonker 1978）首次把传统的ESS定义用模拟者动态模型表示出来，他们证明在一个多群体的模型中，进化稳定策略是渐近稳定的充分但非必要条件。但他们没有作出进一步的研究。鉴于此，吉尔博和马特休(Gilboa and Matsui （1991）)在考察群体行动态调整过程的基础上，提出了“循环稳定集”（Cyclically Stable Set）又一均衡概念。“循环稳定集”直接来源于群体行为的调整过程，其基本思想是“可接近性”（Accessibility）。一个策略分布f称为可以从另一个策略分布g接近是指，如果存在一条从f到g的道路，且在该道路方向上任何一点都是相对于该点的最优反应。“循环稳定集”是指在满足“可接近性”条件下是封闭的策略分布集合（在该集合中任何两个分布之间都是接近的）。与一般均衡理论不同，仅当参与人按照均衡策略而作出选择时才有效，CSS并不要求群体保持这种决策状态。CSS的直观意义是，在一个很短的时间间隔内，只有少部分人离开或者死亡并且由一些新来的人（新生的孩子）代替，这些新来者从他们的母体那里继承一些行为模式，并且在现行预期（也就是说他们并不关心行为模式未来的变化）条件下作出最优的反应，一旦新来者选择了某一行动，他就会一直坚持下去（转换成本的存在是他坚持这个行动的一个重要原因）。马特休（Matsui 1992）给出了一个“稳定”策略的静态表述，在存在对原群体中各策略的初始分布冲击的情况下该策略能够保持这种分布。斯温克斯（1992）在马特休的基础上提出了“群体稳定策略”（Socially Stable Strategy SSS）。相对于均衡的进入者而言，所谓“群体稳定策略”是指如果存在一个突变群体（或者进入者群体，譬如说群体A），其支付高于原群体的支付，那么必定存在另外一个群体（如群体B），在这个包含大部分原群体个体而有一少部分群体A的个体的群体中，群体B将获得高于群体A的支付。这个概念也称为“稳健策略组合”。当然在某些情况下，“群体稳定策略”可能并不存在，但不是这个概念本身的缺点，出现这种情况与我们所研究的动态过程本身是分不开的。然而，我们可能会问，实际的行为模式又是怎么样呢？如果这个过程并不是稳定状态，那么稳定状态又是什么呢？在对这个问题作出回答时，马特休利用了吉尔博和马特休（1991）所提出的集值解的概念（Set-valued Solution），同时他也证明了循环稳定集的存在性。Binmore and Samuelson(1993)把参与人的学习过程纳入到了进化模型中并提出了自我强化均衡[10]（Self-confirming Equilibrium）。他们认为，每个参与人都会通过自己的经验来推断对手可能选择的策略而作出最优反应，这个学习过程可能使得系统在不同自我强化均衡的吸引域之间漂移而不会停留在某一个均衡，由于在非均衡路径上的推断不一定正确，所以自我强化均衡可能不一定是纳什均衡。

结束语

进化博弈理论从发展到现在虽然只有二十几年的历史，但它却受到社会学、经济学、生态学们的普遍关注。特别是该理论的基本均衡概念----进化稳定均衡提出以后，理论界已经从不同的方面对它进行了拓展，并取得了令人瞩目的成果，使进化博弈理论体系得到了在发展中不断完善。进化博弈理论具有较强的实用性和广阔的发展前景 ⑿，相信它会引起更多经济学家的兴趣，必将成为主流经济学的一部分。

注释： ①张良桥：中山大学岭南学院经济学系数量经济学硕士研究生，广东省顺德职业技术学院经济管理系教师（邮政编码：528300；联系电话：0765-2338029；13825507060，值此文发表之际谨向他们致以深深的谢意，同时要感谢经济管理系的仇颖老师对此文中英文名字进行了认真的翻译。 ②生物学家在研究生态现象时发现，利用纳什均衡可以很好地解释生物进化结果。然而，生物是没有思维的更谈不上理性要求了，它们的行为却可以趋于纳什均衡，因此，理性要求并不是纳什均衡的必要条件。这样，生物进化论与博弈论的结合便成为可能，为进化博弈理论的产生奠定了基础。进化博弈理论以群体（Population）为研究对象，主要处理群体中近视且幼稚的(Navie)个体进行重复、匿名博弈的动态调整过程。其基本思想为：给定群体所处的状态，随着时间的演化更合适的策略会被更多参与者采用，其目的是为预测群体最终行为提供一个理论依据。 ③此后本文称之为原初定义 ④实际上相当于吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。 ⑤如长颈鹿进化的过程。 ⑥对群体模型为无限大的要求有两个原因：其一是机械式的，为了假想的“侵入界限”（Invasion Barriers）也就是突变者群体在大群体中所占的份额（Population Share），当突变群体模型超过1/n时，n是大群体的个体数，突变群体就有可能侵入到大群体，进化稳定策略的条件就有不满足了。其二是技术上的，群体模型足够大，就可以忽略掉现行群体个体的行为对其他突变者群体未来行为的影响，即不考虑学习过程。 ⑦其中的支付是生态学上的适应度（Fitness）或繁殖成活率。 ⑧下面我给出Van Damme1987的证明：首先设是进化稳定的，并且令所有参与人都选择不变的策略。令，对所有的。令，其中，那么对所有，满足及，因此，由进化稳定性可知。所以，而是任意的，所以。其次，设是一个严格纳什均衡策略，并且，那么至少存在一个满足，由的连续性可知，至少存在一个，对所有及，至少存在一个满足：，这就说明是进化稳定的。 ⑨静止点（Rest Point）就是当动态系统处于静止点时就不会离开该点。 ⑩Alchian(1950)指出，企业必须通过对所观察到的市场参与者的行动与结果之间的比较来得知什么是好的策略什么是不好的策略。 ⑾他考察了如下的选择过程，每一个企业所能够选择的策略不随环境的变化而变化。在每一个阶段结束时，如果企业1的利润大于企业2的利润，那么企业1在下一阶段生存下来的概率就大于企业2在下一阶段生存下来的概率。相应地可以把企业的生存规则看作为策略的幸存，成功策略在群体中所占的比例通过企业之间对策略的模仿而得以增长 ⑿杨小凯教授（1995）认为，博弈理论当前最有趣的研究成果及日后有可能获得诺贝尔奖的工作就是信息不对称的动态博弈模型，以及对策游戏规则演化模型（也就是进化博弈模型）。事实上1996年及2001年的诺奖都属于研究信息经济学的经济学家，这说明杨教授具有超前的预见性，进化博弈理论研究者虽然还没有获得诺贝尔经济学奖，但也可以说明杨教授非常看重对进化博弈理论的研究。

[参考文献]

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] Binmore, K., G., and Larry Samuelson(1993): Musical Chaires: The Evolutionary Mechanica of Equilibrium Selection, Mimeo, (University College London and University of Wisconsin, Madison) .

[6] Cressman, P.,(1992): The Stability Concept of Evolutionary Game Theory (A Dynamical Approach), Lecture Notes in Biomathematics, Vol. 94, Springer Berlin.

[7) Cressman, P.,(1996): Frequency-dependent Stability for two-species interactions, Theoretical Population biology, 49, 189-210.

[8] Cressman, r.,(1990): Strong Stability and Density-dependent Evolutionarily Stable Strategies, Theoretical Population biology, 145, 319-330.

[9] Friedman, D.(1991): Evolutionary games in economics, Econometrica 59.

[10] Fudenberg, D. （1998）: Learning in Games, Cambridge MIT Press.

[11] Gilboa, I. and A. Matsui (1991): Social Stability and Equilibrium, Econometrica,59, 869-867.

[12] Hammerstein, P., (1981): The role of Asymmetries in Animal Contests, Anim. Behav. 29, 193-205.

[13] Hansen, R. G., and Samuelson, W., (1988): Evolution in Economic Games. Journal of Economic Behavior and Organization, 10, 315-338.

[14] Hofbauer, J., Sigmund, K.,(1988): The Theory of Evolution and Dynamical Systems, Cambridge University Press, Cambridge.

[15] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical Biology, 1, 382-403.

[16] Matsui, A.(1992): Best Response Dynamics and Socially Stable Strategies, Journal of Economic Theory, 67, 343-362.

[17] Maynard Smith(1974): The theory of Games and the Evolution of Animal Conflict, Journal of Theoretical Biology, 47, 09-221.

[18] Maynard Smith(1978): In defence of Models, Anim, Behav. 26, 632-633.

[19] Maynard Smith, J. And Price, B. R. (1973): The Logic of Animal Conflict, Nature, 246, 15-18.

[20] Peck, J. R., and Feldman (1988): Kin Selection and the evolution of Monogamy, Science, 240, 1672-1674.

[21] Rosen, R. (1970): “Dynamical System Theory in Biology,” Vols. 1 and 2, Wiley-Interscience, New York.

[22] Samuelson, Larry and Jianbo, Zhang(1992), Evolutionary Stability in Asymmetric Games, Journal of Economic Theory 57.363-391.

[23] Schaffer, M. E., (1988): Evolutionarily Stable Strategies for a Finite Population and a Variable Contest Size. Journal of Theoretical Biology, 132, 469-478.

[24] Selten, R.(1980), Evolutionary Stability in Extensive Two-person Games-Correction and Further Development, Mathematical. Social. Science, pp. 93-101.

[25] Selten, R.(1983), Evolutionary stability in extensive two-Person Games, Mathematical. Social. Science 5. 269-363.

[26] Selten, R.(1988), Evolutionary stability in extensive two-Person Games—Correction and further development, Mathematical. Social. Science 16 . 93-101.

[27] Swinkels, J. (1992): Evolution and Strategic Stability: From Maynard Smith to Kohlberg and Mertens, Journal of Economic Theory, 57, 333-342.

[28] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[29] Tanaka, Y., (2000): Stochastically Stable States in an oligopoly with Differentiated Goods: Equivalence of Price and Quantity Strategies, Journal of Mathematical Economics, 34, 235-253.

[30] Taylor, P. D., and Jonker, L. B. (1978): Evolutionarily Stable Strategies and Game Dynamics, Mathematical. Bioscience. 40, 145-156.

[31] Wynne-Edwards, V. C. (1962): “Animal Dispersion in Relation To Social Behavior,” Hofner, New York.

博弈论的概念篇2

罗伯特•奥曼作为一名杰出的经济学家，在决策制定理性观点方面有着杰出的贡献，对博弈论和其他许多经济理论的形成起到了重要的乃至不可或缺的作用。因此，他于1983年获得了以色列技术机构颁发的科学技术哈维奖，1994年获得了以色列颁发的经济学奖。本文就他在博弈论方面的贡献以及相关思想作一评析。

一、弈论：交互式条件下“最优理性决策”

一般认为，博弈理论始于1944年。数学家约翰•冯•诺伊曼(john von neumann)和经济学家奥斯卡•摩根斯坦(oskar morgenstern)合作出版了《博弈论与经济行为》一书，概括了经济主体的典型行为特征，提出了策略型与广义型（扩展型）等基本的博弈模型、解的概念和分析方法，奠定了经济博弈论大厦的基石，也标志着经济博弈论的创立。

那么，什么是博弈论？奥曼认为，较具描述性的名称应是“交互的决策论”。可以看到，奥曼对博弈论的定义是十分简洁凝练的。因为博弈论是研究决策者的行为发生直接相互作用时的决策以及这种决策的均衡问题的，就是说人们之间的决策与行为将形成互为影响的关系，一个经济主体在决策时必须考虑到对方的反应，所以用“交互的决策”来描述博弈论是再简洁不过的了。奥曼还以经济主体的理性为分析的出发点，认为博弈论是交互式条件下“最优理性决策”，即每个参与者都希望能以其偏好获得最大的满足。如果仅有一个参与者，通常就会产生划分明确的最优化问题。而在多人参与者的博弈论中，一个参与者对结果的偏好等级并不意味着是他的可能决策的等级，这个结果也取决于其他参与者的决策。

奥曼还分析了一般和特殊模型中的“解概念”，指出，就社会科学的理性方面而言，博弈论是一种概括或“统一场论”。这里的“社会”是广义的，包括人类和非人类的参与者（如计算机、动物、植物等）。与探讨像经济学或政治学等学科的他种方法不同，博弈论不利用个别的、特定的结构讨论各种具体问题，如完全竞争、垄断、寡头垄断、国际贸易、征税、表决、威慑等等。更确切地说，博弈论发展了原则上应用于所有交互情形的一套方法，并进而探讨这些方法在每一具体应用中所导致的结果。从一般博弈论方法得到的结果与用较为特殊的方法得到的结果之间，常常出现密切的联系。然而在其他的情形下，博弈论方法会得出一些其他方法未能得出的新见解。

二、完全竞争经济：参与者连续统模型

众所周知，完全竞争经济模型描述了一种存在着许多参与者（居民和厂商），并且每个参与者的影响都是微不足道的市场情形。就是说，在完全竞争的经济状态下，每个居民或厂商的交易量相对于市场总量来说是很小的，任何一个人交易的商品数量并不会影响总供给和总需求。然而，奥曼认为：“事实上，只要仅存在有限多的参与者，个别参与者对经济的影响就不能被忽视。因此，适合于完全竞争的直观上的概念的数学模型必须包括无限多的参与者。我们认为适合这个目的的最自然的模型包括了参与者连续统(continuum)，类似于一条线上点的连续统或流体中粒子的连续统。”

在经济理论中，“连续统”观点的引入对经济学的学科发展有很大的影响。奥曼指出，连续统可以被看作接近于存在许多但是数量有限的粒子（或经济主体，或策略，或可能的价格）的真实情形。采用连续统的粗略估计的目的是使称为“分析”的数学分支的强有力的、精确的方法得以应用，而使用有限的方法将会更困难甚至是无望的。古典经济学假定每个人接受既定的所有商品的价格（单个居民或厂商的决策不能影响价格）。为了使经济处于稳定的状态，价格必须使总需求等于总供给，这就是瓦尔拉斯的竞争均衡(walrasian competitive equilibrium)。奥曼证明了它的存在，并用商人连续统的市场作了明确的说明。

奥曼还考虑了称为联盟的团体和它们之间以互益的方式进行的交易。竞争均衡定义假定厂商允许市场力量决定价格，他们根据市场价格进行交易；而对埃奇沃思著名的“契约曲线”(contract curve)进行概括的博弈论概念的核心，则认为这个核心由在此之上没有联盟可以有所进步的所有分配组成，它忽视了价格机制，仅仅涉及参与者之间的直接交易。奥曼指出，竞争分配的核心和模式与厂商连续统的市场相一致。奥曼通过精确表达完全竞争观点的连续统模型，成功地使最初由埃奇沃思提出，经许多其他模型改进的理论精确化，并从此成为经济理论的基本准则之一。

此外，1975年，奥曼还获得了另一个完全竞争经济中竞争分配和值分配之间等价性的结果。在奥曼看来，博弈论和经济理论中最显著而独有的现象或许是竞争市场经济的价格均衡与对应的博弈的主要解概念（除一个以外）之间的关系。直观上看，等价性原理是说，市场价格的建立是从在完全竞争市场上运转的基本力量自然地产生的，几乎不管我们假定这些力量是怎样运转的。

综上所述可以看到，完全竞争分析所获得的基本观点，使对完全竞争之外的基本经济问题的研究成为可能并且更加容易。在这方面，奥曼最重要的贡献和影响是利用一个或更大的参与者的连续统建立的垄断和寡头垄断竞争模型，以及公共经济学基于经济活动和政治过程相互交织的税收模型，如表决、固定价格模型等。

三、重复博弈论：理论系统性的发展

重复博弈是指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容，它可以是完全信息的重复博弈，也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。

首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代，被称为“佚名定理”。该定理认为，重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而，虽然所有可行的个体理性结局确实代表了合作博弈的解观点，但是它相当模糊，并且不提供信息。而奥曼认为，完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁（自我破坏或其他）等现象。博弈论和新古典经济学模式的现象，可能一开始看起来是非理性的。

奥曼还考察了许多具体的合作行为，定义了“强均衡”概念，即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出，重复博弈的“强均衡”与一次性博弈的核（更精确的是“6核心”）相一致。为此，奥曼定义和研究了经济理论中极为重要的“一般”合作博弈，即非转移效用(non-transferable utility)博弈，这开拓了该领域的研究空间，因为在此之前，仅有“单边支付”博弈被研究，即每个联盟可以任意在其成员中分享一定数额的赢得。

其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始，奥曼和其他合作者一起，在其学生的辅助下，发展了不完全信息的重复博弈论。1966年，奥曼和m.马希勒(michael maschler)在给美国武器控制和裁军机构的开创性报告中，建立了不完全信息的重复博弈模型。他们指出，信息使用的复杂性实际上可以以一种出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零(zero-sum)和博弈中，其中一个参与者比另一个拥有更多的信息（这就是所谓的单边的不完全信息），拥有更多信息的参与者所使用（并揭露）的信息数量是被精确地决定的；有时是完全揭露或根本没有揭露；有时是部分揭露。这种分析被扩展至更一般的模型，即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。例如，奥曼、马希勒和斯特恩斯在1968年引入了一个“联合控制的”(jointly controlled lottery)的概念，即没有参与者可以单方面地改变不同结果的可能性，这个概念与非零和博弈密切相关。之后，奥曼在重复博弈上的研究获得了丰硕成果。事实上，他的有关不完全信息博弈的许多重要观点已被应用于许多经济学科，诸如寡头垄断、委托人与人、保险等等。

四、合作与非合作博弈论：非转移效用与理性的假设

博弈论还可以划分为合作博弈与非合作博弈。在20世纪50年代，既是合作博弈发展的鼎盛期，又是非合作博弈的开创期。奥曼在该方面的贡献在于，一方面把“可转移效用”理论扩展为一般的非转移效用理论；另一方面发展并提炼了“什么是理性”，使之形成统一的观点。

合作博弈理论不讨论理性的个人如何达成合作的过程，而是直接讨论合作的结果与利益的分配。合作博弈的基本形式是联盟型博弈，它隐含的假设是存在一个在参与者之间可以自由转移的交换媒介（“货币”），每个参与者的效用在其中是线性的。

这些博弈被称为“单边支付”博弈，或“可转移效用”博弈(tu-games)。奥曼把“可转移效用”理论扩展到一般的非转移效用理论，发展并加强了可转移效用和非转移效用的合作博弈论。他先是界定了非转移效用联盟形式的博弈概念，然后提出了相应的合作解的概念。他研究了不同模型中的合作解，同时，将非转移效用值公理化，这是奥曼对合作博弈论基本原理所作的贡献之一。在1985年，奥曼还成功地制定了描述非转移效用值的一个简单公理集，这不仅拓展了这一领域的研究，而且产生了许多新的研究方向。

非合作博弈论的重点是对个体的战略选择，即每个参与者如何博弈，或者说选择什么策略达到他的目标。与之不同，合作博弈理论的重点则是对群体，并仅从更一般的意义上阐述了每个联盟的赢得，而没有说明如何赢得。奥曼通过多年的努力，发展并提炼了“什么是理性”。他认为：“如果一个参与者在既定的信息下最大化其效用，他就是理性的。”因此，一个理性人选择他最偏好的行动，当然“最”是相对于他所掌握的（关于环境和其他参与者的）知识而言的。令人惊讶的是，这个看上去简单清晰的表述可以以不同的方式理解，当然，也有些是互相矛盾的。什么是“参与者的信息”？他知道其他人的什么情况？是他们的理性吗？奥曼在他的许多影响深远的研究工作中解决了这些问题，并为这些模型制订了标准。

首先，他考察了知识和信息问题。对于这个问题，奥曼相当精确地概括出具有常识性的概念。他指出，如果开始时两个参与者具有了相同信念，但在对于一个具体事件的较晚的信念（基于不同的个人信息）是常识的，则这些较晚的信念必然形成一致。奥曼的观点对非博弈论产生了重大的影响。一方面，它导致了涉及多人情形下知识的正式概念的“交互认识论”整个领域的发展。另一方面，它形成了许多应用范畴。从经济模型——诸如只要人们有相同的最高执行官，他们的行为是人所共知的，那么具有不同信息的人们之间就不会产生交易——到计算机科学——用于分析分布环境，诸如多重处理器网络等。

其次，他假定参与者是“贝叶斯理性的”(bayesian rational)。这在一人决策论中或许是标准的，但是它在多人模型中是否也适用？奥曼引入了相关均衡的基本理论概念。相关均衡出现在经济和其他许多领域，引起了对不同交流程序和通常所说的“机制”的更重要的研究。

同时，奥曼还研究了“达到古典纳什均衡所需要的理性和理性知识的范围”的基本问题。他的观点与专业人士相反，认为答案并不一定是“理性的常识”。严格的理性是对决策者行为复杂的假设，由此产生了对边界理性模型的考察，该模型放宽了假定。奥曼指出，在交互情形下，微小的非理性是如何起很大作用的。实际上，在某些情形下，它能够导致重复博弈的合作。

五、其他贡献

奥曼在值集函数（即值为点集而非单独一点的函数）领域，也作出了许多重要的贡献，如“奥曼可衡量选择定理”、值集函数积分结果等。大部分问题产生于对不同博弈论和经济模型的研究，经济人连续统和数学理论是这些模型演化和分析的重要工具。奥曼所获得的诸如一般均衡、最优分配、非线性编制程序、控制理论、测量理论、定点理论等结果是基本的，它们被应用于经济学、数学、运筹学等许多领域。此外，奥曼把库恩(kuhn)著名的完全检索有限博弈中的行为和混合战略的均衡结果扩展为无限的情形，克服了复杂的技术困难。除了他发表的书外，奥曼多年来对许多人的研究产生了直接的影响。他向他们建议并提出了重要的问题和研究的渠道，与他们分享了深层的理解，帮助并鼓励他们从事研究工作。奥曼总是引导他的学生走向这一领域，与学生之间形成了双向反馈的相互作用，所获得的结果又被他用于塑造和提炼他的观点和理解。

六、简评

在过去的几十年中，奥曼对博弈论和经济理论的发展作出了重要贡献。可以说，在当代的博弈论研究中几乎没有他未涉足过的领域。他的研究具有与众不同的广度和深度，他的科学贡献从基本概念、学科的发现与形成到适当工具与方法的发展在分析不同具体问题中的应用，都具有开创性的进展。值得注意的是，奥曼的大部分研究与经济理论的中心问题联系密切。一方面，这些问题为他的工作提供了刺激和推动力；另一方面，他研究的结果产生了经济学新的见解和思维。

同时，奥曼的哲学论文和研究也具有相当的影响力。事实上，奥曼成功地以许多不同的受众可以接受的方式解释了甚至是最复杂的观点。他的研究并不止是一张简单列表，而是展示了所有美丽和清晰的宏伟画面，指出了成就、需要解决的困难以及将来研究的领域。毫无疑问，奥曼的观点从总体上说，在建立并使博弈思想和经济理论思想的轮廓更加清晰方面起了重要的作用。

【参考文献】

1.aumann,r.j.,1964,markets with a continuum of traders,econometrica 32.

2.aumann,r.j.and shapley,l.s.,1974,values of non-atomic games,princeton:princeton university press.

3.aumann,r.j.,1976,agreeing to disagree,annals of statistics 4.

4.aumann,r.j.,1985,an axiomatization of the nontransferable utility value,econometrica 53.

5.aumann,r.j.,1985,notes and comments on the nontransferable utility value:a comment on the roth-shafer examples,econometrica 53.

6.aumann,r.j.,1987,value,symmetry,and equal treatment:a comment on scafuri and yannelis,econometrica 55.

博弈论的概念篇3

引言

一、两个简单的例子

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

博弈论的概念篇4

关键词：新闻传播学　博弈论　方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究。不能缺少博弈论的思想。

上个世纪90年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008年10月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归人人际传播理论。说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约，或传统哲学所说的作用与反作用意义层面，来使用“博弈”概念。诚然，博弈论研究确实离不开这些因素，但所有事物间的这些因素，不一定都是博弈论所讲的博弈。也有在互动反馈意义层面，来理解博弈的，比起前者进了一层，然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为，但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象，把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象，这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词，而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法，而是力图客观地思考博弈论方法在新闻传播学研究中，究竟能否作为一种研究视角，起到对新闻传播学研究的建构作用，甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性

德国著名数学家哥德尔1931年提出不完备性定理：第一不完备性定理――任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理――任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方。找到双方的契合点，从新的角度描述新闻传播现象与活动的规律。调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何。有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与

活动过程中，有没有相类似的情况?其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定?其二，均衡概念在新闻传播过程中能否实现?其三，新闻传播活动的行为主体是不是理性的?情况允许的话，自己的利益最大化是否是追求的目标?其四，竞争与合作的契约关系，在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考，我们再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态。即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用。但归根结底的因素是生产力与生产关系的矛盾对立统一。博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此。博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后，包括新闻传播业在内的文化产业，亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下，力求社会效益与经济效益的双赢，这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为，都存在博弈论的问题，因为在某一次传播活动中的传播者之间、传受之间等，都有一个行为对策选择的问题，在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化，可能追求的就是整体国家民族利益的最大化，如我国文化产业的双赢策略，即博弈论的“均衡”。公益与私利、赢利的矛盾，在社会主义初级阶段会一直存在，博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道，博弈论最初作为应用数学的一个分支，是运筹学下面的对策论。后来应用于经济领域。在西方发达国家，作为西方经济学前沿领域的博弈论，已逐渐变为一种占主流地位的基本分析工具，人们十分重视其方法论意义。从中国的传统文化来说，经史子集弈的思想无处不在。过去曾有学者提出这样的观点，自然科学最基础的学科是数学，而社会科学的基础可以是博弈论。我们不能说它完全正确，但是至少应该承认有其一定的合理性。

从广义的角度看，传播应用学派的传播模式研究，实际上相当于博弈模型。在我国较为流行的英国人丹尼斯・麦奎尔、瑞典人斯文・温德尔合著的《大众传播模式论》中，许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式，第二版介绍了66个传播模式。除了个别早期线性模式外，在控制论的反馈概念出现之后，传播模式越往后越具有博弈的性质，甚至可以这样说。研究当代传播模式离开了博弈的思维，其研究是存在欠缺的，虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学，从它们的发生与发展的历史来看，是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代，在需要破除自然与社会科学鸿沟的时代，谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学，从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响。人们思考博弈论在新闻传播研究领域的运用时，可能认为仅仅反映在传媒的经营管理上。这种狭义的理解，导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为，新闻传播研究中重视运用博弈论。并不是要求新闻传播理论“范式”像经济学那样转向博弈论，并把它作为核心的理论分析工具，而是在理论体系建构中，对博弈论方法给予足够的重视，将其中合理的内容，吸纳到基础理论中来。更重要的是，将博弈思维作为指导理论研究的一个窗口，扩展新闻传播理论空间。当然，也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”。进行专门的新闻传播学新领域探索。

博弈论的概念篇5

1960年，托马斯·谢林在《冲突的战略》一书中开创性地运用博弈框架分析经济学以外的社会科学问题[1]，而后拓展研究纷至沓来，涉及政治、军事、国际关系与外交等多个学科。随着博弈论研究在社会科学多个领域的不断深入与成功应用，大学教育对博弈论知识的需求日益高涨[2]。

然而以往的博弈论教学相对孤立地处在经济学科，没有广泛展开。经济学以外的社会科学教科书通常只是简单提及“囚徒困境”或“零和博弈”，缺少系统的分析和融入课程内容的具体应用。事实上，怎样把博弈论融入社会科学各个学科的教学中已经成为大学教育必须面对和解决的问题。要回答这一问题，可以按照两步展开：首先，博弈论给大学社会科学教学带来什么？能实现什么教学目标？其次，博弈论课堂教学宜采用哪种教学方法？怎样实施？

“两力并举”——增进感知批判力，提升抽象思维力

博弈论是研究个体间相互决策与行为结果的理论，它从经济学的角度提炼个体最优决策问题，利用数学模型进行描述、研究和分析，是当代经济学与数学最重要的学科交叉分支。

博弈论对人类行为的研究以抽象分析和决策应用见长，弥补了传统社会科学研究的不足。麦斯奇塔在新近专著中提出一个强调抽象分析和决策应用的博弈模型，声称在数千项实际预测中，该模型以高达90%的精确率预言了涵盖从地缘政治到个人事务等多个领域的各种社会科学问题[3]。具有如此特质的博弈模型既能帮助大学生理解广泛而具体的社会事件，又能佐以理论知识进行一般化的抽象分析。从建构主义观点看，现实社会的人类行为在博弈论中以简化抽象的形式得以反映，这特别适合与社会科学各学科的教学相结合，在增进学生对现实事件的感知与批判的同时训练其抽象思维能力。

促使学生掌握并运用抽象概念是教学中最困难的环节。博弈框架抛弃直接引入概念的一般形式，采用借助实际问题引入、加以抽象分析，并鼓励学生运用所学概念和分析技术考察其他问题。从现实问题的分析中概括和总结出具有一般意义的经验并以抽象命题的形式予以升华，进而应用于其他问题，能够训练学生“看问题”的抽象思维。另一方面，经验感知带来高效的学习过程。即便是擅长高度抽象思维的数学家也承认，尽管他们使用抽象的一般性的定理描述研究结果，但在发现定理之初他们通过解决具体问题获得灵感和思路[4]。因此，当学生能够深刻地看待现实问题时，便获得从具体问题中触发灵感的能力。

社会科学具有三个关键理念：一是现实事件受许多参与者的互动影响，而不由一个参与者决定；二是每个参与者都面临由相互影响和不确定性造成的激励或威胁；三是沟通与监督对现实事件产生重要影响。博弈论通识教育能使学生认知这三个关键问题，理解和应用不同理论范式。因此，采用博弈框架、嵌入各种社会科学现实问题的通识教育既对训练学生感知现实的抽象思维能力裨益良多，又有助于大学社会科学教育实现“培养兼具现代科学素质与人文素养的社会科学人才”的较高目标。

“两法相较”取其优——案例教学法

案例教学是一种以教师讲授和分析案例为主的教学方法。在案例分析时，教师引导学生进行讨论，逐渐理清案例中的知识要点，从而激发学生的思考达到教学目的。案例教学重视分析、思辨和推理过程，突出基本知识在案例中的具体应用，所以尽管教学的主体是学生，但案例教学的主导者和实施者往往是教师。另外，虽然案例教学需要重现现实生活中的一些事件，但重现方式既可以是具体的、生动的又可以是虚拟的、想象的，所以案例教学不仅适用于经济学、法学、管理学等社会科学的课堂教学[5-6]；也适用于计算机科学、物理学等理工科的课堂教学[7-8]。

案例教学不排斥基于知识应用或任务实施的实际操作环节，而且重视蕴含基本知识的分析、推理和思辨过程。博弈论作为一种研究人或其他生命体的相互决策与行为结果的理论，尽管在政治、经济、管理、军事、外交、生物、心理等学科领域中应用广泛，但仍以较为抽象的形式予以展现，借助数学范式作为主要分析工具[9-10]。所以，虽然模拟教学能够加深学生对某些现实情境的隐性感受，但为了训练感知现实的抽象思维能力，博弈论通识教育的课堂教学应以案例教学法为主。

“双管齐下”——慎选案例，全面分析

博弈论富有典型案例，讲解有趣的囚徒困境不难，难的是让学生明白囚徒困境寓意深刻，其博弈逻辑具有简化凝练的指导意义，适用于许多现实问题。囚徒困境要与军事大国的核武竞赛联系起来，帮助学生认识到1914年奥匈帝国对塞尔维亚的宣战直接引发欧洲各国的军事对抗并导致第一次世界大战的爆发；还要使学生明白国际贸易中的保护主义倾向和WTO的重要作用；更要洞察地方保护主义、“形象工程”和重复建设问题的症结所在。

运用案例教学法训练学生感知现实的抽象思维能力，从而帮助学生认知前文提及的社会科学三个关键理念，博弈论通识教育的课堂教学：应当突出案例选择的典型性——准确契合教学内容、联系现实事件，有效服务教学目的、凝练抽象概念；体现案例分析的完整性——包含提炼问题、分析问题、解决问题和拓展应用等环节，蕴含从具体到抽象和从抽象到具体的双向思维过程。

此外，还应当“四步行”：先从现实事件中提炼典型博弈案例进行讲解和分析，再把基本概念和分析技巧反复应用于不同社会科学领域的多种现实问题，然后区分各个典型案例强调的基本概念和分析技巧的异同，最后训练学生依照恰当的博弈逻辑分析具体问题并逐步体悟各个典型案例蕴含的抽象意境、现实含义和应用技巧。

1.囚徒困境：充满变数的共赢

阐释囚徒困境重在揭示积极合作能够实现共赢，但有变数。一旦学生循着案例认真思考，就能发现是否可以信任对方是问题的关键。当对方可以信赖时，自己就选择合作，获得互惠互利的成果。否则，自己就“被迫”自卫式地选择欺骗策略。这样，变数存在于双方对对方行动的预期中。

这种想法在类似军备竞赛的困境中体现得淋漓尽致。表面上，军事扩张能增强自身实力保证国防安全，然而就像欺骗策略一样，肆意军事扩张将导致自己处于更糟糕而不是更好的境地中——因为国防安全与否取决于各国的军备互动而不是自身的绝对实力。一国军事扩张会令他国自认为面临被欺骗的危险而折断合作的橄榄枝。各国纷纷增加军费进行自卫式的军事扩张，最后却换来更不安全的国防环境。学生可以从两次世界大战、美苏太空争霸、核武竞赛、东北亚局势等重大事件中捕捉到这种想法并据此训练抽象思维能力。

另一方面，经济学巨擘亚当·斯密认为个体追求个人利益能增进集体福利。囚徒困境从个体使用欺骗策略追求个人利益会损害集体福利的角度说明，经济和社会发展有可能面临亚当·斯密没有预见的困境[11]。一些地方政府热衷“形象工程”、重复建设，却漠视环境污染、食品安全等问题。鼓励学生从理性的角度辨析现实问题背后的逻辑困境，远比仅从感性的角度进行道德批判要真实可靠得多。

囚徒困境与前述三个关键理念密切相关：首先，参与者的行为相互影响，博弈结果取决于参与者的“信任”；其次，如果参与者希望合作，那么他就面临被欺骗的危险和假意合作却通过欺骗获得更多回报的不当激励；最后，参与者之间的信任程度，以及沟通和监督条件，对能否实现合作共赢至关重要。这样，不仅国际原子能机构、日内瓦裁军谈判会议、联合国和平利用外层空间委员会、世界贸易组织和欧佩克等常见的国际机构和组织跃然纸上，而且建立健全地方政府信息公开制度和加强公众对环境保护的监督权利等解决现实问题的有效手段也脱颖而出。

2.共赢：协调博弈与合作博弈的结晶

共赢是社会发展、文明进步的本质体现，是博弈理论关注的重要问题。在抽象提炼现实事件中不同共赢方式的特质后，博弈理论强调协调（coordination）和合作（cooperation）两个概念。两者既不同一也不排斥，学习它们有助于训练学生感知现实的抽象思维能力。

协调博弈强调参与各方采用的策略既符合自身利益又存在某种一致性，各方没有改变自己策略的激励，也不希望对方改变，从而处在一种稳定、共赢的状态。合作博弈则意味着参与者组成团队，在博弈过程中通过合作获取某种合作剩余，使团队的整体收益增加。合作博弈面临的重要问题是如何在增进整体利益的同时分配合作剩余，使每个成员都能比不合作获得更多回报。与协调博弈不同，合作博弈的参与者可能改变自己的策略（或欺骗团队）获得额外收益，所以合作博弈需要一定的执行条件才能保持稳定，实现共赢。

许多重要的国际组织都体现了合作博弈，能够有效增进学生的现实感知。欧盟是世界上最有力的国际组织，在贸易、农业、金融等方面趋近于一个统一的联邦国家，而在内政、国防、外交等方面则类似一个由许多独立国家组成的同盟。所以欧盟成员国在获得贸易、农业、金融等方面的合作剩余的同时，也以独立国家的身份各自争取更多的回报。

大多数时候国际组织还执行着合作博弈必须的强制条件。欧佩克作为占全球石油产量40%和出口量一半的石油输出国组织，通过协调和统一各成员国的石油政策，配给原油生产额，确保国际石油市场的价格稳定，保证各成员国获得稳定较高的石油收入，同时也为石油消费国提供短期、中期乃至长期稳定的石油供给。为了约束成员国私自增加原油产量的行为，欧佩克需要定期召开成员国大会，相互监督，制定具有强制执行力的协议。另外，由于欧佩克能够稳定国际石油市场，使石油生产国和消费国的利益得到兼顾，因而得到较高的国际认可，这也强化了欧佩克协议的执行力度。

交通博弈是协调博弈的经典案例。假定没有交通规则，那么相向而行的两辆机动车都有靠左行驶和靠右行驶两个选择。他们有3个纳什均衡：（靠左，靠左）、（靠右，靠右）以及一个靠左和靠右各占50%概率的混合策略均衡。只要给定对方的选择，两车就没有偏离均衡的激励；如果不给定对方的选择，两车也能通过协调来实现某一均衡。交通博弈与囚徒困境刚好相反，一方车辆选择策略A或B，仅仅需要确信对方也会相应地选择A或B，就能实现共赢。协调博弈不像合作博弈那样需要一个有约束力的契约，而是更需要在彼此之间确立一种相互信任的信心。协调博弈的核心是，只要坚持自己的信心，就一定能得到对方的“正回馈”：对方会协调到共赢状态上来。

协调与合作背后都蕴含着公平性观点：当别人对你友善时你也对别人友善（投桃报李），当别人对你不善时你也对别人不善（以牙还牙）。心理学实验表明人的行为普遍符合“互惠互损”准则，即当面临的潜在收益或损失不太大时，公平性规则在社会行为中发挥着重要作用。借助典型博弈案例将直观的心理学准则和抽象的博弈概念结合起来，对帮助学生感知现实、推理思辨具有重要作用。

博弈论包含的典型案例和知识内容远远超出了囚徒困境和协调合作。即便上文只对它们进行了简单介绍，也已表明在社会科学教学中开展具有通识意义的博弈论教学对训练学生感知现实的抽象思维能力效果明显，而且可以帮助学生深入领会相关课程的基本概念、树立社会科学范畴的关键理念。

参考文献：

[1] 托马斯·谢林（著），郑志刚，王勇，赵华（译）. 冲突的战略[M]. 北京：华夏出版社，2011.

[2] Bruce Bueno de Mesquita， David Lalman. War and Reason： Domestic and International Imperatives [M]. New Haven， CT： Yale University Press， 1992.

[3] Bruce Bueno de Mesquita. The Predictioneer's Game： Using the Logic of Brazen Self-Interest to See and Shape the Future [M]. New York， NY： Random House Digital， Inc.， 2010.

[4] Gregory C. Chow. Dynamic Economics： Optimization by the Lagrange Method [M]. New York Oxford： Oxford University Press， 1997.

[5] 刘刚. 管理学科案例教学的准备与组织工作[J]. 中国高教研究，2010，05.

[6] 谈建俊. 论法学教育中的案例教学[J]. 江苏大学学报（高教研究版），2002，04.

[7] 詹自胜. 案例教学法在面向对象程序设计教学中的探索与实践[D]. 浙江师范大学，2006.

[8] 马慧. 案例教学在大学物理教学中的研究与实践[D]. 湖南大学，2009.

[9]李太龙. 博弈论公选课的教学内容与方法探析[J]. 教育探索，2012，01.

[10] James Morrow. Game Theory for Political Scientists[M]. Princeton， NJ： Princeton University Press， 1994.

博弈论的概念篇6

【关键词】无线电博弈论纳什均衡

一、博弈论的概述

1.1概念

博弈论（game theory）是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论[20]。也就是说，博弈论研究当一个主体，譬如说一个人或一个企业的选择受到其他人（其他企业）的选择的影响，而且反过来影响到其他人（其他企业）选择时的决策问题和均衡问题。所以在这个意义上说，博弈论又称为“对策论”。博弈论是一种使用严谨数学模型来解决现实中利害冲突的理论，由于冲突、合作、竞争等行为是现实中常见的现象，因此很多领域都能应用博弈论，如军事领域、经济领域、政治外交等。

1.2博弈论模型简介

博弈论自产生到发展至今已形成了较成熟的理论体系，它并不是经济学的一个分支，它是一种方法，应用范围不仅包括经济学，政治学、军事、外交、国际关系、公共选择，还有犯罪学等都涉及到博弈论。不过博弈论也具有自身的基本模型，可以对一个博弈过程用5个方面来描述，G={P，A，O，I，U}

① P（player）：博弈的参与方。

② A（action）：博弈方可选择的全部行为或策略的集合

③ O（orders）：博弈的次序。

④ I（information）：博弈的信息。

⑤ U（utility）：博弈方的收益。

以上五个方面是定义一个博弈时必须首先设定的，确定了上述五个方面就是确定了一个博弈。博弈论就是系统研究用上述方法定义的各种各样的博弈问题，寻求各博弈方合理选择策略的情况下博弈的解，也既是均衡。

1.3博弈论的分类

现实中各种博弈可以按照不同的办法进行分类。根据参与人的多少，可以将博弈分为两人博弈和多人博弈；根据参与人是否合作，可以将博弈分为合作博弈和非合作博弈；根据博弈结果的不同，又可以将博弈分为零和博弈、常和博弈和变和博弈。

1.4纳什均衡

1.4.1纳什均衡的定义

纳什均衡（Nash Equilibrium）[20]是一种策略组合，它能够使得每个参与者的策略都是对其他参与者策略的最优反应。“最优反应”指的是该策略带给采用它的博弈方的利益或期望利益，大于或至少不小于其它任何策略能带来的利益。博弈的目的，就是为了寻求这样的一个最佳的策略组合。

1.5 一些特殊的博弈模型

1.5.1重复博弈模型

重复博弈是目前人们了解的最为透彻的一类动态博弈，参与人每一期都面对同样的“阶段博弈”或“选民博弈”，而且参与人的全部收益是每阶段所得收益的加权平均。参与者基于对博弈过程的认知，例如对过去行为的了解，对未来的预期和对当前情况的观察，在每一个阶段的博弈中选择自身的策略。这些策略可以是固定的，也可以随其它参与者行动的改变而变化，甚至可以是自适应的。

1.5.2潜在博弈模型

潜在博弈是一般形式博弈中的一种特殊类型，存在函数u：SR当单方面的背离发生时，u的变化Δu将被反映到单方面背离博弈者的效用上。

二、在无线通信系统资源分配问题中应用博弈论的可行性分析

随着无线通信系统的飞速发展，许多概念和技术与现有系统相比都有很大的变化。通信系统将具有智能的资源管理，采用大量动态的、分布式的、自适应式的资源管理方式。

三、基于博弈论的动态频谱接入方法

如何利用博弈论方法对认知无线电技术的研究进行分析，其中的关键是如何将博弈论引入到相应算法的设计和分析中，找到算法的纳什均衡点。在开始具体的算法研究之前，需要将所研究的问题抽象成博弈论问题模型。

3.1 分布式自适应频谱接入方法

博弈论模型适用于分析认知无线电系统各用户竞争频谱的分布式行为，各用户根据自己获得的信息单独进行决策。

博弈论的概念篇7

关键词：经济博弈论语义分析经济学方法论实证分析语言转向

“囚徒博弈”、“智猪博弈”、“懦夫博弈”、“协调博弈”等许多经典案例，被广泛运用于经济学、决策论、管理学等各学科领域；而这些虚构的案例能否用来说明博弈理论引发了学者们激烈的争论。直至今日争论看似逐渐平息，经典案例仍在使用，但争论其实仍是无果而终或只是暂时表面的平静，而相类似的讨论不断在经济科学的其他领域重演。必须认识到，这场争论归根到底是方法论问题。按照传统方法论提出的规范与实证二分法无法处理这一问题，本文试图从语义学的视角进行分析。

争论双方的观点

（一）质疑者的观点

较为温和的批评者认为，“囚徒博弈”等所谓的“案例”不真实，只是一个故事或寓言，不在现实中发生。激进的批评者指出，不仅上述案例是虚构的，经济博弈论中一些所谓真实的案例，也包含有假设和抽象的成分。极端反对者不仅把焦点放在质疑案例本身，而且通过分析案例与模型、现实与理论的关系，进一步对博弈论的整体研究方法提出质疑。

从理论角度看，博弈理论和模型中包含有假设的变量，这些变量无法在现实中进行观察。从案例角度看，在案例中被忽略掉的变量对结论不一定是无关紧要的，相反可能是必要的甚至是决定性的。因此整个博弈论漠视了变量可观察的重要性，无论理论建构还是案例实证都需要做出改进。

（二）支持者的观点

对案例使用的辩护者则直接从研究方法出发，首先强调博弈论研究中使用假设和抽象是不可避免的。任何一门科学研究都需要假设和抽象，抽象和假设并不是博弈论的局限性，而是任何理论的局限性。经济学科的研究方法如同物理学、生命科学的研究方法一样，通过抽象和假设从万千变化、纷繁复杂的社会经济现象中找寻本质的经济规律，经济学家使用博弈模型的目的是试图完成一种可解释不同经济现象的一般理论或机制体系的建构，通过博弈模型抓住诸多现象的本质机理。

（三）观点比较及本文的思路

通过以上双方观点分析可以总结出双方的三点同识和一点分歧，如表1所示。同识在于：第一，双方都同意博弈论属于实证分析而不是规范分析；第二，无论反对者还是支持者都认同博弈理论的正确性需要在现实中得到验实；第三，真实的案例有证实或证伪博弈理论的作用。而分歧主要在于：虚构的案例能不能用以论证博弈理论？支持者表示同意，反对者坚决抵制。

传统的经济学规范和实证的二分法并不能处理关于博弈论案例使用的争端。而如果将博弈论作为一类知识，从知识论的角度对实证知识的语义进行分析，则实证知识可进一步划分为综合知识和分析知识，它们都属于实证知识的范畴，但有着不同的命题性质。本文旨在介绍实证知识二分法，阐明分析命题与综合命题的命题性质与逻辑关系，论证经济博弈论属于分析命题的范畴，划清了博弈论案例使用的合法范围，以避免研究中的方法误用。

经济学实证知识的二分法

（一）经济学实证与规范二分法

经济学以实证方法描述经济事实、发现经济规律。实证与规范二分法最早追溯到休谟（D.Hume），休谟砍刀（Hume`s guillotine）提出不能从是中推出应当，经济学实然知识与应然知识是截然不同的，需要分别采取各自不同的方法进行研究。穆勒（J.S.Mill）、韦伯（M.Weber）、西尼尔（N.W.Senior）和凯恩斯（J.N.Keynes）的著作对这个划分进行了进一步的阐述与运用。弗里德曼（M.Friedman）著名的论文“实证经济学方法论”中再次提出，并且对它进行了详细地讨论，“斯诺命题”加深了人们对两类知识差异的认识。当前关于实证分析和规范分析的二分法，在经济学领域是被普遍接受的。

（二）经济学实证知识二分法的提出

将经济学知识视为整体知识体系中的一类，则按照研究方法将经济学实证知识划分为分析知识和综合知识。在第一个层次，经济学理论作为一门学科是通过命题语言来表达，命题语言既包括文字语言，也包括符号语言、数学模型或公式。在第二个层次上，按照传统划分，经济学分析划分为实证分析和规范分析。在第三个层次上，经济学实证命题可划分为分析命题和综合命题，同时根据实证原则将命题划分为无意义的实证命题和有意义的实证命题。

经济博弈论实证知识类型证明

（一）从主词指称上

从语义学上看，命题的主词是概念词或是专名。概念词表述某类事物或属性，专名表述个体事物。弗雷格对命题主词的涵义与意谓做出明确划分，指出在数学中，a=a和a=b之间的差别，只是表达形式上的差别。前者使用相同的符号，后者使用不同的符号。由于它们表示相等的数量关系，所以可以用a代替b，或者用b代替a，等式仍然成立。但是在命题语言中情况就不同了。在命题中要考虑语义的关系，即同时要考察主词的意义与意谓，这不像代数的等式中那样只考虑数量间的相等关系。

主词的意义是主词表述的思想，主词的意谓是主词指称的对象。“苹果”是有意义且有意谓的概念，“理性”是有意义但无意谓的概念，“地球”是有意义且有意谓的专名，“智猪”是有意义但无意谓的专名。对于任何一个有意义的命题，主词必然有意义，但不一定都有意谓。有意义的命题，主词一定有意义，但不一定有意谓。综合命题的主词必须同时有意义与意谓，即在实现中的相对应的对象。

根据命题主词指称分析，经济博弈论属于分析命题。从博弈理论看，理论的真与主词的意谓无关；从案例看，如“智猪博弈”中用任何一个概念代入x或y，或替换“大猪”和“小猪”，案例结论仍成立。

（二）从命题与现象的时空关系上

在命题与现象的时空关系上，又体现了分析命题与综合命题的根据不同。引用张庆熊等学者说明赖尔（G.Ryle）“范畴错误”所使用的五个命题：“（1）一只苹果正挂在树上。（2）苹果服从万有引力定律。（3）我剪断了它的柄。（4）苹果因为万有引力掉到地上。（5）苹果掉到地上因为它的柄被剪断了”。

分析命题具有超时空性，分析命题的真包含一切可能的世界，求证分析命题的真与时空无关。时空是综合命题真的必要条件，综合命题描述的对象一定位于现实世界。时间、空间是综合命题必然的、普遍有效的形式，是因为综合知识如果是可以理解的话，或者说如果是综合命题的话，就必定带上时间、空间和因果性的印记。空间、时间和因果性是综合命题的可能性的条件。

于是，句（1）、（3）与句（2）在逻辑上是不同范畴的实证命题。句（1）和（3）属于综合命题，它们报道发生的事情，人们可以提问句（3）在什么地方剪断苹果柄，它在什么时候发生，它花了多少时间等。句（2）不是综合命题而是分析命题。句（2）是理论或假设而不是一个事件，它并不发生，它假设命题在一切可能世界都为真。对这样的句子不能提问在什么时候、在什么地点发生了什么事情，它是理论或假设。根据命题与现象的时空关系分析，经济博弈论属于分析命题。从博弈理论看，命题的真与时空无关；从案例看，案例的发生与时空无关。

（三）从命题间的因果关系上

从命题间的逻辑关系上分析，用分析命题作为原因的命题仍是分析命题，用综合命题作为原因的命题是综合命题。句（4）和（5）都在解释苹果掉到地上的原因，都属于实证分析范畴。用句（4）作为苹果落地的原因，再用句（2）作为句（4）的原因，是采用逻辑演绎方法进行推理，因此句（4）是分析命题。用句（5）作为苹果落地的原因，再用句（3）作为（5）的原因，是通过经验观察获得的知识，因此句（5）是综合命题。尽管句（4）和句（5）中都有“因为”这两个字，都属于实证分析的范畴，但是这两个“因为”在各自的句子中所起的逻辑上的作用是不同的。但前者是分析知识，后者是综合知识，不能犯“范畴错误”。

与此相联系，分析知识的真是必然的，综合知识的真是偶然的。用句（2）作为句（4）的原因是必须的，它的反面是不可能；用句（3）作为句（5）的原因是偶然的，它的反面是可能的，即苹果有“我剪断了它的柄”之外的原因落地。分析命题的真假通过逻辑规则推论出来，综合命题是建立在经验事实的基础上，其真假通过经验加以检验。

根据命题间的因果关系分析，经济博弈论属于分析命题。从博弈理论看，命题间的因果关系是必然的；从案例看，案例的结论与前提的关系是必然的。

（四）从命题的验证方法上

从命题的验证方法上分析，分析命题通过逻辑规则，综合命题通过实际观察。分析命题依据矛盾律从一些先天的概念、原则演绎出来；综合命题通过归纳一类事物的性质或事物间的关系得到结论。验证分析命题，只要看看它们是否在逻辑上自相矛盾；验证综合命题，则要看看它们是否与现实中情况相符合。

对此托马斯·谢林（T.C.Schelling）也指出，博弈论是抽象的和推论的，而不是一门研究人们如何决策的经验主义科学，但它是一种附有以下相关条件下的演绎原理，即参与者的决策必须是“理性的”、“一致的”或“非矛盾的”。

根据命题的验证方法分析，经济博弈论属于分析命题。从博弈理论看，它不能被综合命题证明或证伪，因为它的检验不依赖于经验事实而依赖于逻辑规则。从案例看，无法被经验观察所证明或证伪，因为它的检验来源于理论模型内部的正确性。

通过综合命题和分析命题的五个性质区分（见表1），本文证明了博弈论及其所使用的案例均属于分析命题的实证知识范畴。

结论及启示

（一）结论

经济博弈论属于分析知识。根据传统方法论分析，经济博弈论属于实证知识而不是规范知识，是关于“真”的知识。而根据语义分析，在知识类型上经济博弈论属于分析知识而不是综合知识。如图1所示，分别用实线框和虚线框表示属于和不属于经济博弈论的语言区域。在求真方法上，经济博弈论通过演绎、推理获得，而不是通过经验观察从现象中获得。

不仅是虚构的案例，任何案例运用于博弈理论研究中，既无效又无益。本文业已证明博弈论知识属于分析命题范畴，博弈论的真与案例无关，试图用空想的案例或抽象的案例来“实证”博弈理论的做法是无效。用案例去论证博弈理论，是用综合知识的研究方法去处理分析知识，是对博弈论研究方法的破坏，对整个博弈论研究是无益的。

博弈论案例使用争论双方的观点都是对的。反对者绝不允许用虚构的案例去论证实证知识的做法是正确的，是对实证精神和实证方法的捍卫。支持者绝不允许实证知识只停留在抽象思维的层面，坚持用案例证实或证伪理论的做法是正确的。产生争论的真正原因是误把作为分析知识的博弈论当作综合知识。如表2所示，争论双方的观点都是对的。

博弈论的概念篇8

关键词：博弈论语义学; 博弈; 语言游戏; 实用主义; 辛梯卡

从19世纪后半期开始，哲学进行了语言学转向，此后，哲学家、语言学家、逻辑学家关于语言哲学的研究方兴未艾。语义学属于语言哲学范畴，是关于符号或者语言符号与其所指对象关系的学科。在20世纪60年代，贾可·辛梯卡对博弈语义的思想进行了深入地研究，强调对博弈语义的基础性思考，将语义解释与博弈理论结合起来，创建了一阶语言的语义赋值博弈理论，形成了博弈论语义学。至今，博弈论语义学已经成为影响最为广泛的理论之一。

一、内容概括

博弈论语义学将博弈论与语义学结合起来，通过博弈过程来刻画人们对命题语义的理解过程，最终以确定语句的真值。辛梯卡首先给出一个个体域，任何指派都可以在这个集合中找到。博弈论语义学的核心是将量词短语看成加诸对象的变元，将句子看成语句函项，然后在给定的个体域中选择某个对象改变将对象加诸变元的指派，从而将命题的值变为选定的对象，达到消除量词，找到原子句的目的。在方法上，辛梯卡选择了博弈论，他将人们对句子的理解过程比喻为一个两人博弈，两个玩家分别为“证实者”和“证伪者”，对于一个句子，根据规则，博弈双方轮流将该句子约化，直至最后使得约化的句子不再包含变量和连接词，即原子句，此时双方就可以通过直接检查当前指派来一决输赢。如果这个原子句为真，则证实者取胜，证伪者失败，反之亦然。①运用博弈论语义学，我们能够从大量的语言信息中得到最基本、最简化的语句，从而能够轻松地判定这些语言信息的真假。

早在20世纪50年代末，辛梯卡等人提出了比较完整的可能世界语义学。可以看出，博弈论语言学遵循可能世界理论的路径，实质是对量词做替换解释。辛梯卡认为，“量词所做的事情是从简单或复杂谓词的外延中对实体作出某些选择。”②在博弈论语义学中，博弈过程就是为加诸对象的变元找到指派的过程，这是替换解释的做法。基于可能世界理论，运用博弈论语言学，我们可以轻松地谈论摹状词。这种处理方案反映了辛梯卡试图摆脱本体论承诺的困扰，将指称问题直接悬置起来。

值得注意的是在博弈论语义学中对象加诸变元的指派，体现了将指称赋予语言表达式的蒙塔古格式的哲学进路。这种实际解释的解读反映了辛梯卡通过指派的意义寻求语句真值的诉求。语义博弈的最后将对原子句做出真值判断转化为对指派做出检查，意味着多主体最后将达成意见一致，即对指派形成公共知识。通常在一个社会群体中，对于某一个具体对象会形成一种较为一致的理解和看法，即形成公共知识。当个人的背景知识与群体的公共知识不相容时，就造成了自己与其他人的沟通障碍。博弈论语义学通过明确指派的博弈语义形成了多主体的公共知识。多主体的博弈进程为自然语言赋值，将语言意义与博弈论对应起来，能够刻画公共知识的生成过程。

二、哲学溯源

自然语言与博弈之间具有紧密联系的观点反复出现于20世纪。Paul Lorenzen 首先在20世纪50年代晚期为逻辑介入了博弈语义。而“后期维特根斯坦引人注目地由其《逻辑哲学论》极为清晰的逻辑结构转向由规则生成的‘语言博弈’范例，而正如桑杜所说，有人（如斯泰纽斯）试图在博弈隐喻中添加更多的实质性内容。”③正是在前人工作的基础上，辛梯卡提出了博弈论语义学。

辛梯卡说：“我们怎样指出我们的语言所表达的意思？一种语言的一个句子与可描述的现实的部分如何联系？对于后一问题的一个众所周知的答案，维特根斯坦在《逻辑哲学论》中称为图像论。”④维特根斯坦哲学的主要贡献之一就是在前期哲学中提出了“图像论”，指出某个名称的意义即为其指称对象。图像论是维特根斯坦对于本体论问题思考的结果。维特根斯坦的这种图象与实在的关系被辛梯卡运用到了博弈论语义学之中。在博弈论语义学与图像论的关系上，辛梯卡自己也曾明确指出，“博弈语义学不排斥图示的（同形的）关系理论，图示的（同形的）关系理论在原子句和现实之间建立了联系。”⑤从这句话我们不难看出，按照辛梯卡的观点，要确定命题的真值，只要将命题与图象做个比较就可以了。

如果说维特根斯坦的图像论为辛梯卡确立了名称-客体的对应关系，那么其后期的“语言游戏说”则解答了名称如何与客体相联系的问题。维特根斯坦的“语言游戏”，实际上是强调语言的使用。在维特根斯坦看来，语词的意义在于使用，因此，我们必须根据语词具体的使用场合来确定语词的意义。换而言之，一个词的意义与语境是密切联系的，同一个词在不同的语境下具有不同的意义，所以，我们只有在各自游戏之中才能理解词的不同意义。语言游戏的主要目的就是搭建语言和实在之间的桥梁。

维特根斯坦的这种转变对辛梯卡的影响起着至关重要的作用。维特根斯坦使用“游戏”来指称目标导向的活动，诸如证实或者证伪的活动。辛梯卡延用了这一思想，他说：维特根斯坦的“用法”概念强调的是一种活动，是一种构成一个词的自然环境并使该语词从中获得其意义的活动。⑥不难发现。辛梯卡同样坚持认为语言的目标导向语言的本质，因此，在他的博弈论语义学框架下所研究的语义博弈，可以被看作是维特根斯坦意义上的一类语言游戏。

三、博弈方法

博弈论的概念篇9

【关键词】知识共享行为博弈博弈分析共享动力

一、引言

当今社会是知识复杂与快节奏并存的，为知识环境提供了新的挑战，知识的管理在企业中形成一个巨大而复杂的环境。由于知识的稀缺性和不对称性使得知识共享的过程存在种种问题，一般来看，知识是被视为私有物品被组织内的某些成员所拥有，而被共享的知识又具有了公共物品的特性，这使得人们在共享知识时会考虑到回报和“搭便车”行为，这阻碍了学习型组织的形成，为解决这个问题，必须使得知识共享成为有效的自发的手段，在企业内部创造出学习型组织，将知识在共享过程中成为企业中心地位的战略存储。笔者基于行为博弈论分析了影响学习型组织知识共享动力，以进一步提升企业的竞争力。

二、基于行为博弈论探讨知识共享的动力

行为博弈论是近年来博弈论发展的前沿成果，弥补了传统博弈论忽视了带有情感和有限预见能力的一般群体的博弈行动，它放弃了精典博弈对于人是“完全理性”的假定，认为在博弈主体进行博弈时并不仅考虑在作出决策后得到的利益，还会考虑到其他例如公平对待和情感等因素[1]。而学习型组织的自发动力基础源于行为博弈论认同人们的行为具有互动性，博弈者总是愿意对善意行为给予善意回应，即使报答损害自身物质利益也在所不惜。Rabin（1993）首先提出了互动公平均衡的概念，他认为当每个人最大化的满足其他人的所得时，博弈的结果是相互最大化的，Rabin理论中最重要的概念就是博弈参与者对他人的善意以及所感受到别人对自己的善意[2]。

Rabin的模型是建立在两人静态博弈的基础上，这使其在实际应用上有缺陷，因为一个学习型组织的成员在进行知识共享时已经远远不是一个简单的双向过程，而是一对多的辐射型模式，一个贡献者在知识共享时可能对其他多个人产生附加的价值和满足感，而一个接受者在接受知识时可能会受到多个人的贡献。Dufwenberg和Kirchsteiger（2004）[3]在其基础上提出了“序列互动均衡”（SRE）的概念，将模型扩展到多人和动态的博弈过程中，他们的模型反应了接受者（雇员A）对贡献者（雇员B）的友好度与“其收益大小”成正比，而这个已经形成的友好度反向影响了原有接受者（雇员B）作为新的贡献者对雇员A的知识共享程度。当将友好度扩展到组织内一对多的知识共享中，接受者的效用函数的一部分由本身得到的物质收益组成，另一部分则是他关于组织内每个博弈方通过友好度的互动所得，这部分正是学习型组织的存在所创造的附加价值。外部的激励可以使得学习型组织在建立之初将知识共享博弈的均衡结果引向（共享，共享）策略，当人们由于得到外部的激励以用来补充自己在选择共享策略造成的利益损失时，他们会更加的注重于友好度的建立，而互动收益随着友好度的增加而增加，这时贡献者为了取得接受者更高层次的友好而愿意放弃的物质损失更多，这部分损失在最初也是由外部激励所补偿。正是这种学习型组织在知识共享中贡献者对与其他博弈对象的互动得益与自身物质得益以及外部补偿激励三者之间的不断权衡，使得组织内部相互友好度不断提升，最终形成的是用每个人通过知识共享得到的互动收益去取代外部激励带来的效用，这也解释了当企业为促成知识共享双方选择（共享，共享）策略所付出的代价高于这个策略给企业带来的附加收益时，企业也是可以选择这种外部激励促成学习型组织的良好成长，而这种外部激励只是短期的，所促成的组织内部知识共享氛围必定是长远和可持续的。

另一方面，行为博弈论的研究告诉我们博弈的过程中信息（博弈历史）的公开是至关重要的。Seinen和Schram（1999）[4]研究了被贡献者（接受者）博弈历史是否被公布对贡献者进行知识共享的影响，根据他们的研究显示如果接受者的博弈历史被公布，将会对博弈结果产生可观的效应。研究者们设定在一定时期内，当进行贡献时，贡献者可以使接受者受益250单位，但自身要付出150单位的代价，实验中贡献者被告知他们的目标接受者最后六次的博弈行为，并被告知他们自己的选择历史也将被公布。结果显示，在博弈历史被公布的情况下，总体贡献率从25%上升到70%，这个实验研究的是高成本条件下的贡献率，与此同时还进行了低成本条件的实验，即接受者受益不变，贡献者自身付出的代价为50单位，在博弈历史被公布的条件下贡献率与高成本实验相比更高了（86%）。

三、建议

（一）完善组织内成员贡献历史记录

受到生物学的启发得到生物可以观察其他个体的合作历史习惯，以此来选择是否与之合作。因此在学习型组织内我们应及时公布每个人的贡献历史，加强信息交流和透明度，而这些信息正是由组织内参与者的博弈历史形成的。

（二）降低知识共享的成本

知识共享是有代价的，根据Seinen和Schram（1999）的实验，我们发现在低成本的条件下贡献率是更高的。为了减少贡献成本，应从以下三点切入：其一是企业对于知识共享应予以外部补贴；其二是组织内的贡献者在不断进行知识共享的过程中产生学习效应，不断提高自身共享能力，减少知识共享中知识的流通环节；其三是在外部激励的条件下持续的知识共享形成了接受者对贡献者友好度的提升，而这种友好度的形成使得在知识共享中合作的可能性提高，这意味着在博弈中为双赢的结果而协调的可能增加，此时接受者反向贡献原先贡献者的意图增强，使得原先的贡献者得到一定程度的非物质但是具有潜在利益的补贴。

（三）及时在知识共享的过程中进行知识保留

另外，在学习型组织进行知识共享过程中也会产生知识保留，组织可以运用数据库、专家系统和神经元网络去实现知识的保留。一些诸如组织运行中形成的日常条例、习惯和人际关系等文化系统的保留也尤为重要，这些形成了组织独有的记忆和经验效应，使得企业形成知识网络化保留，这为企业的创新和竞争力提供了潜在的价值。

参考文献

[1]凯莫勒（美）.行为博弈[M].北京：中国人民大学出版社，2006.

[2]Rabin，Matthew.Incorporating Fairness into Game Theory and Economic，Ame-rican Economic Review，Vol.83，No.5，1993，pp.1281-1302.

[3]Dufwenberg，Martin and Kirchsteiger，Georg.A Theory of Sequential Recipro-city.Games Econ.Behav. 2004（47），pp.268-298.

博弈论的概念篇10

【关键词】博弈论；职业判断；均衡

一、博弈论概述

博弈论既是现代数学的一个分支，也是运筹学的一个重要学科，主要研究具有斗争或者竞争性质现象的数学理论和方法，考虑游戏中个体的预测行为和实际行为，并研究其优化策略。在其基本概念中，有局中人、行动、信息、策略、收益、均衡和结果等，其中局中人，策略、收益是最基本的要素。

二、博弈论对会计职业判断的作用

（一）博弈论是会计职业判断的有效补充

在现代会计信息不对称的情况下，会计信息使用者即各方面的利益相关者的策略不仅仅是靠自己掌握的信息做出的，也是需要充分考虑其他利益相关者拥有的信息以及各种可能决策的结果，由于会计信息不对称的广泛存在，使不同信息使用者之间产生了博弈，也就是会计博弈。

（二）博弈论与会计职业判断在某些方面存在一致性

在会计职业判断中，特别强调的是通过识别、计算、分析、比较等方法，对不确定性会计事项所做出的裁决与断定的思维过程，而博弈论也是通过对不确定事项的分析，建立模型，从而选出最优方案。

三、博弈论在会计职业判断中的应用实例

（一）企业管理部门与投资者的非合作博弈

非合作博弈是指一种参与者不可能达成具有约束力的协议的博弈类型。企业管理部门--投资者的非合作博弈过程可通过例子来说明，对于投资者,企业管理部门可采取两种战略――诚实地报告信息(C),歪曲信息(D)；投资者同样有两种战略选择：购买公司股票(A),或者不购买公司股票(B)。

在这个模型中,由于信息的不对称,我们假设每个参与人都是在不知道对方所做的战略选择的情况下做出自己的战略选择的。以此为前提,我们对这个模型进行分析。在这个过程中,无论投资者采取什么策略,企业管理部门均会采取歪曲披露的策略,这样会使它的效用达到最大化.因而, (B,D)是惟一的能使每个参与人都能对自己的战略选择满意的一组战略组合。此时,该博弈达到了纳什均衡。然而,在这个博弈中, (B,D)这一结果对社会经济的发展是不利的,将会导致企业提供虚假的信息,投资者也不购买公司的股票。而(A,C)是这个博弈的最佳选择,双方都获得了较大的效用,又有利于社会经济的发展。

（二）企业管理部门与债权人

企业的日常经营活动离不开对外筹资,举债经营中,债权人与企业管理部门会签订借款合同，这里,债权人为委托人,企业管理部门为人。很明显，这一博弈为合作博弈。一个债权人面临一个选择――将100万元借给一个企业或将100万元购买年利率为10%的政府债券,公司借款利率为12%,一年后可以续贷。对比政府债券,资金借给企业存在信贷风险,即存在公司破产的可能,这样,债权人将同时损失本金和利息。司经理可以同时选择一个或两个行动。第一个行动表示为M1,即在借款未偿付前不进行分红；第二个行动是M2,即表示高额分红。如果经理选择M1,假定债权人评估破产的可能性为0.01,那么就有0. 99的可能收回借款,包括12万元的利息.然而,如果经理选择M2,债权人估计破产的概率为0. 1,因为高额的分红将降低企业的偿还能力,这样在M2的情况下,还本付息的概率只有0.9。

假定经理的报酬是根据公司的净收益,包括工资和外加一份奖金,那么,由于分红不影响净收益,经理的报酬不受行为选择的影响,因而就没有动力去促使经理选择债权人愿意接受的M1.考虑到这些,债权人会根据各种搜索的信息重新评估经理的行为选择概率,假定认为经理选择M1的概率是0.6,则选择M2的概率是0.4。如表：

四、博弈论在会计职业判断中运用存在的问题及解决方案

（一）信息失真问题

在会计职业判断中，如果不能合理地利用博弈论中的相关模型，很容易造成信息失真，企业为了达到自己利益的最大化，在一定情况下造假，这对投资者来说会造成巨大的损失。因此，在会计职业判断中，要采取相应的措施一是各参与人达成一项有约束力的协议;二是中央权威机构进行干预,制定有关规章制度,规定信息披露要求,并对违反规定的企业进行处罚。在实际运做中,基本上是采取后一种措施。