首页资料文库正文

博弈论方法十篇

时间：2023-08-16 17:39:11

博弈论方法

博弈论方法篇1

摘要：博弈论在新闻传播研究中具有方法论、学科拓展的重要意义。近年来，虽然博弈论在理论研究中取得了一定的成果，但质和量上还存在较大的发展空间。新闻理论界对博弈论的理解存在狭义、广义与日常通俗语义基础上的三个层面水平。我们可从哲学意义、方法论意义和建构意义三方面，认识博弈论在新闻传播学研究中运用的可能性。

关键词：新闻传播学博弈论方法

问题的由来

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究，不能缺少博弈论的思想。

上个世纪90年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈”一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008年10月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论，说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约，或传统哲学所说的作用与反作用意义层面，来使用“博弈”概念。诚然，博弈论研究确实离不开这些因素，但所有事物间的这些因素，不一定都是博弈论所讲的博弈。也有在互动反馈意义层面，来理解博弈的，比起前者进了一层，然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为，但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象，把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象，这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词，而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法，而是力图客观地思考博弈论方法在新闻传播学研究中，究竟能否作为一种研究视角，起到对新闻传播学研究的建构作用，甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931年提出不完备性定理：第一不完备性定理———任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方，找到双方的契合点，从新的角度描述新闻传播现象与活动的规律，调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何，有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与活动过程中，有没有相类似的情况？其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定？其二，均衡概念在新闻传播过程中能否实现？其三，新闻传播活动的行为主体是不是理性的？情况允许的话，自己的利益最大化是否是追求的目标？其四，竞争与合作的契约关系，在新闻传播过程中能否建立？答案是倾向积极的。

有了上述基本思考，我再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强经济基础决定上层建筑、意识形态，即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用，但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此，博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后，包括新闻传播业在内的文化产业，亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下，力求社会效益与经济效益的双赢，这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为，都存在博弈论的问题，因为在某一次传播活动中的传播者之间、传受之间等，都有一个行为对策选择的问题，在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化，可能追求的就是整体国家民族利益的最大化，如我国文化产业的双赢策略，即博弈论的“均衡”。公益与私利、赢利的矛盾，在社会主义初级阶段会一直存在，博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道，博弈论最初作为应用数学的一个分支，是运筹学下面的对策论。后来应用于经济领域。在西方发达国家，作为西方经济学前沿领域的博弈论，已逐渐变为一种占主流地位的基本分析工具，人们十分重视其方法论意义。

从中国的传统文化来说，经史子集弈的思想无处不在。过去曾有学者提出这样的观点，自然科学最基础的学科是数学，而社会科学的基础可以是博弈论。我们不能说它完全正确，但是至少应该承认有其一定的合理性。

从广义的角度看，传播用学派的传播模式研究，实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中，许多传播模型十分典型地体现出这种情况。该书第一版介绍了35个传播模式，第二版介绍了66个传播模式。除了个别早期线性模式外，在控制论的反馈概念出现之后，传播模式越往后越具有博弈的性质，甚至可以这样说，研究当代传播模式离开了博弈的思维，其研究是存在欠缺的，虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学传播学以及中国化的新闻传播学，从它们的发生与发展的历史来看，是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代，在需要破除自然与社会科学鸿沟的时代，谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学，从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响，人们思考博弈论在新闻传播研究领域的运用时，可能认为仅仅反映在传媒的经营管理上。这种狭义的理解，导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为，新闻传播研究中重视运用博弈论，并不是要求新闻传播理论“范式”像经济学那样转向博弈论，并把它作为核心的理论分析工具，而是在理论体系建构中，对博弈论方法给予足够的重视，将其中合理的内容，吸纳到基础理论中来。更重要的是，将博弈思维作为指导理论研究的一个窗口，扩展新闻传播理论空间。当然，也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”，进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年，但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意，原因是新闻传播理论界对博弈论尚不太熟悉，对博弈论的理解也参差不齐，甚至还存在部分抵触心理，致使研究成果的质与量不甚理想。新闻传播研究需要理论创新，对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论，对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上，在新闻传播研究领域都有用武之地，关键在于我们的观念。

参考文献：

1.肯尼斯·赫文［美］、托德·多纳著：《社会科学研究的思维要素》，重庆大学出版社，2008年版。

2.施锡铨著：《博弈论》，上海财经大学出版社，2000年版。

3.罗伯特·吉本斯［美］著、高峰译：《博弈论基础》，中国社会科学出版社，1999年版。

博弈论方法篇2

纳什均衡是现代博弈论中的核心内容和重要基础，许多理论研究和应用都是围绕这一基本理论展开或与此相关的。随着博弈论的发展和博弈研究的不断深入，人们意识到这种理论和日常经济生活的联系越来越紧密。博弈论可以揭示众多经济问题内在规律和根源，帮助人们分析经济关系，认识经济现象，评判经济效率，指导人们进行科学的经济决策，无论对企业等实际经济部门的经营活动，还是对政府的管理和政策制度制定，博弈论都有重要的指导意义。要用博弈论解决现实经济中的决策问题，就必须解决博弈模型的理论抽象和架设与经济问题实际情况的差距等问题，而解决这些问题的关键在于如何运用数模的思想抽象出问题中的得益矩阵。本文在博弈论的核心内容纳什均衡的基础上，介绍了纯战略纳什均衡和混合战略纳什均衡的相关理论，针对日常生活中的污水排放问题进行了分析。

二、纳什均衡在经济生活中的具体运用――污水排放问题

博弈的分类方法是多种多样的。根据参与人的多少，可将博弈分为二人博弈和多人博弈；根据参与人是否合作，可将博弈分为合作博弈和非合作博弈；根据博弈结果的不同，又可分为零和博弈、常和博弈与变和博弈。一般地，将不允许存在有约束力协议的博弈称为“非合作博弈”，与此相对，允许存在有约束力协议的博弈称为“合作博弈”。“纳什均衡”是非合作博弈理论中最重要的一个解概念。政府应该怎样治理污水排放是当今一个热点，也是本文所探讨的问题。政府和企业之间的关系可以运用经济学上的监督博弈来处理。

这个博弈的参与人包括政府和企业，政府的战略选择是检查或不检查，企业的战略选择是排污或不排污。假设A1是企业治理污水（不排污）所增加的生产成本，如果排污的话，则可以将A1据为所有；A2是政府检查所需成本；W是政府对企业排污所收取的罚款金额；G是企业排污所造成的污染而对社会利益的损害；假设W>A1，且W>A2+G，即政府对排污企业采取重罚措施。下表即为一个对应不同战略组合的得益矩阵。

在得益矩阵中，用p代表检查排污的概率，β代表企业排污的概率。给定p，政府检查（p=1）和不检查（p=0）的期望分别为：

E（1，β）=（W-A2-G）γ+（-A2）（1-β）=（W-G）β+A2

E（0，β）=-Bβ+0（1-β）=-Bβ

由E（1，β）=E（0，β），得β*=A2/W。可以采取两种举措：

采取重罚措施；即降低检查成本A2。另外，给定政府检查的概率θ，企业选择排污（β=1）和不排污（β=0）的期望收益分别为：

E1（p，1）=（A1-W）p+C1（1-p）=A1-W・p

E1（p，0）=0

由E1（P，1）=E（P，0）得P*=A1/G，即在现实经济中有许多企业和企业排污所取得的罚款金额W有关，对排污的惩罚越重，企业因排污所获得的生产成本越少，企业的排污概率就越小。

实际上，政府在治理企业排污的时候，应设法考虑收益权的收益问题。由于国民待遇的要求，不可能因企业性质不同而采取不同的罚款数量。所以解决这个问题只能采用行政手段。

同时也要注意地方政府在治理污水中的角色。首先，地方政府的行为要受制于中央政府既定的制度。其次，地方政府亦可亲自组织创新或担当起制度创新的重任。最后，地方政府是制度的推行维护者，对违法排污者实施重罚。

三、主要结论和后续工作展望

博弈论方法篇3

关键词：博弈论图书馆数字资源资源共享

中图分类号：G251 文献标识码：A 文章编号：1009-3044（2016）29-0017-03

随着大数据时代的到来，信息的互联互通成为提高信息服务能力的重要前提，任何一个图书馆都难以同时满足不同学科专业、不同层次用户的信息需求，也不可能实现对所有资源的收集和管理，数字信息资源共享就是为了解决个体图书馆信息资源的有限性和信息需求无限性的矛盾而采取的图书馆间合作建设与发展的策略。现阶段，我国文献信息资源共享的理论研究主要集中在文献资源的布局和配比方面，因此多将信息资源共享效率低下的症结归于管理体制的不完善、技术手段的落后和宏观调控的缺乏。信息资源共享是追求自身效用最大化的过程，是一种分析投入成本和产出收益的博弈过程，通过借鉴博弈论的研究方法，从图书馆个体利益和共享集体利益的关系出发进行研究，可以进一步认识阻碍数字信息资源共享的因素，并找到解决这些问题的方法和措施。

1博弈论概述

1.1博弈论的涵义

博弈论，也称对策论，英文为Game Theory，是根据信息分析及能力判断，研究多个决策主体之间行为的相互影响作用，以取得收益或效用最大化的一种对策理论。其中的“博弈”是指个人、队伍或组织，在一定的环境条件及规则下，同时或先后、一次或多次，根据环境和竞争对手的情况变化，从各自允许的行为或策略中进行选择、加以实施，并从中取得相应结果的过程。中国早在几千年以前就已存在博弈思想，田忌赛马的故事就是较好的博弈论案例。自20世纪80年代，博弈论得到了广泛的应用，尤其对信息经济学的发展做出了重要的贡献。

1.2博弈论“囚徒困境”经典模型分析

博弈论经典模型囚徒困境建立在一个假设之上，即甲、乙两人被怀疑是合伙的偷盗犯，警方虽逮捕了他们但没有掌握充分证明两人犯罪行为的证据，警方将其分开单独审问，双方不能进行信息的交流。警方对这两个嫌疑犯的量刑原则是：如果一方坦白，另一方不坦白，则坦白者从宽处理，判刑1年；不坦白者从重处理，判刑7年。如果两人都坦白，则每人判5年刑。如果两人都不坦白，则警方由Tile据不足，只能对每个人各判刑2年。表格1中的框图体现了这个博弈的分析过程，左方是甲的可选择策略，上方是乙的可选择，双方均可做出坦白和不坦白两种选择。其中包含数字的格对应甲乙的一个策略组合，每格第一个数字代表甲的报酬，第二个数代表乙的报酬。比如第二个数字格是指当甲坦白，乙采取不坦白的策略时，甲的报酬为-1，乙的报酬也是-7。图中的报酬均为负数，以表示判刑的年数。

在警方交待了量刑原则以后，会从自身利益出发进行分析，选择坦白或不坦白的策略，此时双方展开了博弈的过程。首先分析甲的思考过程，当甲进行决策选择的时候一定会先考虑乙的想法。根据图表1的矩阵图可见，当囚犯乙选择了坦白的策略时，囚犯甲坦白则获刑5年，不坦白获刑7年。由此，当乙选择坦白时，甲必然选择坦白（因为5

如果仔细分析囚徒困境报酬矩阵，甲乙双方若都作出不坦白的决定，会得到更好地结果，即各判刑2年。可是因为没办法进行信息沟通，每一方都会担心对方坦白但自己不坦白时会受到重判（即对方坦白获刑1年，自己不坦白则被判7年）。因此，每个囚犯都从个人利益出发考，最终的结果都会选择坦白坦白，（坦白，坦白）便是囚徒困境博弈模型必然的均衡结果。

囚徒困境的结论折射出的道理发人深省，从个体的视角思考做出的占优策略决定（-5，-5），显然劣于做出合作策略的选择（-2，-2）。换句话说，从单个个体的角度出发得出的占优策略，从整体而言得出的却是最不理想的结局。囚徒困境最终达到的策略均衡，体现出了个人理性和集体理性的矛盾冲突。目前，图书馆在数字信息资源共享问题上也存在着类似的矛盾，我们将“囚徒困境”的博弈分析方法运用到资源共享问题上，也可以解释合作的不稳定性及相关问题。

2图书馆数字信息资源共享的博弈分析

2.1数字信息资源共享的静态博弈

数字信息资源共享一直是图书情报界关注的重大课题，每个图书馆都有资源共享的愿望，图书馆信息资源的共享，可以实现整体效用的最大化。假定参与共享合作博弈的图书馆为A、B两个，分析图2矩阵可以发现，如果A、B馆都选择合作策略，每个参与者均可获得收益为10，总报酬最大为20；如果A、B两者中有一方选择合作，而另一方选择不合作，参与者报酬分另4为6、12，总报酬为18；倘若A、B两馆都做出不合作的选择，那么各馆报酬都是8，总报酬16是最小值。可见（合作，合作）策略是团体利益最大的策略选择（20>16）。

事实上，一些图书馆为了自身的利益，往往从个人理性角度出发，最终与团体利益冲突，陷入“囚徒困境”。类似于囚徒甲、乙的决策过程，A馆会根据B馆的决策选择策略，当B选择合作策略时，A若选择合作可得10，A若选择不合作，既省去了共享资源需付出的成本，又无偿享受了B馆提供的信息资源，报酬是12。因此，A必然不会合作（显然12>10）。同理可推得，B做出了不合作的选择时，A仍然会选择不合作策略（因为8>6）。显而易见，无论B做出合作或者不合作的选择，A都会采取不合作策略。同样的分析结果对B馆也是适用的，最后的博弈结果为（不合作，不合作），这时总报酬16，小于最优策略的总报酬20。

这一博弈矩阵可以看出，大家最初都希望达到（合作，合作）总报酬为20的结果，但是通过报酬矩阵分析可见，即便已经签订合作协议，各自馆也会抱有“搭便车”的心理，就是如果你合作我不合作，我就可以占到便宜（12>10），于是各自违背共享约定，形成了图书馆资源共享博弈的（不合作，不合作）结果。

上述两种博弈均为一次性博弈，参与博弈者都只能进行一次选择决定，另外博弈参加者在做出自己决定的时候并不清楚对方的决定，大家都是同时决定自己的一次性策略选择。处在这样的前提之下，参与者都做出了自己的策略选择时便已完成了一个完整的博弈过程，并得出了最终结论，这种博弈称为静态博弈。在静态博弈中，出于个人理性的策略选择往往导致了从整体而言的最坏结果。一方面，在达成合作协议以后，参与者都会有投机的心理，并从自身利益出发暗地选择了不合作的做法。另一方面，对于一次性的博弈，只要参与者做出了最终决定便完成了博弈过程，对于违反约定的行为没有补救和惩罚的有效措施，无法通过后续的博弈进行调整和制约。

2.2数字信息资源共享的动态博弈

实际上，博弈通常为一系列重复进行的运动，即相对静态博弈而言的动态博弈，在连续进行的动态博弈中，上面结果会有所不同。

2.2.1数字信息资源共享的无限次重复博弈

无限次重复博弈是指相同结构的博弈可以无限次地重复进行下去。如果设定在数字资源共享的无限次重复博弈中，不管哪一方图书馆在其中的一轮合作博弈中采取了不合作的行动，在以后的博弈中便会遭到其他馆“不合作”的报复策略，而且这一不合作策略会在未来的所有博弈中重复下去，长此以往，首先违约的一方便永远失去了与另一方合作的机会。因为在无限次重复博弈中，存在着对欺骗和违约行为报复的机会，因此参与合作的各方会担心采取不合作策略给自己带来的长期损失，不会主动选择不合作的策略，使得数字信息资源共享合作得以维持。

继续用图2加以说明，对于图书馆A，各馆如果一直处于合作的状态，便可以长期获得报酬10，累积起来10+10+10+…，但如果抱有机会主义的想法，打破约定选择了不合作的策略，他的确获得了一次性的利益，得到报酬为12，但在以后的无限次重复博弈中，均会受到对方不合作的报复行动，收益只能为8。为了一次性的好处，使得日后的收益从原来合作策略时的10+10+10+…下降为不合作策略时的8+8+8+…。显然，任何一个图书馆在数字信息资源的无限重复博弈中，为防止被报复而丧失长期的经济效益，都会遵守协议，采取合作的策略。

2.2.2数字信息资源共享的有限次重复博弈

在有限次重复博弈中，假设事先约定只合作5次，用逆推法进行分析，各方均知道第5轮博弈是最后一轮博弈，因此这一轮博弈便同静态博弈无异。根据前面的分析，这一轮的违约不可能在以后受到惩罚和损失，那么，每个图书馆出于个人理性出发选择的占优策略就是不合作的结果。逆推到第4轮，因为大家都可以推算出第5轮不合作的结果，因此第4轮博弈也会采取不合作的策略。由此类推直到第1轮，都可以得到同样的结果。显然，在有限次重复博弈中，图书馆数字信息资源的共建合作是不稳定的，博弈的最终均衡策略为（不合作，不合作）。

3用博弈论的思想解决数字信息资源共享问题

在现实生活中，参与博弈的各方合伙的机会必然是有期限的，信息组织间的合作共享是否根本无法实现呢？显然在现实生活中是存在着长期合作的共同体。事实上，无限次重复博弈的主要界定标准在于参加者均不清楚哪一轮博弈会是最后一轮，合作各方担心违约会遭到日后的“报复”便会把合作策略坚持下去。在有限次的重复博弈中，如果合作双方不确定哪一轮是最后一轮，参与者会认为日后还要继续打交道、博弈状态会继续维持，这便同无限次重复博弈无异。所以，在不能确定终止期的有限次重复博弈的图书馆数字信息资源共享博弈中，合作解是可以存在的。当然，为了维护合作模型的稳定性，更好的实现团体利益的最大化，必须配合以必要的措施。

3.1建立信任机制

图书馆信息资源共建共享机制的成功建立，取决于成员间的相互信任和对于联盟内部规则的遵守程度，能够取得收益同时实现持续的发展，其中成员馆之间的信任是至关重要的。成员间除了应相互理解对方的行为和立场，尊重对方的观点，还应加强组织内的交流，达成对某些问题的认识。另外，信任评审机制的建立也十分必要，通过建立完备的综合性、长期性评估测试标准系统，对成员的联盟策略及行动影响因素进行持续地跟踪测评，通过完善细致公平的执行制度，形成稳定可靠的运行机制。

3.2建立监督机制

对于合作中的各馆，都希望采取最优于自己的策略，以期得到最好的结果，因此为了达到合作团体利益的最大化，应该对各成员进行有效监督，维护合作协议的顺利执行。要在建立领导协调组织和健全监督机制上下工夫，在明确各成员权利义务的基础上，监督各成员的行为。对于损人利己的倾向和行为，及时采取措施，必要时对违反合作协议的成员进行制裁，甚至终止合作。

3.3建立保障机制

因为各图书馆之间的规模与发展水平不均等，建设规模大、信息丰富的图书馆往往很难与信息量相对较少的图书馆实现资源共建共享，另外数字信息资源共建共享经常发生“搭便车”的问题，这些都需要通过建立保障机制加以制约。在内部评估制度规范的基础上，对贡献大的图书馆要采用奖励的办法进行收益补偿，同时针对慵懒的图书馆，通过采取惩罚的方式实现督促作用。

在具体的实施上，以惩罚措施为例，在成员馆签订共享协议时，规定不合作的一方会受到经济制裁，报酬减3，在矩阵图2的基础上可以得到新的报酬矩阵（见图3）。按“囚徒困境”的分析思路，如果A馆选择共享，B馆选择了不共享，B得报酬为9而不是原来的12，因为B馆不共享受到了事后的经济制裁（12-3=9），小于（共享，共享）中的报酬10，可见，B怕受到惩罚得不偿失必然选择共享。对于A的分析也是如此，最后的博弈均衡状态一定是（共享，共享），克服了欺骗或违约行为，达到了信息资源共享的目的。

博弈论方法篇4

[关键词]博弈论经典博弈模型博弈行为博弈决策

“博弈论”原本是数学的一个分支，但由于它较好地解决了对竞争等问题的可操作性分析，成为经济学中激荡人心的一个研究领域。可以说，“博弈论”已经改变了经济学的传统轮廓线。从对“博弈论”简要、通俗的介绍中可以发现，我们身边充满了博弈，或者说，我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学，也理应属于社会学、政治学、心理学、历史学等，这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。“博弈论”的英语原文是Game Theory，直译过来就是游戏论、运动论或竞赛论。譬如在足球比赛中，双方都想在努力巩固防守的同时，积极进攻以置对方于“死地”。这种行为就是一种博弈。“弈”在汉语中是下棋的意思，下棋中的双方行为特征也如同足球比赛中双方的行为。当然，扩展开来讲，企业之间的竞争、国家之间的角力等等，都是“游戏”，只是游戏的内容不同而已。

一、博弈简介

“博弈论”就是分析博弈行为和博弈决策的一门科学。

今年的诺贝尔经济学奖，已于前不久为“博弈论”研究专家罗伯特・奥曼和托马斯・谢林所获得，1994年度和1996年度的诺贝尔经济学奖，也分别由纳什、泽尔滕、海萨尼、莫里斯和维克瑞等“博弈论”专家分享。如此众多的“博弈论”研究专家的频频获奖，凸现了“博弈论”在主流经济学中日益重要的地位。

“博弈论”原本是数学的一个分支，但由于它较好地解决了对竞争等问题的可操作性分析，成为经济学中激荡人心的一个研究领域。可以说，“博弈论”已经改变了经济学的传统轮廓线。

我国古代有个“田忌赛马”的故事，说的是齐威王与大将田忌各出三匹马，一对一比赛三场，由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快，所以田忌总是以0∶3告负。后来田忌的谋士孙膑给田忌出主意，让最差的马去与齐威王最快的马比，而让最优的马去赢齐威王次优的马，让次优的马去赢齐威王最差的马，这样便以2∶1取胜。但我们还可进一步设想，如果齐威王知道了田忌的花招后，便会在以后的比赛中也更改出马的次序，当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢?这便是“博弈论”更深一层次研究的问题了。

二、一个非技术性的定义

博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。从定义我们可以看出，规定或定义一个博弈需要设定下面四个条件。

1.博弈的参加者。即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织。

2.各博弈方各自可选择的全部策略或行为的集合。即规定每个博弈方在进行决策时，可以选择的方法、做法或经济活动的水平、量值等。

3.进行博弈的次序。在现实的各种策略活动中，当存在多个独立决策方进行决策时，有时候需要这些博弈方同时作出选择，以为这样能保证公平合理，而很多时候各博弈方的决策又有先后之分，并且有时一个博弈方还要作不止一次的决策选择。

4.博弈方的得益。对应于各博弈方的每一组可能的决策选择，都应有一个结果表示该策略组合下各博弈方的所得或所失。

以上四个方面是定义一个博弈时必须首先设定的，确定了上述四个方面就确定了一个博弈。博弈论就是系统研究可以用上述方法定义的各种博弈问题，寻求在各博弈方具有充分或者有限理性、能力的条件下，合理的策略的选择和合理选择策略时博弈结果，并分析这些结果的经济意义、效率意义的理论和方法。

三、博弈的结构和博弈的分类

由于博弈研究的问题多种多样，因此博弈模型相互之间的差别可能会很大。这些差别可以理解为都是博弈问题的结果差别。当博弈结构有差别时，博弈的结果和分析方法往往也有不同，因此对博弈的结构特点有所了解是很有价值的，在此我们提出博弈论问题的分类和博弈理论的结构。

1.博弈中的博弈方：博弈中独立决策、独立承担博弈结果的个人或组织为博弈方。因此我们把博弈方分为“单人博弈”、“两人博弈”和“多人博弈”。这里的“单人博弈”和“两人博弈”，并不一定是自然人，而是指前面所说的博弈方，既可以是个人，也可以是经济社会组织。

2.博弈中的策略：博弈中各博弈方的策略内容称为“策略”。

3.博弈中的得益：得益即参加博弈的各个博弈方从博弈中所获得的利益，它是各博弈方追求的根本目标，也就是他们行为和判断的主要依据。

(1)零和博弈：它是常见的博弈类型，同时也是被研究得最早、最多的博弈问题。

(2)常和博弈：它也是很普遍的博弈类型。常和博弈可以看作零和博弈的扩展，零和博弈则可以看作常和博弈的特例。

(3)变和博弈：零和博弈和常和博弈以外的所有博弈都称为“变和博弈”。

(4)博弈的过程：博弈的过程也是博弈结构的重要方面。根据博弈过程方面的这些差异，博弈问题通常分为“静态博弈”、“动态博弈”和“重复博弈”几个大类。

①静态博弈：所有博弈方同时或可看作同时选择策略，采取行动的博弈是静态博弈。

②动态博弈：指博弈方的选择和行动有先后之分，后行者可以根据先行者的策略选择来决定自己的策略。

③重复博弈：所谓重复博弈实际上就是同一个博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈也成为“原博弈”或“阶段博弈”。

我们研究的大部分是重复博弈的原博弈都是静态博弈，或者说是由静态博弈构成的。这种由同样一些博弈方，在完全同样的环境和规则下重复进行的博弈，在现实中有很多实际的例子。如：体育竞技中的多局制比赛、商业中的回头客问题、企业之间的长期合作或竞争等等，如果不考虑环境条件方面的细小变化，都可以看作是重复博弈问题。

5.博弈的分类和博弈理论的结构

博弈结构这些方面的差异对博弈结果和博弈分析都有重要的影响，而且博弈分类相互之间都是交叉的，并不存在严格的层次关系，但我们还可以根据各种分类对博弈分析方法影响程度的大小排除大致的次序。

(1)是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契，以选择共同的策略，此种博弈就是合作博弈。反之，就属于非合作博弈。

(2)是分为零和博弈、常和博弈与变和博弈。

(3)是分为静态博弈与动态博弈。

(4)是分为完全信息博弈与不完全信息博弈。在前一种博弈中，每一个参与者都拥有全部的相关信息，只拥有部分相关信息的便属于后一种博弈。

四、“博弈论”中的经典博弈模型

根据博弈定义，小到企业之间的竞争和合作，国家之间的倾销反倾销、制裁和报复等，都有可以归结为博弈问题。“博弈论”中有一些由点及面、发人深思的经典案例，这些案例不仅使专业研究人士如醉如痴，也使一些普通民众兴致盎然；不仅成为“博弈论”中的一道亮丽风景，也是整个经济学领域中的学术奇葩。

1.囚徒困境

假设警察局抓住了两个合伙犯罪的嫌疑犯，但获得的证据并不十分确切，对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白，如果他们都交代犯罪事实，则可能将各被判刑5年；如果他们都不交代，则有可能只会被以较轻的妨碍公务罪各判1年；如果一人交代，另一人不交代，交代者有可能会被立即释放，不交代者则将可能被重判8年。

对于两个囚徒总体而言，他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时，都要冒很大的风险，一旦自己不交代而另一囚徒交代了，自己就将可能处于非常不利的境地。对于囚徒A而言，不管囚徒B采取何种策略，他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。因此，囚徒困境反映了个体理与集体理之间的矛盾、冲突。

囚徒的困境博弈的重要意义，在于类似的情况在社会经济活动中具有很大的普遍性，在市场竞争的各个领域和方面，在资源利用和环境保护，以及政治、军事和法律等各个领域问题中，都有类似囚徒困境的现象。

2.智猪博弈

假设猪圈里有一大一小两只猪，猪圈的一头有一个猪食槽，另一头有一个控制猪食供应的按钮，揿一下按钮会有10个单位的猪食进槽。若小猪去揿，大猪先吃，大猪可吃到9个单位，小猪揿好后奔过来，则只能吃到1个单位；若大猪去揿，小猪先吃，小猪可吃到6个单位，大猪吃到4个单位；若同时去揿，奔过来再同时吃，大猪可吃到7个单位，小猪吃到3个单位。在这种情况下，不论大猪采取何种策略，小猪的最佳策略是等待，即在食槽边等待大猪去揿按钮，然后坐享其成。而由于小猪总是会选择等待，大猪无奈之下只好去揿按钮。这种策略组合就是名闻遐迩的“纳什均衡”。它指的是，在给定一方采取某种策略的条件下，另一方所采取的最佳策略(此处为大猪揿按钮)。

智猪博弈现象在日常生活中也是司空见惯的。如大股东行使监督上市公司的职责，而小股东则坐享这种监督带来的利益，即所谓“搭便车”；爱清洁的人经常打扫公共楼道，其他人搭便车；等等。

3.斗鸡博弈

两只公鸡面对面争斗，继续斗下去，两败俱伤，一方退却便意味着认输。在这样的博弈中，要想取胜，就要在气势上压倒对方，至少要显示出破釜沉舟、背水一战的决心来，以迫使对方退却。但到最后的关键时刻，必有一方要退下来，除非真正抱定鱼死网破的决心。

这类博弈也不胜枚举。如两人反向过同一独木桥，一般来说，必有一人选择后退。在这种博弈中，非理性、非理智的形象塑造往往是一种可选择的策略运用。如那种看上去不把自己的生命当回事的人，或者看上去有点醉醺醺、傻乎乎的人，往往能逼退独木桥上的另一人。还有夫妻争吵也常常是一个“斗鸡博弈”，吵到最后，一般地，总有一方对于对方的唠叨、责骂装聋作哑，或者干脆妻子回娘家去冷却怒火。在企业经营方面，在市场容量有限的条件下，一家企业投资了某一项目，另一家企业便会放弃对该项目的觊觎。

博弈论方法篇5

关键词博弈论体育领域应用

一、博弈论概述

（一）博弈论的发展

博弈思想源远流长，虽然起始人们没有博弈的相关知识，但是博弈意识时刻伴随着人们的生活，因为根据现在博弈理论，我们就可以知道只要有选择，只要有竞争，就有博弈的存在。就有关文献记载的最早博弈思想的规范理论，可追溯2000多年前我国古代的“齐威王田忌赛马”等。

博弈理论的形成不是一蹴而就的，他有自己的发展历程，就目前而至已经自成体系，博弈论的理论体系大体上可以分为自然发展、专门研究、运用、高潮4个阶段，其特征、代表作和人物见表1 。

表1博弈理论历程

阶段时间特征代表人物

自然发展二十世纪20-40年代数学家―最佳策略―具体决策问题―研究方法用于军事领域 1944年诺依曼《博弈论与经济行为》

专门研究二十世纪中期经典理论被验证：囚徒困境和纳什均衡等纳什均衡、塔克囚徒困境

运用二十世纪80年代引起了经济学结的革命威尔逊等

高潮二十世纪90年代在经济、政治、军事、外交、公共选择、犯罪学等领域应用广泛 1994年Nash、Selten、Harsanyi

（二）博弈论要素

要想构成一个博弈，一般情况下需要存在五个要素，并且其中前三个是必须具备的：博弈主体（又称博弈方，指博弈中的决策者）、博弈策略集合、博弈者的收益（博弈的结果，这是博弈的焦点，一切就围绕着这个努力）、博弈的过程（也就是博弈方选择的时间先后，同时进行抉择，或者抉择有先后或者重复等）、博弈的信息（对自己和对方的处境、条件的掌握情况），其中前三个是基本要素。

（三）博弈论分类

由于博弈分类的要依据不同，可以有多种分类方法，本文主要从以下三个角度进行博弈的分类。

1．按照参与人行动的先后顺序

当这个作为依据时，博弈有静态博弈、动态博弈之分。静态的博弈是指博弈参与者在同一个时间做出策略选择，不能知道对方的选择结果，或者即便时间不是同时但不知道对方的选择是什么，对自己的没有参考，也叫做静态博弈；动态博弈指参与人不是在同时做出选择，后者能知道前者的选择信息，并对自己的选择有很关键的影响，这样对自己有参考价值。

2．依据博弈主体之间掌握的对方的相关信息如何

此时的博弈种类就存在有完全信息博弈、不完全信息博弈两种情况。完全信息指的是对对方的和博弈相关的信息有了完全掌握，同时呢，对方对自己的信息也是了如指掌，否则，就是不完全信息。

3．按照根据博弈结果的支付水平以此为切入点的话，博弈的种类就存在三种：零和博弈、常和博弈、变和博弈。零和博弈也就是两方的得益之和为零，一方赢的等于一方输的值，两者所得的和总为零；常和博弈指博弈方共分一块蛋糕，你多我就少，你少我就多，总和是一定的；变和博弈则是除上述外的所有博弈。

二、博弈论理论贡献与现实意义

博弈论理论从形成至今，已经获得了很多领域的成功，但最主要的成果集中于经济学领域，至2005年诺贝尔经济学奖已经5次授予博弈论领域的经济学家，特别是在全球经济快速发展的进30年来共4次授予博弈论领域的经济学家。诺贝尔经济学奖在这么短的时间内多次频繁光顾博弈论领域,彰显博弈论在经济学中的重要地位。同时也说明博弈论具有一定的实用价值。

（一）国外博弈论在体育领域中的应用

通过文献资料的调查与整理分析发现，国外已经有博弈论在竞技体育领域中应用的具体实例，在网球领域有人对1983年美国网球公开赛中克丽丝•艾弗特和马丁娜•纳芙拉蒂洛娃的比赛进行了博弈分析研究，用两位选手的底线击球线路和防守策略构建了博弈矩阵，演示了“零和博弈”中的纳什均衡的求解方法，提出了“混合出招”的概念。并进一步构建了网球博弈的序贯行动模型，分析了“后动优势”的形成过程。

在博弈类型分类演示中，阿维纳什•迪克西特与苏珊•斯克丝用（美式）橄榄球总的单次对局构建了进攻与防守的博弈模型，系统的描述了离散型策略同时行动博弈的“博弈矩阵表（game table）”、“支付表(payoff table)”及“策略式(strategic form)”的相关概念。

但是博弈理论在国外运用最成功的体育项目是在足球的点球射门的博弈中，构建了射手与守门员的博弈模型和网球发球与接发球的博弈模型，并在此基础上进行了多次的博弈行为实验，实验的结果表明足球点球博弈模型与具体实践较为一致。

（二）国内博弈论在体育领域中的应用

以博弈论为检索关键词进行检索，得出仅人民大学图书馆共有博弈论著作354条记录，其中有关体育领域的著作一部，名为《体育博弈论》作者是李益群和谢亚龙二人，奠定了博弈论在体育科学领域研究的基石。系统的阐述了一般博弈论和体育博弈论现象的情况，提出了竞技体育博弈论是研究现代竞技体育竞争中如何去战胜对手、提高胜算、获取优胜的科学理论，并对体育博弈论的产生背景和科学基础进行了论证。提出体育博弈论现象、博弈系统、博弈制胜规律、博弈决策、博弈战略、博弈策略、博弈创新、博弈方法、博弈实践、博弈实战等等构成基本概念体系。并且进一步分析了竞技体育博弈系统的构成、特点和层次，规划了竞技体育博弈论研究的具体内容，为展开这项理论在体育领域的进一步研究奠定了必要的理论基础。

体育领域的题名为博弈研究文献总数为213篇，集中在宏观领域内的研究有李益群与谢亚龙的《竞技体育博弈论初探》是博弈论在体育领域的应用开始的标志，其后的王成夫的《试论体育博弈论的理论基础》与罗智波等人的《论博弈论在体育比赛中的运用》两篇，前者主要从体育博弈论的基础入手,分别就博弈论,体育博弈研究主体、对象与内容及竞争的特征等方面进行了阐述和研究,文章的主要意图还是试图逐步构架和完善体育博弈理论体系。后者主要阐述博弈论在体育比赛中的重要意义以及博弈论对体育研究的作用。文章指出：体育博弈,是人类最具理想意义的竞争,是在一定规则的限定下进行的,它贯穿于体育运动的始终。体育发展与进步的历史进程,与社会、政治、经济文化更紧密的结合,促进了体育理论的产生与发展。根据现代体育的发展, 体育博弈论的发展历程从时间和特征上进行了划分，大致经历了5个发展阶段。就为微观领域的体育博弈研究有：棋类博弈研究、竞赛表演、竞技体育人才培养、兴奋剂监管、大型体育活动内部知识共享行为、篮球运动、象棋竞技与改革、高校运动队训练与管理、体育教学、足球运动、网球运动等领域。

三、结论

总结研究得出，通过把博弈论与体育博弈论的哲学思维模式应用在现代体育运动运动中，借助于体育运动运动实践中的真实、具体的博弈现象进行博弈分析，能够找出博弈的关键因素，根据现实需要制定相应的措施，以期达到用博弈的理论和方法指导现代体育运动向着良性方向的发展。博弈论虽然可以作为体育运动的有力补充，也有相应成果，但还需要进一步深化，以期待理论与实践的高度结合。

注释：

李益群,谢亚龙.体育博弈论[M].北京:北京体育大学出版社.2002.60.

参考文献：

[1]姚国庆.博弈论[M].天津:南开大学出版社.2003:5-7.

[2]李益群,谢亚龙.体育博弈论[M].北京:北京体育大学出版社.2002.51.

[3]李益群,谢亚龙.竞技体育博弈论初探[J].体育科学.1999.19(5):9-13.

博弈论方法篇6

一、审计与博弈论

审计（Auditing），拉丁词根Audiro源自于“听”的意思。现代审计是独立的审计人员根据充分与适当的证据，对企业财务报表符合既定标准的程度表述意见，以提高财务报表与其他有关资料的公允性，增进使用者的信赖，注册会计师因此被称为“不拿国家工资的经济警察”。审计客体之一是会计单位的价值运动。但是经济运行主体的人，作为“经济人”的会计单位，始终将是审计人员面对的真正主体。人与人关系中的相互影响、相互作用、利益冲突与一致是博弈论研究的重要内容。

博弈论（Game theory，又称对策论）研究决策主体的行为在发生直接的相互作用时，人们如何进行决策以及这种决策的均衡问题。博弈论是研究理性的决策者之间冲突与合作的理论。参与者、策略和支付函数是博弈必不可少的三个基本要素。博弈论按对弈者之间的协调程度可分为合作博弈和非合作博弈，按照对弈者所拥有的关于博弈的信息结构，可将博弈分为完全信息博弈和不完全信息博弈。按照博弈的时同或对弈者的行动次序可将博弈分为静态博弈和动态博弈。按照博弈的收益分配结果可分为零和博弈和非零和博弈。在现实经济问题中，绝大多数博弈问题都是非合作、不完全信息、动态的、非零和博弈。因此研究非合作博弈、不完全信息博弈、动态的博弈更有实际意义。

二、现代审计的博弈分析

1、现代审计博弈的参与者

现代审计博弈双方，一方是独立的审计人员或机构及委托方，另一方是被审企业、单位或个人。被审计的单位或个人会从自身利益出发，根据预先了解到的可能的审计程序和方法，相应地采取对策，相应地做出理性或近乎理性的选择，审计人员也会根据预先了解到的企业情况采取相应的对策，相应地做出理性或近乎理性的选择。

2、现代审计博弈的支付（或赢得）

现代审计博弈中的各方当事人，代表着不同的利益主体，他们各自有不同的目标函数或利益目标。委托方及审计人员是往往更关心财务报表的公允性，企业经营者往往更关心利润和评价。

3、现代审计的博弈均衡

一项审计程序能否达预先设定的审计目的，不仅仅取决于审计程序方法本身，它不是单向的，因为审计博弈的参与者之间的行为是相互作用、相互影响的。审计人员会根据审计目标的不同，不断调整审计程序，而被单位或个人也会不断通过预期和学习，从自身利益的角度做出相应的选择。审计结果实际上审计博弈各方理性决策与选择的结果，它是一种博弈均衡。

4、动态博弈――重复博弈

在不同的审计目标下，审计人员采取审计程序、方法会不同，在不同的时期，对同一审计目标，审计人员采取的审计程序、方法也会不同。当审计人员发现审计程序、方法与审计目标不一致时，就会调整审计程序、方法。相应地由于预期作用，被审单位和个人对策的选择也将发生变化。从审计操作的过程来看，它实际上是一个动态博弈的过程。从长期来看，它是无限的重复博弈。

三、现代审计缺陷的博弈分析

下面以著名的“囚徒困境”来说明现代审计的缺陷

博弈论方法篇7

一、蜈蚣博弈悖论

蜈蚣博弈是由罗森塞尔(Rosenthal) 提出的。蜈蚣博弈具体如下：两个博弈方A、B 轮流进行策略选择，可供选择的策略有“合作”和“不合作”两种。规则是：A、B 两次决策为一组，第一次若A 决策结束，A、B 都得n，第二次若B 决策结束，A 得n-1 而B 得n+2；下一轮则从A、B都得n+1 开始。假定A 先选，然后是B，接着是A，如此交替进行。A、B 之间的博弈次数为一有限次，比如198 次。

假定这个博弈的各自的支付给定如下图：

图中的数组第一个数是博弈方A 得益，第二个是B 得益。当A 决策时，他考虑博弈的最后一步( 第198 步)：B 在“合作”和“不合作”之间做出选择时，因“合作”收益100，而“不合作”收益101，根据博弈逻辑的基本假设——理性人假设，B 会选择“不合作”。但是，要经过第197 步才到第198 步。在197 步，A 考虑到B 在第198 步时会选择“不合作”——此时收益98，小于B 合作时的100——那么在第197 步时，他的最优策略是“不合作”——因为“不合作”的收益99 大于“合作”的收益98；……如此推论结论是：在第一步A 将选择“不合作”，此时各自的收益为1 ！这就是逆推归纳法悖论，即“蜈蚣博弈悖论”。

二、蜈蚣博弈悖论的认知分析

新古典经济学强调个体行为在资源配置中的作用，借用哲学的“理性”概念对复杂人类行为进行抽象假定，即经济理性是一种行为方式假定，经济行为人对其所处环境的各种状态均有完全信息，并在既定条件下每个行为人都有选择的意愿和能力，从而使自己获得最大效用或利润，这遵循自利性、一致性以及极大化原则。蜈蚣博弈悖论表明个体理性和集体理性的矛盾与冲突，在博弈论中引起长期关注。大量有关蜈蚣博弈悖论的实验结果表明，参与者的道德意识、性别及文化水平等都会对策略选择（合作或不合作）产生影响。也有学者认为，博弈方并不遵循利己主义，而是遵循康德的绝对命令理性化主义，即你希望别人怎么做，你自己就怎么做。

库恩定理，是指每一个有限完美信息动态博弈，均有一个子博弈精炼均衡。证明库恩定理的方法是逆推归纳法，即从动态博弈的最后一个阶段局中人的行为选择开始逐步倒推回前一个阶段，一直推到第一个阶段局中人的行为选择。每个阶段局中人按照理性偏好确定其行动，得到的行动序列就是一个子博弈精炼均衡。这一方法的有效性依赖于关于局中人认知的预设：“每个局中人是理性的”是共同知识。共同知识预设是有限动态博弈适用逆推归纳法从而存在子博弈精炼均衡的前提条件。库恩定理之后，“蜈蚣博弈”出现悖论，在这些博弈当中，如果使用逆推归纳法，则会产生与直观抑或常识不相吻合的结论。事实上，逆推归纳法悖论，只是表明博弈论关于局中人理性的共同知识以及预设，与实际情况弈局中人的理性认知状况并不一致，因而它并不是逻辑悖论。对此，解决这一矛盾的途径有很多种：一是，在某些博弈中弱化认知预设，只要求博弈结构和局中人的理性是共有知识，而不必是共同知识。二是，放弃完全信息的分析框架，而转向不完全信息博弈。

主体的个性差别，或者说异质性，导致了主体的认知水平和认知状态是不同的，因而无法确保特定认知分析对所有主体都具有一致性。蜈蚣博弈悖论一种新的解悖思路，就是将主体的主观感受计入收益的一般性框架，在某种前提假设下，将主体的主观感受折算为收益，计入其总收益，从而建立模型来分析和预测其结果。

参考文献：

[1]RobertJ.Aumann.Onthe Centipede Game[J].GamesandEconomic Behavior,1998(23):97~105.

[2] 谢识予. 经济博弈论[M]. 上海: 复旦大学出版社,2007:162~164.

博弈论方法篇8

[关键词] 博弈论与旅游学价格战对策

一、博弈论及旅游价格战的博弈模型

1.博弈论与旅游学。博弈论又称为对策论（games theory)，是研究具有斗争或竞争性质现象的理论和方法，它既是现代数学的一个新分支，也是运筹学的一个重要学科。它较好地解决了对竞争等问题的可操作性分析，近年来不仅成为经济学中激荡人心的一个研究领域，也为其他许许多多包含竞争现象的问题提供了精细的分析技巧。随着博弈论在各学科中的普遍应用,旅游学中的各分支学科也在不同程度上开始了应用博弈论方法进行分析的探索。

2.旅游公司价格竞争的博弈模型。价格竞争是行业重复建设、对行业总体市场容量过度乐观、企业数量发展过快的结果。近年来，由于国家产业政策的支持, 旅游的产业规模急剧膨胀,旅游公司数量增长幅度大大超过了旅游人数的增长幅度，从而造成供求失衡。旅游公司为争夺市场份额,纷纷把降价作为争夺客源的主要手段。按照博弈论的观点，在非合作博弈条件下，降价是企业的合理选则。现用博弈模型分析如下，假定在旅游市场有两家经营同类产品的旅游公司：a和b，还假设他们同时行动，并只有两种选择：降价和不降价。从而得到表1的旅游价格战博弈模型：

（r——对双方合作的奖励，p——对双方背叛的惩罚，s——给笨蛋的报酬，t——对背叛的诱惑）

运用画线法可求得该博弈的得益数组（420，420）所对应的策略组合（降价，降价）为本次博弈的纳什均衡。wWw.133229.cOm由于纳什均衡是一种非合作博弈均衡，虽然双方选择（不降价，不降价）要比降价好,但是参与博弈的双方都是以追求自身利益最大化为目标,每一方都不能保证对方会不降价而自己也采取不降价来共同分享利益,为防止对方降价而自己不降价给自己带来损失的情况发生,最终双方选择的是均采取降价的纳什均衡（420，420）。于是你降我也降，你再降我也再降，重复博弈的结果就是价格大战越来越激烈。这从博弈角度说明了价格竞争的必然性。

实践证明，即使公司能够签订都不降价的行业自律协议，也是无法有效避免降价竞争的发生。因为策略组合（不降价，不降价）不是纳什均衡，行业自律协议不具强制性约束力，即使在短期内能够维持在脆弱的自律平衡状态，机会主义或其他因素也会很快将此不稳定均衡状态破坏掉。这在博弈理论中已有严格的证明。

二、应对旅游恶性价格竞争的对策

在市场经济环境下，自由竞争是市场经济活力的源泉。价格竞争是市场竞争的一种重要方式，特别是在供需失衡的行业中，当供大于求时，价格竞争将更为激烈。然而过度的价格竞争对行业的发展是不利的，以下对如何避免过度价格竞争做一探讨。

1.通过改变博弈模型的结构消除过度竞争。据前所述博弈模型，旅游公司之间的价格战博弈只要符合两个条件:1）t>r>p>s；2）r>（t+s）/2，各公司的最佳选择都是该博弈唯一最优的“纳什均衡”（降价，降价）。要避免出现旅游恶性价格战，可以通过改变博弈结构，使博弈方的收益值不再符合该博弈模型的两个条件。

一种方法是博弈双方主动改变博弈策略，将公司目标从“收入”调整为“利润”。以表1的旅游价格战博弈为基础，根据旅游业的特点，不妨假设选择“不降价”策略时，旅游企业的利润率是30%，选择降价策略时，旅游企业的利润率是20%，则得表2。

以利润为目标的旅游价格战博弈不再符合原博弈模型的两个条件，博弈的最终结果发生了改变，不再是唯一的（降价，降价）。其中纯策略纳什均衡通过划线法容易找到为两个，即（150，150）和（84，84）。目前博弈论界正在研究表2所示的（不降价，不降价）这样的最优纳什均衡出现的条件和机制，一旦找到，就可以为避免恶性的价格竞争提供一条途径。由于其中的研究颇为复杂，此处不再赘述。

另一种改变改变博弈结构的方法是旅游监管部门作为新的当事人参与博弈，也有可能会使旅游公司避免出现恶性价格战。但这需要旅游监管部门加强执法力度，对降价的公司给予足够大的惩罚才能奏效。

2.持续创新同样是旅游行业获得较高利润，避免过度竞争的有效途径。旅游企业可通过开发特色旅游新产品而避免产品雷同。比如近几年的老年旅游市场的开发；以高中学生为对象，在假期举行的高校游；以各种兴趣为对象的摄影游、徒步游、探险游等。

3.除此以外，政府还可通过深化体制改革,硬化企业投资约束，从而消除产业过度进入，达到供求平衡，避免过度竞争。

总之，这些策略需要旅游企业根据市场环境的变化及自身实际情况适时进行创新、调整和选择。

参考文献：

博弈论方法篇9

论文关键词：非均衡博弈,社会公共组织,发展

改革开放以来，我国社会结构发生巨大的变化，开始从总体性社会向分化性社会转化，随着市场经济体制的逐步建立，利益分化和利益群体多元化格局开始形成，由此我国进入了利益博弈时代。正如孙立平所说，“在一个利益分化和利益博弈的时代，任何一个具体的经济社会事物都可以成为一种利益，从中滋生出一群分享这种利益的人，并围绕这种利益进行博弈。”

一

在社会科学视域内，利益群体博弈模型可以用来分析不同社会群体、组织之间的各种关系，如合作与冲突，从而为分析社会事实提供一种新的，具有很强分析力的视角。这主要得益于罗伯特·奥曼、赫伯特·迪金斯等学者的杰出贡献。奥曼的著作涉及博弈论的几乎所有领域，特别是对于博弈论的核心概念“共同知识”和“信息”的深刻洞见，提出博弈论实际上是一种“交互的决策论”的观点，即一个人的行为依赖于他的所知，然后又依赖于他知道其他行为人知道他的所知，这个交互过程直接决定了博弈行为的进行。而他提出的关于重复博弈的理论有助于我们理解市场经济中的许多现象以及纷繁复杂、充满冲突和合作现实生活。赫伯特·迪金斯等学者则在计算机仿真实验的基础上，运用博弈论构建社会

群体中合作和利他行为的演化博弈理论模型，利用强互惠的概念解释社会群体的

利益博弈行为。正是基于这些学者的开创性的研究，加上20世纪晚期以来以复杂性科学理论的兴起，我们得以认识到组织运行和发展的动力根源于其复杂的利益博弈关系。

从根本上说，利益博弈是市场经济和利益分化的必然产物。在市场经济主体多元化所造成的社会群体分化和利益多元化的前提下，社会结构必然呈现出日益多元化和复杂化，导致我国利益群体博弈关系的复杂性。这种复杂性最显著的特征是，处于中国转型期的利益群体博弈是一种非均衡博弈。当然，这里所说的非均衡博弈与博弈论中的术语“均衡博弈”并不是相对应的概念。所谓均衡博弈，就是指在博弈过程中各参与人形成一种博弈均衡，“在一策略组合中，所有的参与者面临这样的一种情况：在对方策略确定的情况下，每一个参与者的策略都是最好的，此时没有人愿意改变自己的策略。”均衡博弈因此指的是一种动态过程，强调的是博弈参与者在博弈过程中的一种相对均衡的态势。而非均衡博弈则指的是博弈参与者在博弈过程中由于在所处的地位、所占有的资源等方面所具有的差异，而形成了对参与者特别是处于劣势的参与者的策略选择和博弈结果的约束。处于转型期的中国，利益群体之间的非均衡博弈具有一些比较明显的特征：首先是各利益群体的博弈能力严重不均等，由此导致了在博弈过程中强势利益群体对弱势利益群体的博弈优势；其次是参与博弈的各利益群体在资源、权利的占有上存在明显的不平等；最后，在非均衡博弈中，处于优势的强势群体的博弈策略对于弱势利益群体利益实现施加强势制约，而后者却无法对前者实施有效的影响。

而这种情况的产生，根源于中国近几十年来所发生的巨大社会变迁。在市场经济体制的逐步建立和市场机制作用的强化，以及中国所致力于的制度变迁的进程中，社会利益分化日趋强化，社会公众被纳入不同的利益群体，并且这种利益格局是有差别的。而中国现实生活中的这种利益差别，从质的方面来说包括三种类型：一是通过市场公平竞争所产生的，受现行法律法规保护的合理合法的利益差别；二是违背公平竞争原则，通过各种违法手段攫取暴利而产生的既不不合理也不不合法的利益差别；三是由于某些法律法规或制度不符合社会发展的客观规律而导致的虽不违法但不合理的利益差别。对利益差别的这种划分，实际上已经在某种程度上说明了严重不均衡的利益格局形成的原因所在。改革开放以来，我国致力于建立完善的市场经济体制，由于市场竞争机制的作用，一定程度上的利益差别必然存在，而且也是合理的。但是由于我国协调利益差别和维护社会公平公正的社会机制和政治机制尚不完善，使得各利益群体利益表达能力的失衡，在自由竞争中形成的利益差别被不正常的强化。已经处于优势地位的利益群体通过强强结合等形式，得以有能力影响政治决策和公共政策的制定，其利益不但得到制度性的保障，而且利益在政治决策和公共政策的激励下被放大。而对处于弱势的利益群体来说，由于利益诉求机制的缺乏，被进一步边缘化。这种强者越强、弱者越弱的利益格局正是改革开放几十年来累积的结果。

当前利益群体博弈的非均衡性是社会变迁的结果，必然带有一定的不合理性。但是，需要注意的是，不均衡性作为差异的题中之义，在利益群体博弈过程中，具有其积极的一面，在一定程度上是组织的正常运行和发展所必须。

二

与政府组织、企业组织并称为现代社会三大组织系统的社会公共组织，其存在和运行的最重要基础和动力在于个体行为者行动之间因互利而相互依存，或因冲突而矛盾斗争所形成的相互影响。社会公共知是嵌入在社会这个纷繁芜杂的复杂巨系统之中的，与社会中其他要素如政府、企业乃至个人构成一种共生关系。因此，社会公共组织的运行和发展必须依赖于与其他组织或个人的互动,在当前形势下即是就各自的利益诉求展开博弈。

社会公共组织的运行和发展，必须满足基本的利益诉求，对于一个组织来说，最低的利益诉求包括合法性的获得、资源的获取以及组织的自主性和独立性。合法性是指社会公共组织需要获得国家制度、社会成员的认可，资源的获取是指作为非营利机构的社会公共组织需要从外界获取开展组织活动的各种资源型要素，而自主性则是指作为一个非自足的主体的社会公共组织脱离其资源提供者的控制的一种欲求。社会公共组织作为当前中国社会利益博弈格局的重要参与者，其利益诉求的复杂性和多样性，决定了社会公共组织需要与不同的利益主体进行博弈。

因此，社会公共组织运行和发展实际上是其与其他利益主体进行非均衡博弈的结果。用博弈论的术语来说，这是N人M次博弈。要描述这种博弈非常复杂，而探求这种博弈的具体过程也不是本文的目的所在。本文所探讨的是非均衡博弈对社会公共组织发展的作用，因此可以将这个N人M次博弈转化成是以社会公共组织为中心的二人多次博弈结构，即依据不同的利益诉求将社会公共组织所参与的非均衡博弈分解为其与多个单独的利益主体所进行的博弈。

从博弈论的视角来考察组织，核心在于要说明博弈不仅将有助于组织的稳定运行，而且也要说明博弈将为组织的发展提供某种契机。但经典博弈论无法做到这一点，经典博弈论早期主要关注的是一些比较简单的单次博弈，如博弈论中最广为人知的“囚徒困境”博弈模型。“囚徒困境”博弈的结果是向“纳什均衡”点收敛的，对博弈各方来说，不合作是最优策略。从长远来看，这种博弈结果是不利于整体收益的增进的。在社会公共组织与其他利益主体的博弈中，如果都当作是一次博弈，则双方都将采取不合作，结果是组织无法有效实现其利益诉求，从而走向衰亡。现实生活中，很多情况下利益群体所参与的博弈是多次博弈的，即博弈是持续进行的。

在利益博弈时代，非常重要的一点是要认识到博弈必须演化出某种规则，使得从总体上看，大部分博弈参与者的博弈策略都趋向一种被称为是“演化稳定策略”的方向。“演化稳定策略”的好处是使社会公共组织在面对相同的情势时都将采取在某种程度上与习俗相似的策略习惯，这种习惯，即使使得社会公共组织可能无法获得最优结果，但是由于从外界获取的资源是持续的，从而有助于社会公共组织运行的稳定。演化博弈论的观点认为，在博弈过程中只有在两个博弈参与者在某些方面存在差异的情况下才可能演化出某种“演化博弈策略”。博弈参与者的差异构成了一种不对称性，从而衍生出一种状态。一旦双方都锁入这种状态，任何一方偏离这种演化稳定均衡的参与者所得都要比原来少。而当前利益群体格局的非均衡性正好在某种程度上形成了一种不对称局势，因此使得社会公共组织在与某一特定类型的博弈对手时都采取大致相同的策略，从而保证了组织的正常运行。以当前社会公共组织与政府组织之间的非均衡博弈为例。改革开放后，政府组织出于各种需要放宽了对社会公共组织的管制，社会公共组织有所发展，其与政府组织博弈才具有现实可能性。社会公共组织和政府组织握有不同的资源，这些资源恰好的对方所需要满足的利益诉求，在某种程度上是互补的。同时由于社会转型期利益格局的不均衡性，导致了二者在博弈能力和策略选择等方面的差异。作为一个利益主体的政府组织是社会资源的最大占有者，其对于制度性资源的垄断性占有，使得政府组织成为利益博弈中处于最有地位的参与者。而社会公共组织尽管所掌握的资源——公信力、获得资源的能力等——使得其重要性正在逐渐增加。但是短期内并不可能改变与政府组织博弈的劣势地位。这些差异导致在社会公共组织与政府组织的博弈中，政府组织的主动性和优势是倾向性的，社会公共组织只能采取消极性策略。但是，这种非均衡博弈所导致的结果却是有利于社会公共组织本身的正常运行的。政府组织作为强势的一方为社会公共组织的存在提供合法性制度支持，而社会公共组织在这种情况下与政府组织的博弈所采取的将始终是遵从策略，从而获得其制度合法性。

社会公共组织与其他利益博弈参与者之间有着很多先天的差异，这些差异为演化出某种稳定的均衡策略有一定作用，但是目前对于社会公共组织运行的“演化稳定策略”最具有决定性意义的是由于利益格局导致的不均衡性，这种不均衡性为社会公共组织持续获得某种资源提供了保障。但是，由于目前利益格局的非均衡性是在社会变迁过程中的一种非预期的结果，也是在创建和谐社会过程中需要加以改进和调整的，必将为一种更合理的利益格局所取代。从目前的这种非均衡状态演化到另一种状态，意味着社会公共组织在与其他利益主体博弈过程中建立起来的“演化稳定策略”将不再适用，为了保障自身的运行和发展，社会公共组织必须要在新的不均衡状态下演化出新的“演化稳定策略”，这不仅意味着博弈规则的改变，还意味着组织获取资源的方式的改变。所以，从某种程度上说，从目前的非均衡状态向另一种状态的改变，将为社会公共组织的发展提供契机。

三

利益格局的非均衡性及其所导致的利益群体博弈的非均衡性，被视作是社会转型中的一种不正常现象。

但是本文的分析表明，由于非均衡性符合演化博弈论中关于“演化稳定策略”的形成中对博弈参与者需存在差异的要求，因而有助于社会公共组织在与某一特定的利益群体博弈时采取稳定的策略并持续获得某一特定资源，从而保证了组织运行的稳定。而从一种非均衡状态向另一种非均衡状态的转变有助于新的“稳定演化策略”的形成，因而为社会公共组织的发展提供契机。

当然，以上的分析并不否认学术界对于目前存在的利益群体格局的非均衡性的消极作用的讨论，而只是从另一个角度阐发了利益格局的非均衡性对于组织运行和发展的积极功能。历史在发展，社会在进步。作为中国社会转型中的特定产物，这种不健康的利益格局非均衡性必将在国家、市场和公民社会的共同努力下为一种更合理的利益格局所取代，不过，历史地看，新的利益格局也仍应该是非均衡的。

参考文献

1 孙立平:《博弈——断裂社会的利益冲突与和谐》,社会科学文献出版社,2006年版,第20页.

2 郭其友、张晖萍:《罗伯特奥曼的博弈论及其经济理论述评》,《国外社会科学》2005第5期,第75-76页.

3 美]赫伯特迪金斯、萨缪鲍尔斯:《人类的趋社会性及其研究:一个超越经济学的经济分析》,上海世纪出版集团,2006年版,第33-45页.

4 杨博文:《论利益群体非均衡博弈及社会公共组织的复杂性》,《系统科学学报》,2007第4期,第59、60页.

5 美]约翰纳什著,张良桥,王小刚译:《纳什博弈论论文集》,首都经济贸易大学出版社,2006年版,第11-12页.

6 任娟、杨博文:《试析利益群体的非均衡博弈》,《甘肃社会科学》,2007第2期辑刊,第56页.

博弈论方法篇10

关键词：蜈蚣博弈逆向归纳法理性人假设混合策略

中图分类号：F32 文献标识码：A 文章编号：1674-098X（2017）06（c）-0214-02

蜈蚣博弈于1981年由Rosenthal提出。博弈中有两个参与人，策略包括“合作”与“终止”。博弈双方分先手与后手，轮流进行决策，当一方选择“终止”时，博弈即停止，否则双方将持续合作直到最终环节。博弈的总收益会随着过程的持续而不断增大，但是每一参与者在自己本回合选择“终止”时的自身收益，要小于对方在下一回合选择“终止”时自己的收益。根据持续的回合数，蜈蚣博弈可以被分为短期蜈蚣博弈、长期蜈蚣博弈和无限期蜈蚣博弈。

在“蜈蚣博弈”出现之前，逆向归纳法一直是博弈论中的一个重要分析方法。逆向归纳法有两个基本假设：一是理性人假设，博弈的参与者都是理性的，会做出使自己收益最大的决策；二是共同知识，博弈方对其他人行为的判断都是正确的，并且相互知道其他人了解自己的判断。“蜈蚣博弈悖论”是关于逆向归纳法的一个重要悖论。根据逆向归纳法的推理，由于双方在每个环节都会选择让自己利益最大化的选择，最终导致先手方拒绝合作，但这与实际中的选择明显不符。

1 文献综述

理论探究方面，孙洪罡等[1]基于风险偏好分析参与者的支付满意率。潘天群[2]在逆向归纳法的内涵中加入交流理性的概念。何伟等[3]着眼于预期心理，认为参与者一旦在主动选择时能获得与被动选择最大利益相同的收益，就会产生终止的动机。方志耕等[4]将“灰数规整”与顺推归纳法结合，通过计算期望值探究博弈终止时的纳什均衡。胡晓娟[5]等利用“颤抖手”方法，详细论证选择波动时，参与人合作的条件。

在实践中，McKelvey和Palfrey[6]让参与者分别在四阶段低收益蜈蚣博弈、四阶段高收益蜈蚣博弈和六阶段蜈蚣博弈中做出选择，发现参与者很少选择第一轮终止，更多选择倒数第二、三轮终止。

2 基于连续混合策略对长期蜈蚣博弈的分析

2.1 模型构架

博弈在时刻t1开始，在时刻t100结束，时刻用tn表示（1≤n≤100）。参与人1在时刻t1开始做选择，之后双方轮流做选择。参与人1、2都做完一次决策记为一轮，轮次用i表示（1≤i≤50）。若博弈持续进行，达到最终时刻t100，且选择人仍选择C，则双方收益都为51。若在tn时，某一参与人选择策略S，则其得到的收益为W（1，n），对方收益为W（2，n）。

蜈蚣博弈模型如图1所示。

在蜈蚣博弈中，会存在下列假设，以保证各子博弈中，参与者在进行纯策略选择时，总会选择S。

2.2 B续混合策略的应用

我们基于理性人假设和共同知识，采用混合策略的方法分析问题。为便于计算，我们按照轮次对参与人的选择概率及收益期望进行研究，并作出以下假设。

假设2：参与人1、2在第i轮做选择时，合作的概率分别为、。在tn时刻，参与人1、2的收益期望分别为E（1，n）、E（2，n）。收益期望函数如下：

在混合策略中，若要参与人选择合作，则需其合作的预期收益不小于终止的预期收益，并且其下次决策时的收益期望不小于本次决策时的收益期望。以参与人1为例，若其选择合作，需满足以下条件：

根据以上分析结果，我们可以得到如下推论。

推论1：作为理性经济人，参与人双方为了使自身在整个系统内获得最大利益，不仅需要在每个子环节考虑到预期收益，同时还要预测到对方合作的可能性。

逆向归纳法只考虑收益层面，忽略决策概率，并且独立分析各子环节，未充分考虑各环节间的联系，仅单纯认为整体的最优选择是各子环节最优选择的集合。

推论2：当一方认为另一方在下一轮行动中更具有合作倾向时，他在本轮就会合作；否则则会停止。

另需说明，当达到合作概率临界值时，决策人会概率性地停止合作。这一临界值又和下一轮的收益期望相关，即收益期望与合作期望是相互影响的。

依据以上阐释理论，我们可以进一步得到如下推论。

推论3：双方的共同合作，是基于共同知识下对对方的信任；而双方停止合作，是因为决策方认为对方在下一轮的合作概率将等于或低于临界值，即个人行为受对客体主观判断的影响。

推论4：在达到临界值之前，博弈一方愿意在自己决策的tn时合作，那么他在之前都会合作，这是基于他对对方的信任；在临界值之后，博弈一方在自己决策的tn时终止，那么他在之后都会选择终止，这是基于他认为对方会选择终止。

推论5：个人的收益期望与对方合作期望是相互影响的，而逆向归纳法在逆向分析对方合作期望时更有实际意义。

双方的合作期望在整体上会呈现递减的趋势，在博弈后期，提升空间有限，决策方会选择终止攫取最后的利益，这一方式尤其体现于最后四期。

3 结语

根据理性人假设，参与人应追求个人在博弈整体的最大利益，而非各子系统最优方案的集合；根据收益情况，继续博弈的潜在收益要大于过早结束的风险；根据共同知识，双方在知道对方愿意合作的前提下，在一定期间内会形成稳定的合作关系。因此，笔者提出，利用连续混合策略，正向顺序计算收益期望，进而分析参与者选择合作或终止的影响因素。该方法从整体角度对博弈系统进行剖析，将合作意愿这一与收益期望相互影响的要素独立分析，重新解读了动态博弈中对理性人假设的认识，较好地解释了蜈蚣博弈悖论。

参考文献

[1] 孙洪罡，刘亚相，王丽波.支付满意率――对博弈论理性假设的新思考[J].青岛大学学报：自然科学版，2004（9）：78-80.

[2] 潘天群.交流理性与逆向归纳法悖论的消解[J].自然辩证法研究，2005（12）：25-28.

[3] 何伟，徐飞，陈洁.蜈蚣博弈新视角――预期心理的应用[J].上海管理科学，2006（3）：1-5.

[4] 方志耕，刘思峰，施红星，等.破解“蜈蚣博弈”悖论：“灰数规整”顺推归纳法研究[J].中国管理科学，2008（2）：180-186.