博弈论及其应用十篇

时间:2023-08-17 18:12:51

博弈论及其应用

博弈论及其应用篇1

内容摘要:本文在梳理经典博弈论理论体系及其应用领域的基础上,对其发展趋势进行了展望。分析显示:经典博弈理论按其发展的脉络来划分,主要包括静态博弈、动态博弈、完全信息博弈和不对称信息博弈等几大理论体系;其应用领域主要涉及管理学中的激励问题,信息经济学中的信息甄别、信号传递和社会学中“合作与冲突”这一古老而又永恒的主题;其发展方向表现为扬弃“理性假设”条件下的行为博弈。

关键词:纳什均衡 信息经济学 激励理论 行为博弈

经典博弈理论体系

博弈论又称对策论,英文名称是Game Theory,是研究一些个人,一些团队或组织面对特定的环境条件,在一定的规则制约下,依靠所拥有的信息,同时或先后,一次或多次,从各自允许选择的策略进行选择并加以行动,并从中各自取得相应结果或支付的过程的理论。博弈论的主要研究目的是研究博弈各方的行为特征,即各决策主体行为发生直接的相互作用时的决策特征;以及何种情况下采取哪种策略,会达到什么样的结果即决策主体决策后的均衡问题。

博弈思想可以追溯到我国古代“田忌赛马”的故事,但一般认为,1944年冯•诺依曼和奥斯卡•摩根斯坦恩合著的《博弈论和经济行为》形成了现代博弈论的基本分析框架,标志着系统的博弈论初步形成。上世纪50年代,数学天才纳什明确提出“纳什均衡”这一概念,使经济学中的均衡问题发生了质变(从“瓦尔拉斯均衡”突破到“纳什均衡”)。“纳什均衡”的提出抓住了问题研究的关键,为博弈论的应用和发展奠定了坚实基础。“纳什均衡”描述的是行动双方的均衡问题,即“如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极性去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。

“纳什均衡”实现了合作博弈向非合作博弈的转化,但纳什均衡是“基于一个时期的模式”而非“动态模式”,纳什均衡没有考虑自己的选择行为如何影响博弈对手的战略,且允许不可置信威胁战略的存在,经常遇到一个博弈中存在多个纳什均衡,难于预见哪个均衡会发生等问题。为了弥补纳什均衡的上述缺陷,泽尔腾发展了动态的博弈。泽尔腾动态博弈模型思想集中体现在他1965年发表的著名论文《一个具有需求惯性的寡头博弈模型》一文之中,在该文中泽尔腾对“子博弈精练纳什均衡”给出了正式的定义。其基本思想是:“在扩展型博弈中的任一决策点,现行局中人利用其先行优势及后行者必然做出理性的反应这一事实,来进行选择以达到最优的纳什均衡,有限完美信息动态博弈求解可采取倒推归纳法”。泽尔滕定义“子博弈精炼纳什均衡”的中心意义是将纳什均衡中包含的不可置信威胁战略剔出出去,使均衡战略不再包含不可置信的威胁战略。它要求参与人的决策在任何时点上都是最优的,决策者要随机应变,向前看而不是固守旧略。由于剔出了不可置信的威胁战略,在多数情况下,精炼纳什均衡也缩小了纳什均衡的个数,这也是子博弈精炼纳什均衡的优点所在。

纳什均衡严格依赖于现实博弈环境难于满足的“完全信息”假设,即“所有博弈参与人均知道博弈的结构、博弈的规则和支付函数”,针对纳什均衡中“完全信息”假设的缺点,哈萨尼建立了不完全信息博弈模型,拓展了纳什分析的应用范围。哈萨尼的不完全信息博弈是在纳什均衡的基础上吸收了贝叶斯研究成果,以贝叶斯定理为出发点,对纳什均衡作了广泛拓展。哈萨尼在其论文《贝叶斯参与人完成的不完全信息博弈》中提出了不完全信息博弈模型,还证明如何把不完全信息博弈模型转化为完全但非完美信息博弈模型,使得博弈模型易于处理,为信息经济学的发展奠定了理论基础。哈萨尼提出的“贝叶斯-纳什均衡”是指在静态不完全信息博弈中,参与人同时行动,没有机会观察到别人的选择;由于每个参与人按照贝叶斯原则仅知道其他参与人类型的概率分布而不知道其真实类型,且不可能准确地知道其他参与人实际上会选择什么战略;但是能准确地预测到其他参与人的选择是如何依赖于其各自的类型;因此参与人决策的目标就是在给定自己的类型和别人的类型依从战略的情况下,最大化自己的期望效用。即“给定自己类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性去选择其他战略组合”。而应用于不完全信息动态博弈的均衡的概念是“精炼贝叶斯均衡”,这个概念是完全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合,泽尔腾、克瑞普斯和威尔逊及弗登伯格和泰勒等学者为此做出了重要贡献。精炼贝叶斯纳什均衡的要点在于当事人要根据所观察到的他人的行为按照贝叶斯原则来修正自己有关后者类型的主观概率,并由此选择自己的行动。也就是说精炼贝叶斯纳什均衡是一个数学上的“不动点”。即满足:给定每个关于其他参与人类型的主观概率的情况下,参与人的战略选择是最优的;每个参与人有关其他参与人类型的主观概率均是按照贝叶斯法则从所观察到的行动中获得的。不完全信息博弈运用现代随机分析方法解决信息不完全或不对称下的决策问题,由此发展起来的不完全信息动态博弈模型使博弈论的理论研究与实际应用更加紧密。

博弈论的主要应用

就博弈论发展而衍生的信息经济学而言,除哈萨尼所做的开创性工作之外,维克里和莫里斯也对不对称信息条件下的激励理论做出了重要性贡献。维克里上世纪40年代关于个人所得税税制问题的思考:“收入均等化并不能解决理想税赋结构难题”,因为这一方案没有给个人努力工作提供激励,因而不会产生社会效率最大化。莫里斯通过设计递减税率回答了维克里的税制难题,并致力于信息不对称条件下隐藏行动理论方面的研究。莫里斯上世纪70年代的系列研究成果奠定了委托-理论模型框架,并确立了激励相融契约必需满足的两个约束前提。其一是参与约束:委托人所选的效用函数必须使人因接受合约而获得的效用不小于因拒绝合约而获得的效用;其二是激励相融约束:合约缔结后人在所选行动上的边际收益等于边际成本。

1970年,著名经济学家阿克洛夫在《经济学季刊》上刊发了具有划时代意义论文《柠檬市场:质量不确定性和市场机制》,该文研究了一种商品市场,其中出售者对商品质量的了解比购买者要多,并以二手车市场为例进行说明。由于文章阐述了一个简单而又深奥的普遍化思想,并因得到应用广泛而产生重大影响。阿克洛夫在该文中对具有逆向选择这一信息问题的市场进行开创性分析,指出信息不对称问题可能导致该市场崩溃,或者只有劣等产品充斥其中。“柠檬论文”解释了信息不对称导致的市场低效率,同时该文的另一个独到见解是经济主体有强烈的激励去抵消信息不对称问题对市场效率的不利影响。

继阿克洛夫之后,斯彭斯着重研究如何改善信息不对称以提高市场效率问题,即信号传递模型。信号传递模型描述的是信息富有的一方如何可靠地将信息传递给信息缺乏的一方,以减少双方之间信息不对称、促进交易的达成、提高市场效率。斯彭斯以劳动力市场为例,研究得出只有当信息富有者的传递路径产生的费用绝对高于其它传递途径产生的费用时,该信息富有者的信息传递才具有效率。该模型很好地解释了商标、广告、教育文凭等信息传递问题。为减少信息不对称,提高市场效率,提供操作上的理论依据。

在斯彭斯之后,运用博弈论来研究信息不对称市场的另一位集大成者乃诺贝尔经济学奖得主,信息经济学的集大成者斯蒂格利茨。斯蒂格利茨在1974年之后发表的一系列论文中,构建了以不完全信息和不完备市场为前提的新模型,描述了信息不对称条件下市场运行机制的变化。他通过对保险市场、农业土地租赁市场、信贷市场和劳动力市场的考察,证明了信息不完全和信息不对称的普遍性,说明在这样的市场中,传统的价格机制实现帕累托效率的有效性值得怀疑,从而对以彻底的私有化和市场化为导向的改革模式(即“华盛顿共识”)提出了质疑。其中,1981年斯蒂格利茨和温斯合作发表的文章《信息不对称市场的信贷配给》堪称当代信贷文献的典范,该文详细论述了信贷过程中不同阶段银行面临的各种风险。该文创立的逆向选择模型与道德风险模型对分析金融问题具有划时代意义。

继博弈论在经济学领域取得巨大成功之后,以以色列博弈论专家奥曼与美国国防经济学者谢林为代表的博弈论推崇者则努力运用博弈论来解决“合作与冲突”这一古老而又永恒的社会问题,使博弈论由经济领域拓展到社会领域。奥曼与谢林分别从数学和经济学的角度重塑了关于人类交互作用的博弈分析范式。谢林从非合作博弈的角度加深了人们对社会交互作用机理的理解,而奥曼则发现一些长期的社会交互作用可以运用正式的非合作博弈理论来进行深入分析。

博弈论发展趋势

博弈论以决策者之间的相互影响为主要决策因变量导致经济学从“瓦尔拉斯均衡”突破到“纳什均衡”的质变,经典博弈论从静态博弈到动态博弈,信息完全到信息不对称博弈均是在放松理论假设的前提下使博弈理论分析与经济社会现实更加接近,以增强其实用性和对经济社会现象的解释能力。经典博弈理论作为经典经济学的分析工具,其共同秉承的“理性人”假设、不可观测的效用函数假设和主观概率假设是经典博弈论的主要局限,上述假设的存在使经典博弈被戏称为“研究‘天才’决策的理论”,现实经济社会中也出现过很多经典博弈理论无法解释的异象。随着行为经济学的兴起并得到社会的认同,基于理性人假设的经典博弈理论自然而然遭受到行为学派的挑战,考虑参与者“有限理性”、“情感”、“环境”、“经验”、“制度文化”等现实因素的行为博弈论成为近年来博弈论的发展方向。

与经典博弈理论比较,行为博弈论的最大特点是考虑了人类的非理性因素,其研究目的是研究博弈参与人实际做出了什么行动,可以说行为博弈论是实验经济学与行为经济学的一个分支。行为博弈论近年来在“囚徒困境”模型重释、投资博弈模型、可置信威慑的议价博弈模型、大陆分水岭协调博弈模型及选美比赛博弈模型等方面取得了重要进展,很好地解释了经典博弈论无法解释的一些现象。但行为博弈同样面临“有限理性”中“有限”度的量化,“经验”因素中参与者的“学习”问题以及“学习”如何及何时影响博弈均衡结果等问题。上述问题的存在形成了行为博弈未来的主要研究方向:一是学习过程中的自利行为和利他行为怎样导致社会偏好的变化;二是在重复博弈中,随机最优反应函数的地位如何,参与者关于博弈对手和环境的信息信念如何变化;三是组织、团队乃至企业的博弈行为将在何等程度上与个体博弈存在差异,引发该差异的机制是什么,社会认知空间的变化对博弈行为有何影响等等。

结论

值得一提的是经济领域的至高荣誉诺贝尔经济学奖特别偏爱博弈论领域的集大成者。瑞典皇家科学院诺贝尔奖委员会分别于1994年、1996年、2001年和2005年将诺贝尔经济学奖授予经典博弈论的杰出贡献者纳什、泽尔腾与哈萨尼,博弈理论的实践人、激励理论创立者维克里和莫里斯,博弈论衍生的信息经济学的奠基人及集大成者阿克罗夫、斯彭斯与斯蒂格利茨,博弈论应用领域的拓展者以色列数学家奥曼和美国国防经济专家谢林;以表彰他们在博弈论领域的卓越贡献。博弈论领域的多次获奖彰显博弈论对现代经济理论特别是市场交易理论的突出贡献。

参考文献:

1.张维迎.博弈论与信息经济学[M].上海人民出版社,2004

2.斯蒂格利茨,沃因,韦坎德.契约经济学.经济科学出版社,1999

3.John Chahes Harsanyi. Games with Incomplete Information Played by Bayesian Players Parts I, II and III. Management Science, 1967

4.John von Neumann and Oskar Morgenstern. The Theory of Games and Economic Behavior. Princeton: Princeton Universty Press.1944

博弈论及其应用篇2

一 博弈理论简介

(一)博弈论的名称

博弈论,英文名称为Game theory是研究各方策略相互影响的条件下,理性决策人的决策行为的一种理论。博弈论刚被介绍至我国时,曾有过多种译法。有的学者根据其英文名称,直译为游戏理论;有的学者则从该理论本身的研究对象出发,转译为对策论或对策运筹论。近年来,学术界越来越多地接受了博弈论这一名称。这除了由于博弈这个带有文言味的词本身的学究气浓郁而给人的第一印象较为深刻外,更重要的是博弈一词能更准确、全面地体现策略选择、依策而动以及最终结果三者的统一。

(二)博弈的要素

一个完整的博弈应包含如下四项要素:1,博弈的参加者(player)。也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人,大到一个跨国公司乃至一个国家,只要能独立决策和行动,都可视作一个博弈方。比如柯达与富士公司的竞争,就可看作一个有二个博弈方的博弈。一般说来, 博弈的参加者越多,情况就越复杂,结果越难预料。2,策略空间(strategy space)。是指各博弈方可选择策略的集合。strategy直译应为战略,不过战略一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多,博弈就越复杂。3,进行博弈的次序(the order of play)。博弈中各博弈方行动的顺序对于博弈的结果是非常重要的。同样的博弈方、同样的策略空间,先后决策并行动和同时决策行动,其结果是大相径庭的。 4,博弈的信息(information)。知己知彼、百战不殆。可见信息对博弈的重要性古人早已知之。博弈中最重要的信息是有关对手策略以及各博弈方得益的信息。例如,在各博弈方同时决策的博弈中,必须保证不能让对手知道自己采取何种策略,否则自己将永远是博弈的输家。得益(play off),也称支付,是指博弈方策略实施后的结果。有关得益的信息是促使某博弈方选择某种策略的关键参考值。理性的博弈方总是选择能使自己获得最大得益的策略。一旦确定了以上四要素,一个博弈也就随之确定了。值得注意的是,博弈论特别强调“理性人”的前提假定,即参加博弈的各博弈方始终以自身利益最大化为惟一目标。除非为了实现自身最大利益的需要,否则不会考虑其他博弈方或社会利益。

(三)博弈论的结构

由于一个完整的博弈需具备上述四要素,因此博弈可以从不同的角度划分成不同类别:1,按博弈方划分,可分为单人博弈和多人博弈。单人博弈因为只有一个博弈方,所以它已退化为一般的最优化问题。经济学中常见的求最优问题,实际上是博弈的特例。多个博弈方的博弈较单人博弈复杂,而且两人以上的博弈会出现合作博弈问题。这样,多方博弈又将分为合作博弈与非合作博弈。因为在社会与经济关系中,竞争与不合作是基本方面。所以当前的博弈论主要研究的是非合作博弈。1994年诺贝尔经济学奖三位得主的主要贡献,即在非合作博弈方面。2,按策略空间划分,可分为有限策略博弈和无限策略博弈。因为每一种策略都相应地对应一个得益结果,所以从理论上讲,有限策略博弈的结果必然是有限的,而无限策略博弈的结果则有无穷多种可能。3,按进行博弈的次序划分,可分为静态博弈和动态博弈。各博弈方可同时决策并行动的博弈称为静态博弈。当然,严格讲各博弈方在非常精确的同一时点同时决策是不可能的。因此,同时决策是指可近似地看作同时作决定的过程,如乒乓球团体赛的出场顺序,虽双方决策可能有早有晚,但一旦敲定便谁也不许变更,因而可看作同时决策。各博弈方不是同时决策,而是先后、依次决策、行动的博弈叫动态博弈。弈棋就是一种典型的动态博弈,双方的每一步都将取决于前面的情势。4,按信息划分,如按得益信息分类,可分为完全信息博弈与不完全信息博弈。完全(complete)信息,是指各方对自己每种策略的得益情况完全清楚,否则是不完全信息;在动态博弈中,如按博弈进程信息分类,可分为完美信息动态博弈与不完美信息动态博弈。完美(perfect)信息,是指博弈方在决策前对其他博弈方的行为完全了解,否则是不完美信息。5,按得益情况划分,可分为零和博弈、常和博弈和变和博弈。一方收益必来自另一方的损失,这样的博弈叫零和博弈,零和博弈的博弈方始终是对立关系;各方都会有收益,但收益总和是一固定常数,这样的博弈为常和博弈;各方不同的策略组合会有不同的收益,这样的博弈称变和博弈。显然,零和博弈是常和博弈的特例,常和博弈是变和博弈的特例。6,综合分类。综合分类是将博弈次序与博弈信息结合起来的一种分类方法。按这两个标准,可将博弈分为:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、不完全但完美信息动态博弈、完全不完美信息动态博弈以及不完全不完美信息动态博弈。这种分类方式有助于针对不同特性的博弈进行研究和求解。

博弈论 (Game Theory),是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。因此,博弈论又称为“对策论”,也就是说当一个主体,比如一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他的人、其他企业的决策问题和均衡问题。正是在这个意义上,博弈理论又译为“决策理论”。博弈论创立于20世纪40年代,到50年代博弈论的研究达到了顶峰。博弈论研究的决策不仅包括经济学领域,而妾包括政治学、军事、外交、国际关系、公共选择等各个领域,因而博弈论又被称之为方法论。本文拟将这种方法引入到反垄断法领域,具体分析反垄断法规则的制定过程。

二、反垄断法的博弈分析

(一)政府和企业之间的博弈分析

博弈论及其应用篇3

关键词:博弈论 电力市场 Nash均衡理论

引 言

博弈论又称为对策论或竞赛论,其实质是一种理论方法。它是一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论[1]。而在电力市场中,博弈论的运用更是显得尤为的突出,用博弈论模拟电力市场,模拟的结果能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,也可以用博弈论来分析市场,研究如何报价获利最大。因此,博弈论在电力市场中起到的作用是相当巨大的。

一、博弈论的发展

博弈论思想的起源可以追溯至我国的春秋末年,孙武所著的《孙子兵法》,它不仅是一部军事著作,而且还算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯・诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯・诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》、《非合作博弈》等,给出了纳什均衡的概念和均衡存在定理[2]。 此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用,如今博弈论已发展成一门较完善的的学科。

二、博弈论的类型

博弈问题有多种不同的分类方法,按参与者之间是否存在相互协作可分为“非协调博弈”和“协调博弈”;按参与者获利之和的特性可分为“零和博弈”和“非零和博弈”;按静态和动态的观点,可分为静态博弈和动态博弈。

2.1 非协作博弈和协作博弈

非协作博弈是指参与者互相独立,各自争取最大利益的博弈。其广泛运用Nash均衡概念来求解。在Nash均衡上,如果某一个人的策略保持不变,会导致这个人的获利减少。非协作博弈是研究少数制造商操控市场的若干标准问题的理论基础,对于研究市场力有重大意义。

协作博弈一般是指基于参与者结成联合体,共同协作争取联合体的最大利益,再将利益进行内部分配的博弈。

2.2 零和博弈和非零和博弈

在零和博弈中,一个参与者的获利直接等于另一个参与者的损失。例如下棋,扑克牌之类。而在非零和博弈中,参与者的获利和损失不相等,即代数和不必为零,这是更大的博弈问题,是数学家Nash首先提出和解决的,即著名的Nash均衡及其相应求解方法。

2.3 静态博弈和动态博弈

静态博弈是指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。而动态博弈是指双方的行动有先后顺序并且后行动者可以知道先行动者的策略。[3]

三、博弈论在电力市场中的运用

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。

3.1 在购售电决策方面的运用

购售电决策与电力市场模式有很大的关系,如在联营体模式下,参与者众多,若干发电公司或购电商可以结成联合体去投标,这也就是协作博弈问题,这可以比独自去投标取得更大的利益。同时,在联合体模式下各参与者也可以不合作而各自决策,这也就成了非协作博弈问题,这类问题现在大量采用Nash均衡理论来求解。

3.2 在区域间功率交换、转运和输电成本分配方面的运用

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题,如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题都需用到博弈论来进行优化决策。

3.3 在研究市场行为方面的运用

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如,在电力市场中参与者都可以联合起来运用协作博弈方法进行投标来控制市场,特别是在参与者较少时,往往都会出现寡头垄断问题,因此市场运行必须防止和阻止这类市场。另外,如果有市场参与者利用线路阻塞、特殊事件和气候。峰荷时段、联络线瓶颈造成的必须运行机会,运用博弈发放和策略哄抬电价,这些问题也都应及时识别并予以纠正的。

结束语:

至1928年Von Neumann发表关于求解“零和”问题的具有里程碑性质的论来以来,博弈论的观点在很多领域都得到了广泛的运用,也在这些方面取得了巨大的成就。在电力市场中,运用博弈论解决了很多电力行业问题,使电力市场得到了巨大的发展与优化。但是,在运用博弈论进行决策的同时也存在了一定的缺陷,如Nash均衡求解的困难较大;由于竞争各方相互保密而造成的决策困难;分析计算中的假定及简化影响决策结果的可靠性等,这些存在的问题都需要得到及时的解决。因此,博弈论在电力市场中的运用还需要很长的一段时间才能得到更好的完善。

博弈论和电力市场发展至今也不过短短的几十年时间,从发展的眼光来看,他们都属于很年轻的学科,他们都有很广阔的发展空间,两者的结合可以互相促进、相互发展,相信在今后的将来电力市场定会在博弈论的理论发放下而得到更好的完善与发展。

参考文献:

[1]杜松杯. 电力市场[M].中国电力出版社, 2008.7

博弈论及其应用篇4

关键词:数学建模;博弈论;静态

一、笛Ы模与博弈论

(一)数学建模

按通俗意义讲是通过生活中的实际问题建立相应的数学模型去解决各种问题,但数学建模并不是生活中所有解决问题方法的代名词,它是运用适当的数学理论以及工具找寻问题原型中的内在规律,建立一个数学方程或模型去解决求解并得到最优结果。数学建模理论中需要用到的基础学科例如图论、线性代数、概率与统计等等,这都是常见的数学学科。但在实际应用或比赛中,很多问题的综合性与抽象性使得数学这门理论学科在应用方面显得格外艰难,很多案例都不能具体直观的建立模型,特别是对于非数学专业的学生来说,他们只学过高等数学、概率论等基础理论,另外的运筹学与优化问题、泛函分析等专业数学知识并未涉及。另一方面,数学专业的学生对其他应用专业的认知和涉及也是非常浅的,即便数学专业理论知识很扎实,也不能很好的与其他学科结合应用,这样就造成了数学建模的短板,所以数学建模需要综合许多应用学科和专业型人才结合应用。近年来,越来越多的前沿科学与数学建模交叉应用,比如神经网络算法、小波分析、图像处理、博弈理论等等,这样数学建模才可以广泛被应用于各类生活问题中。

(二)博弈论

博弈论是由游戏规则理论演变而来的,在我们日常生活中随处可见的、等各种不同类型的游戏中,当然我们也可以将博弈论看作是一个游戏的原型理论,但不管是哪种形式的游戏都有一个相似之处,也就是游戏中参与者选择的策略方式,我们都知道在任何游戏中,计谋是最重要的,语气说游戏是看概率的大小或运气的好坏,还不如说是选择计谋的好坏。在许多军事策略和市场经济中,所谓的竞选和谈判都和游戏相似,都是需要依赖提前选好优化的策略和方式才可能有较好的结果。博弈论分为合作博弈与非合作博弈,在现代更多地方提到的是非合作博弈,并且合作博弈与非合作博弈是互斥的,二者只能存在其一,至于合作博弈与非合作博弈在本文中就不再详细作介绍。在非合作博弈中又分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。在任何一个博弈活动中,除了具备满足博弈过程的四个条件以外,还要具备能有利用数学建模等专业知识对其进行分析的先前条件。

二、博弈论在数学建模中的应用

在许多的数学建模问题中,虽然有不少设计博弈论的实际问题,但大部分都展示的不够直观,解题者不能从问题中清晰的了解其问题指向性,这就更加需要学生多学习数学建模与博弈论的相关理论。举一个数学建模中的经典实例:

问题提出:某人带狗、羊以及蔬菜渡河,一小船除需人划外,每次只能载一物过河.而人不在场时,狗要吃羊,羊要吃菜,问此人应如何过河?此问题可化为状态转移问题,用四维向量来表示状态,当一物在此岸时相应分量取为1,而在彼岸时则取为0,第一分量代表人,第二分量代表狗,第三分量代表羊,第四分量代表菜。根据题意,井不是所有状态都是可取的.通过穷举法列出来,可取状态是:

总共有十个可取状态.

模型求解:引入一个四维转移向量,用它来反映摆渡情况.用1表示过河,0表示未过河. 此状态只有四个允许转移向量:(1,0,0,0),(1,1,0,0),(1,0,1,0),(1,0,0,1)规定状态向量与转移向量之间的运算为0+0=1,1+0=1,0+1=1,1+1=0问题化为,由初始状态(1,1,1,1)出发,经过奇数次上述运算转移为状态(0,0,0,0)的转移过程。

则可得两种等优方案

这是一个重复的博弈问题,通过重复的博弈来说明在数学建模的过程中可供选择的方案是多样的,重点就在于选择最优的策略方案解决具体问题,运用博弈理论的建模案例有很多,本文就不一一详尽。总之,数学建模需要用到的专业知识太多,我们应该不断学习与进步。

参考文献:

博弈论及其应用篇5

罗伯特•奥曼作为一名杰出的经济学家,在决策制定理性观点方面有着杰出的贡献,对博弈论和其他许多经济理论的形成起到了重要的乃至不可或缺的作用。因此,他于1983年获得了以色列技术机构颁发的科学技术哈维奖,1994年获得了以色列颁发的经济学奖。本文就他在博弈论方面的贡献以及相关思想作一评析。

一、弈论:交互式条件下“最优理性决策”

一般认为,博弈理论始于1944年。数学家约翰•冯•诺伊曼(john von neumann)和经济学家奥斯卡•摩根斯坦(oskar morgenstern)合作出版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征,提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,奠定了经济博弈论大厦的基石,也标志着经济博弈论的创立。

那么,什么是博弈论?奥曼认为,较具描述性的名称应是“交互的决策论”。可以看到,奥曼对博弈论的定义是十分简洁凝练的。因为博弈论是研究决策者的行为发生直接相互作用时的决策以及这种决策的均衡问题的,就是说人们之间的决策与行为将形成互为影响的关系,一个经济主体在决策时必须考虑到对方的反应,所以用“交互的决策”来描述博弈论是再简洁不过的了。奥曼还以经济主体的理性为分析的出发点,认为博弈论是交互式条件下“最优理性决策”,即每个参与者都希望能以其偏好获得最大的满足。如果仅有一个参与者,通常就会产生划分明确的最优化问题。而在多人参与者的博弈论中,一个参与者对结果的偏好等级并不意味着是他的可能决策的等级,这个结果也取决于其他参与者的决策。

奥曼还分析了一般和特殊模型中的“解概念”,指出,就社会科学的理性方面而言,博弈论是一种概括或“统一场论”。这里的“社会”是广义的,包括人类和非人类的参与者(如计算机、动物、植物等)。与探讨像经济学或政治学等学科的他种方法不同,博弈论不利用个别的、特定的结构讨论各种具体问题,如完全竞争、垄断、寡头垄断、国际贸易、征税、表决、威慑等等。更确切地说,博弈论发展了原则上应用于所有交互情形的一套方法,并进而探讨这些方法在每一具体应用中所导致的结果。从一般博弈论方法得到的结果与用较为特殊的方法得到的结果之间,常常出现密切的联系。然而在其他的情形下,博弈论方法会得出一些其他方法未能得出的新见解。

二、完全竞争经济:参与者连续统模型

众所周知,完全竞争经济模型描述了一种存在着许多参与者(居民和厂商),并且每个参与者的影响都是微不足道的市场情形。就是说,在完全竞争的经济状态下,每个居民或厂商的交易量相对于市场总量来说是很小的,任何一个人交易的商品数量并不会影响总供给和总需求。然而,奥曼认为:“事实上,只要仅存在有限多的参与者,个别参与者对经济的影响就不能被忽视。因此,适合于完全竞争的直观上的概念的数学模型必须包括无限多的参与者。我们认为适合这个目的的最自然的模型包括了参与者连续统(continuum),类似于一条线上点的连续统或流体中粒子的连续统。”

在经济理论中,“连续统”观点的引入对经济学的学科发展有很大的影响。奥曼指出,连续统可以被看作接近于存在许多但是数量有限的粒子(或经济主体,或策略,或可能的价格)的真实情形。采用连续统的粗略估计的目的是使称为“分析”的数学分支的强有力的、精确的方法得以应用,而使用有限的方法将会更困难甚至是无望的。古典经济学假定每个人接受既定的所有商品的价格(单个居民或厂商的决策不能影响价格)。为了使经济处于稳定的状态,价格必须使总需求等于总供给,这就是瓦尔拉斯的竞争均衡(walrasian competitive equilibrium)。奥曼证明了它的存在,并用商人连续统的市场作了明确的说明。

奥曼还考虑了称为联盟的团体和它们之间以互益的方式进行的交易。竞争均衡定义假定厂商允许市场力量决定价格,他们根据市场价格进行交易;而对埃奇沃思著名的“契约曲线”(contract curve)进行概括的博弈论概念的核心,则认为这个核心由在此之上没有联盟可以有所进步的所有分配组成,它忽视了价格机制,仅仅涉及参与者之间的直接交易。奥曼指出,竞争分配的核心和模式与厂商连续统的市场相一致。奥曼通过精确表达完全竞争观点的连续统模型,成功地使最初由埃奇沃思提出,经许多其他模型改进的理论精确化,并从此成为经济理论的基本准则之一。

此外,1975年,奥曼还获得了另一个完全竞争经济中竞争分配和值分配之间等价性的结果。在奥曼看来,博弈论和经济理论中最显著而独有的现象或许是竞争市场经济的价格均衡与对应的博弈的主要解概念(除一个以外)之间的关系。直观上看,等价性原理是说,市场价格的建立是从在完全竞争市场上运转的基本力量自然地产生的,几乎不管我们假定这些力量是怎样运转的。

综上所述可以看到,完全竞争分析所获得的基本观点,使对完全竞争之外的基本经济问题的研究成为可能并且更加容易。在这方面,奥曼最重要的贡献和影响是利用一个或更大的参与者的连续统建立的垄断和寡头垄断竞争模型,以及公共经济学基于经济活动和政治过程相互交织的税收模型,如表决、固定价格模型等。

三、重复博弈论:理论系统性的发展

重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。

首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代,被称为“佚名定理”。该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它相当模糊,并且不提供信息。而奥曼认为,完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁(自我破坏或其他)等现象。博弈论和新古典经济学模式的现象,可能一开始看起来是非理性的。

奥曼还考察了许多具体的合作行为,定义了“强均衡”概念,即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出,重复博弈的“强均衡”与一次性博弈的核(更精确的是“6核心”)相一致。为此,奥曼定义和研究了经济理论中极为重要的“一般”合作博弈,即非转移效用(non-transferable utility)博弈,这开拓了该领域的研究空间,因为在此之前,仅有“单边支付”博弈被研究,即每个联盟可以任意在其成员中分享一定数额的赢得。

其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始,奥曼和其他合作者一起,在其学生的辅助下,发展了不完全信息的重复博弈论。1966年,奥曼和m.马希勒(michael maschler)在给美国武器控制和裁军机构的开创性报告中,建立了不完全信息的重复博弈模型。他们指出,信息使用的复杂性实际上可以以一种出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零(zero-sum)和博弈中,其中一个参与者比另一个拥有更多的信息(这就是所谓的单边的不完全信息),拥有更多信息的参与者所使用(并揭露)的信息数量是被精确地决定的;有时是完全揭露或根本没有揭露;有时是部分揭露。这种分析被扩展至更一般的模型,即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。例如,奥曼、马希勒和斯特恩斯在1968年引入了一个“联合控制的”(jointly controlled lottery)的概念,即没有参与者可以单方面地改变不同结果的可能性,这个概念与非零和博弈密切相关。之后,奥曼在重复博弈上的研究获得了丰硕成果。事实上,他的有关不完全信息博弈的许多重要观点已被应用于许多经济学科,诸如寡头垄断、委托人与人、保险等等。

四、合作与非合作博弈论:非转移效用与理性的假设

博弈论还可以划分为合作博弈与非合作博弈。在20世纪50年代,既是合作博弈发展的鼎盛期,又是非合作博弈的开创期。奥曼在该方面的贡献在于,一方面把“可转移效用”理论扩展为一般的非转移效用理论;另一方面发展并提炼了“什么是理性”,使之形成统一的观点。

合作博弈理论不讨论理性的个人如何达成合作的过程,而是直接讨论合作的结果与利益的分配。合作博弈的基本形式是联盟型博弈,它隐含的假设是存在一个在参与者之间可以自由转移的交换媒介(“货币”),每个参与者的效用在其中是线性的。

这些博弈被称为“单边支付”博弈,或“可转移效用”博弈(tu-games)。奥曼把“可转移效用”理论扩展到一般的非转移效用理论,发展并加强了可转移效用和非转移效用的合作博弈论。他先是界定了非转移效用联盟形式的博弈概念,然后提出了相应的合作解的概念。他研究了不同模型中的合作解,同时,将非转移效用值公理化,这是奥曼对合作博弈论基本原理所作的贡献之一。在1985年,奥曼还成功地制定了描述非转移效用值的一个简单公理集,这不仅拓展了这一领域的研究,而且产生了许多新的研究方向。

非合作博弈论的重点是对个体的战略选择,即每个参与者如何博弈,或者说选择什么策略达到他的目标。与之不同,合作博弈理论的重点则是对群体,并仅从更一般的意义上阐述了每个联盟的赢得,而没有说明如何赢得。奥曼通过多年的努力,发展并提炼了“什么是理性”。他认为:“如果一个参与者在既定的信息下最大化其效用,他就是理性的。”因此,一个理性人选择他最偏好的行动,当然“最”是相对于他所掌握的(关于环境和其他参与者的)知识而言的。令人惊讶的是,这个看上去简单清晰的表述可以以不同的方式理解,当然,也有些是互相矛盾的。什么是“参与者的信息”?他知道其他人的什么情况?是他们的理性吗?奥曼在他的许多影响深远的研究工作中解决了这些问题,并为这些模型制订了标准。

首先,他考察了知识和信息问题。对于这个问题,奥曼相当精确地概括出具有常识性的概念。他指出,如果开始时两个参与者具有了相同信念,但在对于一个具体事件的较晚的信念(基于不同的个人信息)是常识的,则这些较晚的信念必然形成一致。奥曼的观点对非博弈论产生了重大的影响。一方面,它导致了涉及多人情形下知识的正式概念的“交互认识论”整个领域的发展。另一方面,它形成了许多应用范畴。从经济模型——诸如只要人们有相同的最高执行官,他们的行为是人所共知的,那么具有不同信息的人们之间就不会产生交易——到计算机科学——用于分析分布环境,诸如多重处理器网络等。

其次,他假定参与者是“贝叶斯理性的”(bayesian rational)。这在一人决策论中或许是标准的,但是它在多人模型中是否也适用?奥曼引入了相关均衡的基本理论概念。相关均衡出现在经济和其他许多领域,引起了对不同交流程序和通常所说的“机制”的更重要的研究。

同时,奥曼还研究了“达到古典纳什均衡所需要的理性和理性知识的范围”的基本问题。他的观点与专业人士相反,认为答案并不一定是“理性的常识”。严格的理性是对决策者行为复杂的假设,由此产生了对边界理性模型的考察,该模型放宽了假定。奥曼指出,在交互情形下,微小的非理性是如何起很大作用的。实际上,在某些情形下,它能够导致重复博弈的合作。

五、其他贡献

奥曼在值集函数(即值为点集而非单独一点的函数)领域,也作出了许多重要的贡献,如“奥曼可衡量选择定理”、值集函数积分结果等。大部分问题产生于对不同博弈论和经济模型的研究,经济人连续统和数学理论是这些模型演化和分析的重要工具。奥曼所获得的诸如一般均衡、最优分配、非线性编制程序、控制理论、测量理论、定点理论等结果是基本的,它们被应用于经济学、数学、运筹学等许多领域。此外,奥曼把库恩(kuhn)著名的完全检索有限博弈中的行为和混合战略的均衡结果扩展为无限的情形,克服了复杂的技术困难。除了他发表的书外,奥曼多年来对许多人的研究产生了直接的影响。他向他们建议并提出了重要的问题和研究的渠道,与他们分享了深层的理解,帮助并鼓励他们从事研究工作。奥曼总是引导他的学生走向这一领域,与学生之间形成了双向反馈的相互作用,所获得的结果又被他用于塑造和提炼他的观点和理解。

六、简评

在过去的几十年中,奥曼对博弈论和经济理论的发展作出了重要贡献。可以说,在当代的博弈论研究中几乎没有他未涉足过的领域。他的研究具有与众不同的广度和深度,他的科学贡献从基本概念、学科的发现与形成到适当工具与方法的发展在分析不同具体问题中的应用,都具有开创性的进展。值得注意的是,奥曼的大部分研究与经济理论的中心问题联系密切。一方面,这些问题为他的工作提供了刺激和推动力;另一方面,他研究的结果产生了经济学新的见解和思维。

同时,奥曼的哲学论文和研究也具有相当的影响力。事实上,奥曼成功地以许多不同的受众可以接受的方式解释了甚至是最复杂的观点。他的研究并不止是一张简单列表,而是展示了所有美丽和清晰的宏伟画面,指出了成就、需要解决的困难以及将来研究的领域。毫无疑问,奥曼的观点从总体上说,在建立并使博弈思想和经济理论思想的轮廓更加清晰方面起了重要的作用。

【参考文献】

1.aumann,r.j.,1964,markets with a continuum of traders,econometrica 32.

2.aumann,r.j.and shapley,l.s.,1974,values of non-atomic games,princeton:princeton university press.

3.aumann,r.j.,1976,agreeing to disagree,annals of statistics 4.

4.aumann,r.j.,1985,an axiomatization of the nontransferable utility value,econometrica 53.

5.aumann,r.j.,1985,notes and comments on the nontransferable utility value:a comment on the roth-shafer examples,econometrica 53.

6.aumann,r.j.,1987,value,symmetry,and equal treatment:a comment on scafuri and yannelis,econometrica 55.

博弈论及其应用篇6

 

随着理论体系的进一步深化和完善,新古典体系不断拓展其理论的解释领域将原先许多主要由演化经济学考察的经济现象也纳入其理论分析框架中。例如,新古典的产业组织理论尝试解释“技术创新、企业规模和市场结构的关系”(多纳德。海和德里克。莫瑞斯,2001);新制度经济学尝试解释制度变迁问题(诺斯等,1994);新増长理论通过建立内生増长模型,尝试解释技术进步和经济増长的关系(巴罗和萨拉伊马丁,2000)。而这些原先都属于演化经济学的传统研究领域。此外,新古典经济学还论述了其理论与演化经济学在经济行为预测上的一致性,认为新古典的理性最大化行为能够从自然选择过程中推导出来,演化模型得出的结果与新古典模型是相同的,两者是可兼容的,并且宣称是新古典演化主义(Friedman,1953)。这些理论发展在一定程度上巩固了新古典经济学的主流地位。

 

但是,新古典经济学对上述领域的解释还是存在明显的不足。产业组织理论主要研究市场结构对企业各种行为和绩效的影响,并没有真正关注技术创新所引致的产业组织演变和经济结构变革。这种静态的均衡分析远离了熊彼特的演化思想(安东内利,2006)。新制度经济学则将制度变迁视为从一种均衡向另一种均衡的瞬时移动,并不考察制度失衡后个体间的互动和协调过程(诺斯等,1994)。新増长理论也将经济増长视为移动均衡的过程,它假设企业知道所有可供选择的技术机会集合及其自身生产函数所处的位置,技术进步是源自企业有意识和明确的R&)投资决策,经济增长并不涉及任何知识增长过程(纳尔逊,2004)同样地,并不是所有的演化模型都能得出与新古典模型相同的结果,演化模型必须满足以下四个主要条件才能确保所有生存者的行为是利润最大化:多样性(variety)行为连续性、利润引起的增长和有限的路径依赖

 

可见,在许多领域中,新古典经济学并不能完全取代演化经济学的解释。而且,随着行为经济学和实验经济学的兴起,新古典的理性选择范式受到越来越多的质疑,“有限理性”的概念得到了更多经济学家。从上个世纪80年代起,以Nelson和Winter(1982)为代表的新熊彼特主义掀起了演化经济学复兴的浪潮。在过去的20年里,演化经济学发展速度更加迅猛。通过对Econlit数据库中经济学文献的统计,Silva和Teixeira(2⑴6)发现,在过去50年有关演化的经济学文献中,90%的文章是1990年以后发表。因此,经济学中有关演化主题的研究日益增多。一些经济学家甚至认为,经济学的研究范式出现了演化转向,演化经济学可能再次成为主流经济与此同时,新古典经济学的分析方法也在发生变化,从原先一般均衡理论的均衡分析转向博弈论的纳什均衡分析,进而又拓展为演化博弈的趋向均衡分析

 

其中,演化博弈的发展和现代演化经济学的复兴几乎处于相同时期—些学者将演化博弈视为新古典经济学和演化经济学的交流和结合,认为演化博弈能够调和均衡理论和演化理论的范式冲突,也体现了主流经济学对演化经济学的吸收和接纳有些学者甚至认为,演化博弈的发展可能促使演化经济学成为主流在一项有关演化经济学现状和未来的问卷调查中发现,许多经济学家都认为,演化博弈是演化经济学未来最有发展前景的理论之一。

 

但是,从理论发展脉络上看,演化博弈和现代演化经济学却是独立发展起来的,而且各自的分析方法也存在明显的差异当然,独立发展并不意味着毫无联系。但现代经济学却很少深入研究这两种理论的关联。这可能是因为大多数博弈论者并不熟悉演化理论,反之,演化论者也不熟悉博弈论。很多学者仅仅凭借学术直觉,要么认为演化博弈是传统博弈论的拓展,属于新古典体系,它与演化经济学本身并没有联系;要么认为演化博弈能够为演化经济学提供合适的数理模型,是演化经济学的重要进展,甚至能够促使演化经济学再次成为主流。就演化博弈对于演化经济学的作用而言,前者判断过于悲观,后者判断则过于乐观。那么,演化博弈和演化经济学之间到底是什么关系?演化博弈是否能够推动演化经济学的发展,并且成为演化经济学今后重点研究的领域之一?或者它更像是新古典经济学的一种乔装,与先前的新古典演化主义一样,尽管其模型中包含演化过程,实质却是为了证明进而重复新古典经济学的结论?显然,正确理解演化博弈在演化经济学中的作用和局限,对于理清演化博弈和演化经济学未来发展方向都是十分必要和重要的。

 

二、演化博弈的基本分析结构及其发展

 

普遍认为,演化博弈理论的形成和发展大致经历三个阶段:首先,当博弈论在经济学中广泛运用时,生物学家从中得到启示,尝试运用博弈论中策略互动思想,建构各种生物竞争演化模型,包括动物竞争、性别分配以及植物的成长和发展等这个阶段实际上是博弈论在生物学中的运用;接着,生物学家根据生物演化的自身规律,对传统博弈论进行改造,包括将传统博弈论中支付函数转化为生物适应度函数引入突变机制将传统的纳什均衡精炼为演化稳定均衡,1973)以及引入选择机制建构复制者动态。这个阶段是演化博弈正式形成阶段;随后,鉴于演化博弈对传统博弈的拓展(例如,放松理性假设、精炼纳什均衡以及考察动态调整过程),经济学家又反过来借鉴生物学家的思想,将演化博弈运用到经济学中,这又进一步推动演化博弈的发展,包括从演化稳定均衡发展到随机稳定均衡,从确定性的复制者动态模型发展为随机的个体学习动态模型等

 

实际上,演化博弈的思想较早还可以追溯到约翰。纳什对均衡概念的阐释。纳什在其博士论文中指出,均衡概念存在两种解释方式:一种是理性主义的解释,另一种就是“大规模行动的解释”。前一种是经典博弈论的解释方式,后一种实际上是演化博弈的解释方式。纳什认为均衡的实现并不一定要假设参与者对博弈结构拥有全部知识,以及个体拥有复杂的推理能力,只要假设参与者在决策时都能够从具有相对优势的各种纯策略中积累相关经验信息(例如,学习收益高的策略),经过一段时间的策略调整,也能达到均衡状态。因此,演化博弈的思想早就存在于纳什的博弈理论中。在一些学者看来,演化博弈是博弈论的另一种思考视角,它属于博弈论的研究范畴(Schmidt,2004)。事实上,演化博弈的发展主要也是由众多优秀的博弈论学者推动的。

 

但是,纳什也不是最早提出演化博弈思想的学者。尽管很难考证纳什的“大规模行动”是否受到生物学家的影响,但却可以在更早的许多生态模型和生物种群模型中清晰地发现演化博弈思想。例如,Logistic増长模型、Lokta和Volteira的捕食与被捕食(predatoiipiey)模型以及在此基础上发展的各种生物互动模型等。Vincent和Brown(2005)指出,只要建立各种演化策略同适应度和种群増长率的关系,上述这些种群动态模型都可以被转化为演化博弈模型。他们进一步指出,演化博弈的核心思想早就存在于达尔文的自然选择理论中,可以将其称为达尔文主义博弈(Darwiniangame)因此,演化博弈的兴起既受到博弈论的影响,也受到生物演化的影响。它不应该仅仅属于博弈论的研究范畴,还应该属于演化理论的研究范畴。

 

(一)演化博弈的基本分析结构

 

1.博弈框架

 

与经典博弈一样,演化博弈首先必须存在一个博弈框架。这个博弈框架主要指博弈的结构和规则。演化博弈总是在特定的博弈结构和规则下进行的。而特定的技术和制度条件决定了特定的博弈结构和规则。这也意味着演化博弈是在特定技术和制度条件下进行。但是,与经典博弈不同的是,演化博弈认为参与者并不拥有博弈结构和规则的全部知识,相反,参与者的知识是相当有限的。而且,参与者通常是通过某种传递机制而非理性选择获得策略。尽管博弈的次数可能是无穷的,但是,在每次博弈中,参与者通常都是从大群体中随机选择出来,参与者之间缺乏了解再次博弈的概率也较低。因此,参与者不会像重复博弈那样尝试通过声誉机制来影响对方未来的行动(Friedman,1998)

 

2.适应度函数(fitnessfunction)

 

演化博弈必须将经典博弈中的支付函数转化为适应度函数。适应度是生物演化理论的核心概念,它用来描述基因的繁殖能力。在演化博弈模型中,某种策略的适应度可以被简单理解为采用该策略人数在每期博弈后的増长率。适应度函数则可以被视为策略与适应度的映射关系。在生物演化领域,适应度函数的定义是比较精确和确定的。但是,在社会经济演化领域中,适应度函数的定义则相对模糊和不确定。某种策略的适应度不仅仅取决于它在博弈中获取的支付,还可能取决于特定社会文化背景下人们对该策略的各种主观道德评价,以及个体对该策略的学习能力和个体间的社会互动模式。但是,为了简化分析,许多演化博弈模型都直接将个体的博弈支付等同于适应度。由于参与者是随机挑选的,某个纯策略的适应度取决于该策略的期望收益,后者又依赖于策略的频率分布。因此,适应度函数是频率依赖(frequencydependence)。此外,适应度函数有时还依赖于群体规模(人数)。

 

3.演化过程:选择机制和变异机制

 

演化博弈有别于传统博弈的重要特征之一是,它着重考察了群体规模和策略频率的演化过程。演化博弈的演化过程主要包含两个机制,变异机制和选择机制(Weibull,1995)。类似于传统达尔文主义,演化博弈也不深入考察遗传机制,通常简单假定遗传是通过无性生殖传递的,后代拥有与祖先相同的策略。由于将适应度视为个体生产后代的数量,复制过程(或遗传过程)实际上与选择过程是同一个过程。这种复制与选择相互重合的过程也充分体现在复制者动态模型中。而且,尽管演化博弈也强调变异机制的重要性,但是,它的变异机制是相当有限的,主要指在既定策略空间中个体策略的随机变动,并不包含新策略的产生。普遍认为,在演化博弈中,变异机制主要是为了检验演化均衡的稳定性。因此,演化博弈对演化过程的建模主要依赖于选择机制。复制者动态是一种典型的基于选择机制的确定性和非线性的演化博弈模型。在此模型上加入策略的随机变动,就构成了一个包含选择机制和变异机制的综合演化博弈模型,通常也被称为复制者一变异者模型(Nowak,2006)。

博弈论及其应用篇7

关键词:非合作动态博弈;网络安全;主动防御技术

中图分类号:TP393.08

现有的网络防御和入侵检测系统主要的是依靠安全配置的方式对处于联网状态下的网络进行安全防护,这些防御技术具有本身一些缺点,无法对瞬时的攻击以及未知的攻击进行保护,因此在对网络的安全进行保护的时候要做到适当的防护,即有一定的可行性和合理性,又要保证能够做到比较好的防御。博弈理论下的防御技术具有很多的变形,并且具有独特的优点,而非合作动态的博弈理论的应用又进一步的强化了这些特征。

1 博弈论

所谓博弈论,指的是一门研究其他的参加者关于utility(效用)的情况,理性参加者间互相产生作用的科学,其要素包括博弈的参加者中利益或者目标间互相的冲突和均为理性的参加者特点等两个方面。随着理论的发展和时代的进步,现代的博弈论也逐渐发展成为一项涵盖心理学、运筹学、哲学、数学、计算机科学、军事战略、政治、生物、经济等学科领域内容的交叉性学科。通常而言,现代的博弈论所公认的起源是由名为Morgenstern的经济学者与名为Von Neumann的数学家所共同撰写的《博弈的理论与经济的行为》。尽管此处当时所提出理论性博弈论的框架仅仅能够对部分有限的例子进行使用,例如只对非合作与零的博弈问题等进行了讨论,但是该著作是将博弈的问题通过数学的语言作出解决与描述的第一人。在此之后,在众多学者不断的研究与努力下,尤其是在非合作的博弈理论内Nash创造性的将策略的均衡概念进行了引入,博弈论逐步演变成分析中极为有用且重要的工具[1]。

2 多阶段的非合作动态博弈

网络攻防图的表示方式是G(V’,E’,U’),其为一个带环的具有方向的图,其中的V’叫状态节点,表示的是所有有关的物理节点的所有状态的集合。E’={Ea Ed}集合代表的是网络的攻防图中的有向边方面的集合,集合内的每一条边代表的是来自攻击方或者是防御方的攻防策略,U’集合表示的是网络的攻击和防御的策略相对应的策略收益方面的集合。网络的攻击图之上再加上相应的防御策略就变成了网络的攻防策略图。

2.1 攻防博弈树的形成

攻防博弈树被应用与完全信息的网络攻防动态博弈中,可以对其进行有效的描述。攻防博弈树可以对攻击方和防御方的动态策略选择进行描述和了解。为有效的发挥相应的集合的概念需要将网络的攻防图转变成攻防的博弈树T。要对攻防图中的两种子图进行转化,包括入度为n(n>1)的节点子图,以及包含环图的子图。

处于非合作动态博弈理论下的网络安全通过攻防博弈树来进行描述和分析。由于攻防博弈树可以对攻击方或者是防御方的动态策略选择进行秒描述,可以知道参与者会在什么时候采取什么活动进行行动,并且企图通过这个活动产生什么效益和信息。其图形如下图1所示。

要对网络的攻防图和网络的攻防博弈树上的结构差异进行消除,需要将虚拟节点的技术引入才能够实现。网路的攻防图通过引入虚拟节点技术可以将攻防的博弈树的节点结构进行进一步的规范。在此阶段需要采取的算法包括完全信息的多阶段博弈理论的逆向归纳算法,以及非完全信息的多阶段动态博弈的逆向归纳的方法[2]。

2.2 应用实例

为验证该技术的有效性和可行性,下面以该实验场景进行模拟实验,实验的场景如图2所示:

通过漏洞和木马的扫描工具统计出目标系统的相关漏洞信息,将攻击的图生成为子系统的攻击图,再在图中增加各个攻击阶段相对应的防御措施,人后利用以上的攻防博弈图的理论将其转变成相应的攻防博弈树,博弈树中的实线代表的是有方向的一边集合攻击方采用的攻击策略,虚线代表的是有方向的边代表的是防御方所采用的防御策略的集合,并且在有方向的实线的一段引出的节点表示的攻击的节点,有方向的虚线一端引出的就是防御方的节点,而同时具有实线和虚线的节点代表的是混合的节点。所代表的意思为该点既可以在防御的一方采取防御的措施,有可以被攻击的一方作为攻击的节点。通过运算的方式1得出逆向归纳的路径的集合,并且找到最佳的攻防路径,根据运行的结果来计算出攻击方最有可能采取的策略集以及对路由器进行拒绝攻击的服务。防御方要据此来进行最佳的补丁的安装。

攻击博弈树的形状和结构图如下图3:

假设理性的人被违背,那么攻击者采取的措施就会突破防火墙,并且对实验的服务帐号进行尝试破解的工作,这时防御的一方就要采取最佳的防御措施以修复系统的补丁或者是对文件的数据进行恢复。算法2提出的是动态的博弈模型,该模式可能在进行实际的攻击策略时会与预期的攻击策略出现一定的差错或者是不对应的情况,导致在又一个新的节点上采取新的动态博弈的措施,所以算法2可以在攻击的意图发生变化的时候仍旧计算出最佳的攻击集合,并且除此之外,算法2提出的方法能够对整个的状态空间进行全面的博弈局势的掌握,由此便可以推测出最优化的防御措施。这样就可以在全局的大范围内对防御的措施进行最优化的选择[3]。通过实验可以看出基于非合作动态的博弈环境下的网络安全防御技术具有比较好的高效性,并且具有一些很明显的优势,能够对网络的安全起到很强的积极作用。

3 结语

基于目前的静态、被动的网络安全防御的技术缺点,研究主要的分析了新兴的基于非合作动态博弈理论的主动网络防御技术,该技术的特点是引入了虚拟接点的技术,以此实现了网络攻防图和攻防博弈树的转化。该技术还提出了求解最佳的攻防策略的博弈理论算法,经过理论和时间的检验,该技术在对网络进行防御方面具体很强的可操作性。值得在以后的工作和实践中进行推广和使用。

参考文献:

[1]林旺群,王慧,刘家红,邓镭,李爱平,吴泉源,贾焰.基于非动态博弈的网络安全主动防御技术研究[J].计算机研究与发展,2011,02(45):12-13.

[2]姜伟,方滨兴,田志宏.基于攻防博弈模型的网络安全测评和最优主动防御[J].计算机学报,2009,32(04):817-827.

博弈论及其应用篇8

一 博弈理论简介

(一)博弈论的名称

博弈论,英文名称为Game theory是研究各方策略相互影响的条件下,理性决策人的决策行为的一种理论。博弈论刚被介绍至我国时,曾有过多种译法。有的学者根据其英文名称,直译为游戏理论;有的学者则从该理论本身的研究对象出发,转译为对策论或对策运筹论。近年来,学术界越来越多地接受了博弈论这一名称。这除了由于博弈这个带有文言味的词本身的学究气浓郁而给人的第一印象较为深刻外,更重要的是博弈一词能更准确、全面地体现策略选择、依策而动以及最终结果三者的统一。

(二)博弈的要素

一个完整的博弈应包含如下四项要素:1,博弈的参加者(player)。也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人,大到一个跨国公司乃至一个国家,只要能独立决策和行动,都可视作一个博弈方。比如柯达与富士公司的竞争,就可看作一个有二个博弈方的博弈。一般说来, 博弈的参加者越多,情况就越复杂,结果越难预料。2,策略空间(strategy space)。是指各博弈方可选择策略的集合。strategy直译应为战略,不过战略一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多,博弈就越复杂。3,进行博弈的次序(the order of play)。博弈中各博弈方行动的顺序对于博弈的结果是非常重要的。同样的博弈方、同样的策略空间,先后决策并行动和同时决策行动,其结果是大相径庭的。 4,博弈的信息(information)。知己知彼、百战不殆。可见信息对博弈的重要性古人早已知之。博弈中最重要的信息是有关对手策略以及各博弈方得益的信息。例如,在各博弈方同时决策的博弈中,必须保证不能让对手知道自己采取何种策略,否则自己将永远是博弈的输家。得益(play off),也称支付,是指博弈方策略实施后的结果。有关得益的信息是促使某博弈方选择某种策略的关键参考值。理性的博弈方总是选择能使自己获得最大得益的策略。一旦确定了以上四要素,一个博弈也就随之确定了。值得注意的是,博弈论特别强调“理性人”的前提假定,即参加博弈的各博弈方始终以自身利益最大化为惟一目标。除非为了实现自身最大利益的需要,否则不会考虑其他博弈方或社会利益。

(三)博弈论的结构

由于一个完整的博弈需具备上述四要素,因此博弈可以从不同的角度划分成不同类别:1,按博弈方划分,可分为单人博弈和多人博弈。单人博弈因为只有一个博弈方,所以它已退化为一般的最优化问题。经济学中常见的求最优问题,实际上是博弈的特例。多个博弈方的博弈较单人博弈复杂,而且两人以上的博弈会出现合作博弈问题。这样,多方博弈又将分为合作博弈与非合作博弈。因为在社会与经济关系中,竞争与不合作是基本方面。所以当前的博弈论主要研究的是非合作博弈。1994年诺贝尔经济学奖三位得主的主要贡献,即在非合作博弈方面。2,按策略空间划分,可分为有限策略博弈和无限策略博弈。因为每一种策略都相应地对应一个得益结果,所以从理论上讲,有限策略博弈的结果必然是有限的,而无限策略博弈的结果则有无穷多种可能。3,按进行博弈的次序划分,可分为静态博弈和动态博弈。各博弈方可同时决策并行动的博弈称为静态博弈。当然,严格讲各博弈方在非常精确的同一时点同时决策是不可能的。因此,同时决策是指可近似地看作同时作决定的过程,如乒乓球团体赛的出场顺序,虽双方决策可能有早有晚,但一旦敲定便谁也不许变更,因而可看作同时决策。各博弈方不是同时决策,而是先后、依次决策、行动的博弈叫动态博弈。弈棋就是一种典型的动态博弈,双方的每一步都将取决于前面的情势。4,按信息划分,如按得益信息分类,可分为完全信息博弈与不完全信息博弈。完全(complete)信息,是指各方对自己每种策略的得益情况完全清楚,否则是不完全信息;在动态博弈中,如按博弈进程信息分类,可分为完美信息动态博弈与不完美信息动态博弈。完美(perfect)信息,是指博弈方在决策前对其他博弈方的行为完全了解,否则是不完美信息。5,按得益情况划分,可分为零和博弈、常和博弈和变和博弈。一方收益必来自另一方的损失,这样的博弈叫零和博弈,零和博弈的博弈方始终是对立关系;各方都会有收益,但收益总和是一固定常数,这样的博弈为常和博弈;各方不同的策略组合会有不同的收益,这样的博弈称变和博弈。显然,零和博弈是常和博弈的特例,常和博弈是变和博弈的特例。6,综合分类。综合分类是将博弈次序与博弈信息结合起来的一种分类方法。按这两个标准,可将博弈分为:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、不完全但完美信息动态博弈、完全不完美信息动态博弈以及不完全不完美信息动态博弈。这种分类方式有助于针对不同特性的博弈进行研究和求解。

博弈论 (Game Theory),是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。因此,博弈论又称为“对策论”,也就是说当一个主体,比如一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他的人、其他企业的决策问题和均衡问题。正是在这个意义上,博弈理论又译为“决策理论”。博弈论创立于20世纪40年代,到50年代博弈论的研究达到了顶峰。博弈论研究的决策不仅包括经济学领域,而妾包括政治学、军事、外交、国际关系、公共选择等各个领域,因而博弈论又被称之为方法论。本文拟将这种方法引入到反垄断法领域,具体分析反垄断法规则的制定过程。

二、反垄断法的博弈分析

(一)政府和企业之间的博弈分析

1, 政府和企业博弈的根源

企业,作为市场运行主体,在市场经济中具有强烈的追求利润的理性意识;企业的理性就是实现利润的最大化。企业一切经济活动的出发点和归宿都要以这个目标为指导。在利润最大化目标的指导下,企业必须研究市场上其他主体的战略并确定自己的战略,从而市场上各个经济主体都是企业博弈的对象。企业决策往往具有局部性、个体性和短期性的特点。与之相对,政府作为市场运行的监管主体,是社会理性的当然代表,其决策往往带有全局性、整体性和长远性。由于政府制定的各种市场运行规则客观上限制了企业理性的发挥;尤其是当社会理性和企业理性发生冲突时,作为被管理者的企业只能寻求“次优方案”。当然,企业也并非只是一味地妥协,也可以与政府进行博弈从而影响相应的法律、法规的制定。由政府所代表的社会理性和企业理性的冲突及其在现实经济生活中的具体表现——政府所代表的社会利益与企业追求自身利润最大化的矛盾,决定了二者都将对方视作自己的博弈对象,从而使具体的法律、法规,尤其是反垄断法的制定过程,表现为政府和企业的博弈过程。

2,政府和企业参与博弈的目的

企业,作为盈利性的经济组织,是以实现利润最大化为其根本宗旨的;并且在这一根本宗旨的指导下组织各种经济活动。只要能够降低企业的生产成本,提高企业的利润,企业都不惜一试,包括采取垄断的方式。但是,垄断的存在,不仅侵害了广大的消费者的利益(具体表现是通过垄断价格,将相当大的一部分消费者剩余转化为超额利润。),而且凭借其“市场势力”阻碍了有效的竞争,打破了市场竞争的均衡状态。政府,作为社会利益的代表,具有保护消费者的合法权益和维护市场有效的竞争秩序的当然职能;其可通过制定法律影响着企业决策的“可选择集”,即企业只能在法律许可的范围内进行选择。显然,“可选择集”越大,对企业越有利;而决定企业“可选择集”大小的恰恰就是政府。因为政府通过确定其产业政策和竞争政策的具体内容和相互关系,影响认定垄断的界限,并通过反垄断立法决定了企业可选择范围的大小,从而间接地决定了企业的盈利空间。企业参与博弈的目的就是通过影响政府的反垄断法规,实现对企业行为的有效规制,进而最大限度地保护社会公众的利益。

3,反垄断法的博弈分析

反垄断法指的是国家为了保护竞争,针对一些限制竞争行为所规定的法律规范的总称。其目的就是政府通过法律的手段限制企业有碍于竞争的经济行为。政府在决定是否将一种企业的经济行为列入受限制之列前,政府要作如下的博弈分析:保持企业退出

政府面对一种限制竞争行为有两种选择:干预,即将其限制于合理的范围之内;或者放任自流。政府要进行干预需要支出相应的费用,设费用为5,占总收益10的一半,那么经政府干预给社会带来的净收益是5(总收益10减去干预费用5)。此时,企业针对政府的干预政策有两种策略:其一是保持原有的状态不变,继续从事具有垄断性质的经济活动。但是,由于法律的强制性,如果企业采取此策略无异于自取灭亡。此时,企业不但不会盈利,相反还会被强制清除出场。其二是企业选择退出。此时,企业只需要付出沉淀成本,设其为收益的一半为5;在这种情况下,企业的收益为-5.政府还有另外一种选择,就是放任自流。这样,如果企业保持原来的垄断状态,就将获得全部的利润所得,社会公共利益为0;如果企业选择退出,那么全部利润将自动流向政府所代表的社会公众,此时,企业还要支付相应的沉淀成本。由于政府干预经济的目的就是为了将“垄断利润”返还给广大的消费者,(0,10)所代表的状态正是政府介入的原因,并且是政府所要竭力改善的初始状态。(10,-5)所代表的是企业自动放弃高额的垄断利润,并且还要为此承担相应的前期投入,即沉淀成本。这是不符合企业追求利润最大化的理性目标的,因而是不现实的。由此,政府只能选择干预策略。企业根据其对政府选择的分析判断政府介入的可能性,然后在(5,-10)、(5,-5)和(0,10)三种状态中进行选择。由于(5,-10)的高成本和(0,10)的不现实性及由此决定的高风险性,迫使理性的厂商选择(5,-5)所代表策略。这样,可以将损失降低到最低。政府经过上述博弈分析,最终决定将该经济行为纳入禁止之列;而企业也会选择放弃该垄断行为。至此,反垄断法的目的得以实现。

4 对反垄断法进行经济分析的意义。

对反垄断法进行博弈分析的意义在于揭示反垄断法的制定过程从某种意义上讲就是政府和企业的博弈的过程,反垄断法律规范的具体规范则是政府和企业的博弈结果在法律上的认定。所以,在反垄断法的制定过程中,应该站在企业的立场上考虑企业可能做出的策略选择,然后再确定法律是否对该行为进行规制及如何规制。这样,才能保证制定出的法律能有效地规制企业的行为,有效地保证竞争。

(二)企业间通过价格等垄断协议的博弈分析

在寡头市场上,当寡头数量很少时,从理论上说,他们很容易通过谈判实行勾结定价,即像一个垄断者那样用高价格来宰消费者。这样做,交易费用(寡头进行价格勾结谈判达成协议所需要的费用)并不高,而勾结定价可以为参与者带来共同的利益。但为什么这种勾结定价在现实中成功的很少呢?尽管许多国家“反垄断法”中有禁止勾结定价的条款,但实际上这个条款的作用极为有限,因为寡头之间可以采用不易被发现的隐蔽性勾结——默契。我们可以用博弈论的分析来说明现实中的勾结定价难以成功的原因。

我们假设某地牛奶市场由两家寡头瓜分,这是寡头中最简单的寡头——双头,也是最容易达成价格勾结协议的寡头市场。如果这两家寡头(A与B)之间没有任何勾结,各自按成本最低时产量进行生产,各生产3000磅牛奶,成本为每磅6元。这时,市场总供给量为6000磅牛奶,价格为6元。各家都没有经济利润(经济利润为零)。

现在这两家寡头达成价格勾结。要实现高价必须减少产量。现实中寡头之间的价格勾结总是以限产为前提的(以后要谈到的欧佩克就是这样)。如果这两家寡头把产量确定为 2000磅牛奶,这时成本为每磅8元。市场总供给量减少为4000磅牛奶,需求并没有变,价格上升至每磅9元。在这种价格时,每家寡头可获得经济利润 2000元。当然,勾结起来对双方都是有利好的。

如果达成协议方有一方违约会有什么结果呢?如果一方违约,生产3000磅牛奶,它的每磅牛奶成本约为6元,另一方守约生产2000磅牛,每磅牛奶成本为8元。这时市场总供给量为5000磅牛奶,价格为7.5元。市场价格只有一个,是整个市场的供求总量决定的。违约的一方,成本仅6元,价格为7.5元,每磅牛奶的利润为 1.5元,总计经济利润为4500元。守约的一方,成本为8元,价格也是7.5元,每磅牛奶亏损0.5元,2000磅牛奶共亏损1000元。

这两个寡头的价格勾结协议的实施并没有法律保障,因为这种协议是非法的。守约的一方无法对违约的一方提出诉讼,即缺乏有效的惩罚。是否守约完全取决于各自的意愿。他们是否会守约呢?一方守约与否的结果还取决于对方是否守约,协议并没有保证对方守约的硬约束,因此,各方都有守约与违约两种选择,而对方到底会选择什么,无法确定,这时就可以用博弈论来分析各自的决策了。

我们来看A的决策过程。A要分析在B不同的选择下,自己的选择会有什么结果。A先假设B是守约的,这时A选择守约可以赚2000元,如果选择不守约可以赚4500元。两者相比,A守约时,B的占优战略是不守约。A再假设B不守约,这时A选择守约要亏损1000元,如果选择不守约可以不赔不赚(经济利润为零)。两者相比,A不守约时,B的占优越略也是不守约。A的结论是,无论B守约还是违约,对自己最有利的还是不守约。B的分析方法和结论与A完全一样。结果A、B都选择了不守约,价格协议成了一张废纸。

在这种情况下,A、B如何才能实现勾结呢?研究者发现,如果就是这两个寡头,同样的博弈会多次进行。双方最终会发现,达成勾结的条件是采用一报还一报的策略,即对方这次守约,我下次也守约,如果对方这次不守约,我下次也不守约。这种情况下,双方会发现,从多次博弈的结果看,违约是不利的,从而自觉守约。这种一报还一报就成为有效的惩罚。但在现实中这种情况极为罕见——只有两个寡头,而且多次重复同样的博弈。在常见的多头博弈,而且同样的博弈很少反复进行的情况下,价格勾结就难以成功了。

这种分析与现实一致吗?一个最常用的例子就是欧佩克(石油输出国组织)的价格勾结。欧佩克是一个限制产量并提高石油价格的寡头价格联盟(又称“卡特尔”)。他们在70 年代的成功更多的是共同的政治动机。但经济利益在长期中是高于政治的。随着时间流逝,博弈论分析的情况就出现了。各成员国都想,无论其他国家是否守约,我违约对自己是有利的,于是纷纷打破限产规定,增加生产,结果到80年代,石油价格就大幅度下跌了。以后的石油价格上升不是价格协议起作用,而是供求关系变动的结果

在任何一种市场上,决定价格的最基本因素还是供求关系。在供大于求的情况下,任何价格勾结都不能长远地提高价格。在供小于求的情况下,无需价格勾结,价格也会上升。在价格决定中,价格勾结是无用的。过去我国出现过的汽车行业自律价和民航的禁折令等形式的价格勾结,哪一个实现了?人为的价格勾结当然阻挡不了供求决定价格的客观规律。博弈论分析的结论与现实是一致的。企业还是不要玩这种小权术,老老实实提高自己的市场竞争。

三、小结

本文通过对反垄断法的制定过程进行简要的博弈分析,旨在说明法律的制定不仅是立法机构的单方行为,还是一个规制者与被规制者——政府和企业相互博弈的互动的过程。如果在法律的制定过程中忽略了这一点,就很容易导致法律对于现实生活的无效和“无能为力”,从而不能有效地实现其价值。

参考文献

[1]张维迎。博弈论与信息经济学[M].上海人民出版社,1996。

[2]冯涛。程瑜。微观经济学[Z].西北大学出版社,1998。

博弈论及其应用篇9

本书主要为读者介绍了合作博弈的价值解决方案。合作博弈又称联盟博弈,在合作博弈中,一些参与者以同盟、合作的方式进行的博弈,这样一来博弈活动就变成了不同集团之间的对抗。参与者未必会做出合作行为,然而会有一个来自外部的机构惩罚非合作者。合作博弈强调的团体理性,是效率、公平、公正。合作博弈中,博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。

本书讨论的合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。合作博弈采取的是一种合作的方式,或者说是一种妥协,妥协其所以能够增进妥协双方的利益以及整个社会的利益,就是因为合作博弈能够产生一种合作剩余。这种剩余就是从这种关系和方式中产生出来的,且以此为限。至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。在这里,合作剩余的分配既是妥协的结果,又是达成妥协的条件。合作博弈由于在解决世界上各类资源共享问题和避免冲突方面有独到的方法,近年来在经济学中的地位与日俱增。本书详细介绍了合作博弈理论的新概念,特别是新的解决方案,确定了联盟成员之间的联盟盈余分配。此外,还对若干合作博弈理论进行了概括。本书分为9章:1.具有转移性的效用的联合博弈的解决方案;2.ZeuthenNash议价;3.非转移性效用的博弈和用配分函数表示的博弈;4.用配分函数表示的博弈的Shapley价值算法;5.用配分函数表示的非转移性效用的博弈的内核的扩展;6.可变议价能力的问责;7.议价能力的双型博弈;8.跨期合作博弈:理论概要;9.企业理论。

本书作者Roger A.McCain来自美国Drexel大学。本书适合于博弈论领域的研究生和研究人员阅读。

博弈论及其应用篇10

关键词:非合作博弈;合作博弈;渠道利润;营销渠道

中图分类号:F713.50 文献标志码:A 文章编号:1673-291X(2008)04-0105-02

在最近的研究中,学者们开始对渠道中的合作组织―联盟的形式进行研究。在这些文献中,这些结构通常被定义为 “合作伙伴”和“联盟”等,这种结构安排有助于提高信任度、降低交易成本,拥有强大谈判能力的分销商联盟集中向供应商谈判获取更大利润空间。营销渠道分销商双方希望通过联盟以提高利润,但联盟具有不稳定性,因此,需建立联盟双方相互制约的机制。

一、非合作博弈与合作博弈

1.非合作博弈(non-cooperative game)

目前,经济学家们所谈的博弈论一般是指非合作博弈。非合作博弈是指人们的行为在相互作用时,当事人不能达成一个具有约束力的协议。非合作博弈强调个人理性和个人最优决策,其结果可能是有效率的,也可能是无效率的.

非合作博弈是在纳什均衡理论的基础上发展起来的,在经济学中,人们给纳什均衡理论是这样定义的:“在给定它的竞争者的行为以后,各厂商采取它能采取的最好行为”。给定你的策略,我的策略是我最好的策略;给定我的策略,你的策略也是你最好的策略,这正是“纳什均衡”概念在两人博弈情况下最通俗直观的表达方式。博弈结果的一致预测性,纳什均衡的普遍存在性也得到学者的证实。

但是,纳什均衡理论不是完美无缺的。纳什均衡分析是以每个博弈方针对其他博弈方的策略的最优化或选择为基础的,因此,各个博弈方对其他博弈方的特征和策略必须完全清楚,必须能够“估价”或判断对手的选择,并在此基础上作出准确的反应。理论上纳什均衡分析是完全可以有效地加以解决的博弈问题,但在实际生活中却从来没有人是按照纳什均衡的方法进行分析和解决问题。

2.合作博弈(cooperative game)

合作博弈是指博弈的参与方在事先就收益的分配和战略的选择达成了有约束力的协议,即使这种协议不是由博弈的规则专门规定或实施的。合作博弈强调的是团体理性,强调的是效率、公正、公平。合作博弈其所以能够增进合作双方的利益以及整个社会的利益,就是因为合作博弈能够产生一种合作剩余。

二、营销渠道的博弈分析

(一)基础模型①

其中,α,β是正的参数,易见(α.βf)也是正值。我们也不难发现,需求函数本质上仍是价格的线性函数,只不过我们把其中的参数写得复杂一些或具体化一些罢了。

(二)各种博弈结果的比较

下面在讨论不同的博弈情景时,我们在有关符号的上标处标出相应的类型。我们用C表示合作博弈;用NC表示非合作博弈;用N表示同时独立作决策的非合作博弈或纳什博弈;用SM表示制造商领导的非合作博弈;用SR表示零售商领导的非合作博弈。

1.非合作博弈下的利润情况

制造商的利润情况,可以计算出如下结果:

三、合作博弈的实现

参考文献:

[1] Lilliecreutz,Johan. Orchestrating resource base,role,and position: a supplier's strategy in buyer-dominated relationships[J].

European Journal of Purchasing & Supply Management, 1998,4:73-75.

[2] Ming Zeng and Xiao-ping Chen. Achieving cooperation in multiparty alliances:a social dilemma approach to partnership

management[J]. Academy of Management Review,2003,(4):587-605.

[3] 郭焱,张世英.战略联盟契约风险对策研究[J].中国管理科学,2004,(4):105-110.

[4] 蔡继荣,胡培.基于合作溢出的战略联盟不稳定性研究[J].中国管理科学,2005,(4):142-148.

[5] 张维迎.博弈论与信息经济学[M].上海:上海三联书店,上海人民出版社,1996.

[6] [美]平狄克・鲁宾费尔德.微观经济学[M].北京:中国人民大学出版社,1997.

[7] 谢识予.纳什均衡论[M].上海:上海财经大学出版社,1999.

[8] 吴德勤.纳什均衡的内涵、问题和前景[J].上海大学学报,2001,(8):73-78.

[9] Bezalel Peleg,Peter Sudh?lter Introduction to the Theory of Cooperative Games[M].Springer-Verlag Berlin Heidelberg

2003,2007.