博弈理论论文十篇

时间:2023-03-20 02:32:37

博弈理论论文

博弈理论论文篇1

[关键词]进化 博弈 文献综述

一、进化博弈的基本理论

进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。

二、进化博弈理论的应用研究

1.社会行为领域

Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。Sandholm对个体行为偏好的进化进行了动态分析。Juang从进化的视角研究了规则的进化与均衡的选择问题。Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。

2.制度的演化

青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。他们认为:任何一种经济体制的产生都具有一定的惯性,并随着经济所处的外部环境与所积累的内部环境的变化一起逐渐地进化。吴炯、彭飞以进化博弈的复制动态方法为工具解释了公司治理结构演进过程中的“两极化”现象。邱中华等通过演化博弈模型考察委托人和人在委托过程中行为策略的自发演化过程,发现这一博弈过程的所有均衡都是鞍点,从而得出委托人和人之间的监察博弈没有进化稳定策略。Kandori和Rafael运用进化博弈理论研究了两种具有网络外部性的技术之间竞争的博弈过程,提出了解决“花车效应”问题的对策,论证了后发技术取代主导技术的可能性。

3.经济行为的演化

Routledge基于Grossman和Stiglitz提出的经济模型,探讨了金融市场上个体行为人是如何通过适应性和进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Cowen和Kroszner利用进化博弈理论研究了在自由竞争易货贸易经济中,在存在交易成本的情况下,交易媒介的选择问题。罗发友等对集群内企业技术创新行为构建了鹰鸽博弈、鹰鸽反击者博弈和鹰鸽应变者博弈三个模型,并得出集群内企业创新行为不存在纯策略进化稳定均衡,但存在混合策略进化稳定均衡和行为策略进化稳定均衡,反映了集群内企业创新行为的协同竞争性以及这种协同竞争创新行为的进化稳定特性。

三、借鉴意义

1.进化博弈论从有限理性人出发,强调系统达到均衡的过程而非均衡本身。进化博弈理论是完全摒弃传统理论中非现实的“理性人”假设,直接从有限理性参与人群体出发而提出的一种全新的动态分析方法,该方法认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程。

2.进化博弈论纳入了系统到达均衡的时间因素,有利于决策者控制系统向目标的进化。进化博弈理论的动态分析方法中一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程。这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

3.进化博弈理论引入突变因素较好的解决了多重均衡的选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态。进化博弈理论的基本均衡概念――进化稳定均衡,描述了当经济系统一旦进入到某一均衡的吸引域内,系统就会对其他的突变策略具有一定程度的抵抗力。

参考文献:

[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)

[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998

[3] 青木昌彦 奥野正宽:经济体制的比较制度分析.中国发展出版社,1999

[4]邱中华 金翔:基于进化博弈论研究的一类监察博弈. 南京邮电大学学报(自然科学版),2006,26

博弈理论论文篇2

根据生态社区环境的特点,建立博弈模型[10]步骤如下:Step1:假设信号博弈论主要对象为政府管理部门G和社区间的企业(沿街店面、企业等)P,其中P为信号的发出方,G为信号接受方,政府管理部门和社区企业在追求各自利益最大化的同时,作出“监管”与“不监管”或“治理”与“不治理”的决策,在这里,我们引入社区居委会、第三方中介等机构S,主要职责为进行日常的“监管”。Step2:用12,表示为P的类型空间,α为对P的专有信息,当1时,表示社区企业采取了“治理”决策,当2时,表示社区企业采取了“不治理”的决策,α对S是一个未知的博弈信息源,但S知道P的先验概率i。Step3:用12mm,m表示为P的信号空间,在这里假设社区的环境污染给社区企业造成的环境经济损失和进行“治理”决策企业需要投入的成本费用的总和为PC1,采取“不治理”决策时需要支付的费用为PC2,显然12PCPC,当1mm时表示社区企业给政府管理部门缴纳的费用为PC1,2mm表示社区企业缴纳的费用为PC2,通常情况下α1型社区企业缴纳PC1,α2型社区企业缴纳PC2,假设完全理性条件下,α1型企业不可能缴纳的费用为PC2,当α2型企业缴纳费用为PC1时,企业为作假缴纳费用,必须受到与之相对应的处罚。Step4:P发出的博弈信号被G接收到后,根据贝叶斯法则对i进行修正,得到P类型的后验概率''''''''iim,并根据博弈信号值来推测出P的类型空间,选择行动β,这里假设G的行动空间12,,当1时表示政府管理部门G采取了“监管”决策,当2时表示为G采取了“不监管”决策。根据以上的博弈模型假设,我们可以构建出政府管理部门和社区企业对整个生态社区的环境治理决策博弈模型,这个博弈模型属于不完全信息下的博弈,采用海萨尼转换将该博弈模型转换为完全不完美信息博弈。博弈模型表述为:将社区中的除企业外的其他居民假设为虚拟的参与自然人N,且N按先验概率确定信号发出方P的类型α1,G根据发出的信号mi运用贝叶斯法则计算α的后验''''i,并采取对自身利益最大化的行动β,其中i=1,2。P的信号选择策略是类型空间α映射到信号空间上m的概率函数,G的行动空间β是m映射到对象集合上的概率函数,由此可得管理部门和企业的期望收益如式(1)和式(2),式中(,,)PiiiZmZ为支付矩阵取值,(,)GiiZm和(,)PiiZm分别为政府管理部门G和社区企业P的决策。图1为信息不对称下政府管理部门与社区企业信号博弈的博弈树,图弈主体收益为博弈树“末梢”处括号内的值,其中第1个值为社区企业收益1Zm,第2个值为管理部门收益2Zm,1is和2is为G的决策集合,GC为政府管理部门监督的成本,1i和2i为社区环境质量差给政府管理部门带来的负面影响,满足12ii,r为政府管理部门对采取“治理”决策的社区企业所给予的补贴或奖励,0为政府管理部门未监督,且企业采取未治理决策时后受到未评为生态社区的处罚,1和2分别为社区企业未采取治理决策以及谎报支出费用的罚金。

2精炼贝叶斯均衡分析

按照类型空间与信号空间22的组合,理论上该模型的精炼贝叶斯均衡解有4个,现分混合均衡与分离均衡两种进行讨论[11]。

3博弈结果分析

通过对精炼贝叶斯均衡的求解可知,混合均衡12m,m在一定区间内存在,分离均衡12m,m一定存在,混合均衡在以下情况将被打破:当G“监督”成本减少,社区企业采取“治理”所获得的政府补贴或奖励减少,企业未采取治理决策和谎报支出费用所被处罚的金额以及政府管理部门由于“未监督”受到上级部门的处罚增加时,混合均衡区域将减少,直至政府管理部门G采取“监督”决策。

4结论

博弈理论论文篇3

关键词:新闻传播学 博弈论 方法

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路, 在上个世纪80 年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间, 涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究,不能缺少博弈论的思想。

上个世纪90 年代之后, 有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物, 这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视, 是在2004 年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008 年10 月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度, 来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象, 对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行, 通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发, 来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论,说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题, 传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象, 也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。[ Www.]

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素, 但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面, 来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理:第一不完备性定理———任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想, 扩展研究视域,在新闻传播领域内最合适的地方,找到双方的契合点,从新的角度描述新闻传播现象与活动的规律, 调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何,有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与活动过程中,有没有相类似的情况? 其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态,即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素, 正如恩格斯所说的“平行四边形”合力作用,但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此,博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具, 人们十分重视其方法论意义。

从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点, 自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播应用学派的传播模式研究, 实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中, 许多传播模型十分典型地体现出这种情况。该书第一版介绍了35 个传播模式, 第二版介绍了66个传播模式。除了个别早期线性模式外, 在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说,研究当代传播模式离开了博弈的思维, 其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代, 在需要破除自然与社会科学鸿沟的时代, 谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响,人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论,并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视, 将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”, 进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年,但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意,原因是新闻传播理论界对博弈论尚不太熟悉,对博弈论的理解也参差不齐,甚至还存在部分抵触心理,致使研究成果的质与量不甚理想。新闻传播研究需要理论创新,对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论,对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上,在新闻传播研究领域都有用武之地,关键在于我们的观念。

参考文献

1.肯尼斯·赫文[美]、托德·多纳著:《社会科学研究的思维要素》,重庆大学出版社,2008年版。

2.施锡铨著:《博弈论》,上海财经大学出版社,2000 年版。

博弈理论论文篇4

【关键词】博弈论;纳什均衡;重复博弈

博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。因此,本文将主要的博弈均衡概念进行分类和表述, 并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。

一、博弈的主要类型

博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。依据不同的分类标准,博弈可以被划分为不同的类型。

1、静态博弈、动态博弈和重复博弈

博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表和对弈的简称而来。重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。

2、完全信息和不完全信息博弈

完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。

3、完美信息和不完美信息博弈

在动态博弈中,一参与人完全了解在自己行为之前的博弈进程,则称此参与人为有完美信息的参与人,如果博弈中所有的参与人都具有完美信息,则称此动态博弈为完美信息的动态博弈。反之,如果在存在具有不完美信息的参与人(参与人不完全了解自己行为之前的博弈进程),则称此动态博弈为不完美信息动态博弈。

4、合作博弈与非合作博弈

合作博弈允许参与人之间自愿签订有约束力的协议,而非合作博弈的参与人则完全按照个人理性做出策略的选择。在囚徒困境博弈中,非合作博弈得到的结果是双方均坦白,而在合作博弈的情况下则可能得到双方均不坦白的更好的结果。

5、完全理性和有限理性博弈

由具备完全理性的参与各方所进行的博弈称为完全理性博弈。存在有限理性博弈方的博弈称为有限理性博弈。

将上述不同的博弈类型进行组合,可以得到更多类型的博弈,如不完全、完全信息博弈和静、动态博弈可以组合为不完全信息静态博弈、不完全信息动态博弈,完美完全信息博弈、完美不完全信息博弈、不完美不完全信息博弈等。

二、博弈论主要的均衡概念

1、上策均衡

如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么该策略组合称为一个上策均衡。

2、纳什均衡

(1)纯策略纳什均衡

在博弈G={S1……Sn;u1……un}中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,……sn*)中,任一博弈方的策略si*,都是对其余博弈方策略组合s-i*的最佳策略,即:

ui(si*, s-i*)≥ui(si, s-i*)对于任一((1~N))都成立,则称(s1*,……sn*)为一个“纯策略纳什均衡” 。

(2)混合策略纳什均衡

混合策略:在博弈G={S1……Sn;u1……un}中,博弈方i的策略空间为Si=(si1……sik),则博弈方i以概率分布(pi1……pik)在其策略空间中进行选择,由此形成的策略称为“混合策略”。其中0≤ pij≤1,且。

将纯策略拓展到混合策略,相应的纳什均衡称为混合策略纳什均衡。事实上,纯策略纳什均衡是混合策略纳什均衡的一个特例。根据纳什定理我们知道,每一个有限博弈(参与人和策略空间均为有限)均存在至少一个混合策略的纳什均衡。

3、防共谋均衡

如果一个博弈的某个策略组合满足以下要求:1、没有任何单个博弈方的偏离了会改变博弈的结果;2、给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;3、以此类推,直到所有博弈方的串通都不会改变博弈的结果。满足上述要求的均衡策略组合称为“防共谋均衡”。

4、子博弈完美纳什均衡

如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足:在整个动态博弈及它所有子博弈中都构成纳什均衡,那么这个策略组合成为该动态博弈的一个“子博弈完美纳什均衡”。

5、颤抖手均衡

如果有限策略博弈的一个纳什均衡满足对每个博弈方i都存在一严格混合策略序列{},使得(1),(2)对于任意正整数m,都是纳什均衡 ,那么,称为一个“颤抖手均衡”。这里的严格混合策略指的是每一个策略都有一个正的被选取的概率。

6、完美贝叶斯均衡

当博弈的一个策略组合及其相应的判断满足以下要求时,称为一个“完美贝叶斯均衡”:

(1)在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的判断,对非单节点信息集,一个判断就是博弈达到该信息集中各个节点的概率分布 ,对单节点而言,则可理解为判断达到该节点的概率为1。

(2)给定各博弈方的“判断”,他们的策略必须是“序列理性”的。所谓序列理性是指在各个信息集,给定轮到选择博弈方的判断和其他博弈方的后续策略,该博弈方的选择及其后续策略必须使自己的期望收益最大化。

(3)在均衡路径上的信息集初,判断由贝叶斯法则和各博弈方的均衡策略决定。

(4)在不处于均衡路径上的信息集处,判断由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。

7、贝叶斯纳什均衡

在静态贝叶斯博弈中G={A1,…,An;T1,…,Tn;p1, …,pn;u1, …un}中,如果对任意博弈方i和他的每一种可能的类型,Si*(ti)所选择的行动ai都能满足:

max

则称策略组合S*=(S1*,…,Sn*)为G的一个贝叶斯均衡。

8、分离均衡和混合均衡

在不完美信息博弈中,在不同情况下(如拥有商品的类型不同)的完美信息博弈方采取相同行为的市场均衡,称为混合均衡(pooling equilibrium);反之,在不同情况下,完美信息博弈方采取完全不同行为的市场均衡称为分离均衡(seperating equilibrium)。

三、不同均衡概念的比较

上策均衡一般适用于静态博弈,虽然具有很好的稳定性,但是在对博弈进行分析的局限性较强,因为在很多博弈中,并不是所有的参与人都具有上策。在博弈论的各种均衡概念中,纳什均衡处于核心的位置。这是因为:1、纳什均衡是分析博弈的有力工具,可以对大量的博弈结果做出有效地判断,不论是静态还是动态博弈,比如运用纳什均衡可以预测古诺寡头市场上各个厂商的产量,也可以用纳什均衡预测动态的斯塔博格模型中的垄断厂商的产量;2、纳什定理表明了纳什均衡的普遍存在性,这说明了在博弈环境下纳什均衡概念本质上的合理性;3、其他的均衡概念基本上都是由纳什均衡衍生而来,如子博弈完美纳什均衡是将纳什均衡扩展到了每个子博弈上面 ,贝叶斯纳什均衡则是将纳什均衡延伸到了不完全信息博弈当中。纳什均衡的主要问题首先,一个博弈往往存在多个纳什均衡,而运用纳什均衡概念本身无法再对这些均衡进一步分析;其次纳什均衡不能排除博弈策略中所包含的不可信的行为设定,不能解决动态博弈的相机抉择所引起的可信性问题,这导致了纳什均衡的内在不稳定性。

利用逆推归纳法,子博弈完美均衡有效地排除了纳什均衡中不可信的行为设定,从而提高了纳什均衡的稳定性 ,但是逆推归纳法也有严重的弱点。首先,逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则、和收益情况都非常清楚,并且各个博弈方了解博弈结构,并相互指导对方了解博弈结构,而现实问题往往与这些要求相去甚远;其次对于阶段比较多,比较复杂的动态博弈,比如对弈,运用逆向归纳法的工作量则变得极为庞大,以至于借助计算机也无法完成;如果遇到两条收益相同的路径,逆推归纳法则无法继续进行下去。逆推归纳法更大的问题是对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许博弈方犯任何错误 ,而且要求所有博弈方了解和信任对方的理性,形成“理性的共同知识”,这些条件在现实中同样难以得到满足。

颤抖手均衡的概念在一定程度上解决了子博弈完美均衡和逆推归纳法所遇到的问题。颤抖手均衡考虑到参与人难免会犯一些错误而舍去了由于参与人小概率的偏移而导致整个策略组合不可行的均衡路径,因而具有更高的稳定性 。但是颤抖手均衡本身并没有解决博弈方犯错误的问题,因而也不能保证它的预测就是实际博弈的结果。

贝叶斯纳什均衡和完美贝叶斯均衡是针对不完全和不完美信息博弈问题提出的。造成不完全和不完美信息博弈问题的根本原因是参与各方的信息不对称,而这在现实的经济活动中是普遍存在的,如在保险市场、信贷市场、劳动力市场、柠檬市场、拍卖市场上的情形。分析和解决信息不对称问题对经济活动造成的影响是现代信息经济学的核心问题,因而博弈论成为信息经济学研究的有力工具,现代信息经济学取得的迅猛发展和博弈论广泛运用分不开的。完美贝叶斯均衡是针对不完美信息博弈提出的均衡概念,而贝叶斯纳什均衡是针对不完全信息博弈提出的均衡概念。海萨尼通过引入一个虚拟的自然博弈方将原来的不完全信息博弈问题转换为完全但不完美信息博弈问题,使得动态贝叶斯博弈分析就可以利用完美贝叶斯均衡、分离均衡、混合均衡等概念和方法进行分析。

四、结束语

本文对博弈论中主要的均衡概念进行了描述和比较分析。上策均衡是最直观的博弈均衡概念,但适用范围非常有限。纳什均衡是博弈论的理论基石,从本质上刻画了处于博弈环境(即每个参与人的收益受到整个博弈策略组合的影响)的均衡状态。子博弈完美均衡解决了纳什均衡中不可置信威胁的问题,颤抖手均衡将博弈方犯错误的可能性考虑了进来;而贝叶斯纳什均衡和完美贝叶斯均衡则可以用来处理信息不完美和不完全问题。当然,本文所涉及的博弈均衡概念基本上都是关于非合作和完全理性下博弈(颤抖手均衡虽然考虑了博弈方可能会犯错误的可能性,但这并不意味这博弈方的有限理性)。关于合作博弈和有限理性博弈也发展出了一些均衡概念,如纳什谈判解、夏普利值、进化稳定策略等,另外关于非合作博弈也有一些均衡概念本文没有涉及。随着博弈论理论的不断发展和实际运用的日趋广泛,博弈均衡的概念将会得到不断地精炼和更新。

参考文献:

[1]谢识予,经济博弈论(第三版)[M],复旦大学出版社,2006。

[2]朱.弗登伯格,让.梯若尔,博弈论[M],中国人民大学出版社,2002。

博弈理论论文篇5

【关键词】 无线电 博弈论 纳什均衡

一、博弈论的概述

1.1概念

博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论[20]。也就是说,博弈论研究当一个主体,譬如说一个人或一个企业的选择受到其他人(其他企业)的选择的影响,而且反过来影响到其他人(其他企业)选择时的决策问题和均衡问题。所以在这个意义上说,博弈论又称为“对策论”。博弈论是一种使用严谨数学模型来解决现实中利害冲突的理论,由于冲突、合作、竞争等行为是现实中常见的现象,因此很多领域都能应用博弈论,如军事领域、经济领域、政治外交等。

1.2博弈论模型简介

博弈论自产生到发展至今已形成了较成熟的理论体系,它并不是经济学的一个分支,它是一种方法,应用范围不仅包括经济学,政治学、军事、外交、国际关系、公共选择,还有犯罪学等都涉及到博弈论。不过博弈论也具有自身的基本模型,可以对一个博弈过程用5个方面来描述,G={P,A,O,I,U}

① P(player):博弈的参与方。

② A(action):博弈方可选择的全部行为或策略的集合

③ O(orders):博弈的次序。

④ I(information):博弈的信息。

⑤ U(utility):博弈方的收益。

以上五个方面是定义一个博弈时必须首先设定的,确定了上述五个方面就是确定了一个博弈。博弈论就是系统研究用上述方法定义的各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,也既是均衡。

1.3博弈论的分类

现实中各种博弈可以按照不同的办法进行分类。根据参与人的多少,可以将博弈分为两人博弈和多人博弈;根据参与人是否合作,可以将博弈分为合作博弈和非合作博弈;根据博弈结果的不同,又可以将博弈分为零和博弈、常和博弈和变和博弈。

1.4纳什均衡

1.4.1纳什均衡的定义

纳什均衡(Nash Equilibrium)[20]是一种策略组合,它能够使得每个参与者的策略都是对其他参与者策略的最优反应。“最优反应”指的是该策略带给采用它的博弈方的利益或期望利益,大于或至少不小于其它任何策略能带来的利益。博弈的目的,就是为了寻求这样的一个最佳的策略组合。

1.5 一些特殊的博弈模型

1.5.1重复博弈模型

重复博弈是目前人们了解的最为透彻的一类动态博弈,参与人每一期都面对同样的“阶段博弈”或“选民博弈”,而且参与人的全部收益是每阶段所得收益的加权平均。参与者基于对博弈过程的认知,例如对过去行为的了解,对未来的预期和对当前情况的观察,在每一个阶段的博弈中选择自身的策略。这些策略可以是固定的,也可以随其它参与者行动的改变而变化,甚至可以是自适应的。

1.5.2潜在博弈模型

潜在博弈是一般形式博弈中的一种特殊类型,存在函数u:SR当单方面的背离发生时,u的变化Δu将被反映到单方面背离博弈者的效用上。

二、在无线通信系统资源分配问题中应用博弈论的可行性分析

随着无线通信系统的飞速发展,许多概念和技术与现有系统相比都有很大的变化。通信系统将具有智能的资源管理,采用大量动态的、分布式的、自适应式的资源管理方式。

三、基于博弈论的动态频谱接入方法

如何利用博弈论方法对认知无线电技术的研究进行分析,其中的关键是如何将博弈论引入到相应算法的设计和分析中,找到算法的纳什均衡点。在开始具体的算法研究之前,需要将所研究的问题抽象成博弈论问题模型。

3.1 分布式自适应频谱接入方法

博弈论模型适用于分析认知无线电系统各用户竞争频谱的分布式行为,各用户根据自己获得的信息单独进行决策。

博弈理论论文篇6

WTO作为世界经济发展的重要支柱,在管理全球经济和贸易秩序的同时,也为各成员国进行多边博弈提供了一个大舞台。在这个舞台上,各成员国通过降低关税、开放市场、取消壁垒、进行平等的自由贸易,不仅带来了更多的利益,也使成员有机会平等地参与国际竞争。上世纪50年代起,博弈论作为一种方法论在经济学领域得到了广泛的应用,国内外众多学者也开始运用这一全新方法从不同角度对GATT/WTO的产生、规则和运行进行了分析和研究,并取得了丰硕的研究成果。

【关键词】

博弈论;GATT/WTO;国际经济政策

西方传统经济理论大多是研究经济行为主体在市场完全竞争且信息充分对称的假设下进行决策,以实现稀缺资源的有效配置,但却忽视了外部变量对经济行为主体决策的影响。博弈论作为20世纪70年之后在经济领域得到广泛运用的方法论,紧紧抓住经济行为主体之间利益冲突与协调以及策略相互制约这一关键,提出了比西方传统经济理论更贴近实际的分析方法。博弈论的广泛运用为现实中复杂经济问题的分析提供了最佳分析工具,拓宽了现代经济学的研究领域。

GATT/WTO就是一种从非合作博弈走向合作博弈的产物,为国家和地区提供国际贸易行为准则,对协议实施中的问题和未来贸易自由化提供了谈判的程序,以达到各成员均从中获益的博弈结果。所以说,GATT/WTO是一套使成员之实现制度性合作博弈以摆脱非合作博弈的制度安排,这套制度安排确保所有成员实现福利改进。

一、博弈论方法应用于GATT/WTO研究

真正将博弈论方法应用于GATT/WTO研究始于美国学者McMillan(1986)。他通过建立关税博弈模型,证明了“互惠贸易协定能增进国民福利”这一命题,从而为GATT/WTO的确立奠定了理论基础。

Dixit(1987)研究了在无限重复博弈条件下的关税谈判与关税减让问题,结果显示,通过对背叛国家惩罚的可信威胁,世界可以维持一个低于纳什均衡关税的合作关税水平。

Thomas Hungerford(1991)进一步将关税博弈模型扩展至非关税博弈领域,得出类似结论,即“削减非关税壁垒也会增进双方的福利。”

Hoekman和Kostecki(2001)结合乌拉圭回合谈判,从博弈论视角论述了WTO多边贸易谈判的运行机制和互惠性质,指出“在WTO支持下的多边贸易谈判可以被认为是制定国际贸易博弈规则的努力”,“多边贸易谈判是多阶段、多议题、多方的博弈”。

Bagwell和Staiger(2002)从经济学角度论述世界贸易体制的理论基础和运行机制,利用博弈论的研究方法,解得合作博弈情况下的关税均衡,称之为“政治最优关税”,进而说明了WTO体制和规则框架的经济原理。

二、WTO的体制、规则和运行机制

盛斌(2001)借鉴Bagwell和Staiger的博弈模型,系统地解释了WTO的目的是各国通过合作博弈来摆脱非合作博弈情况下的“囚徒困境”,说明了WTO体制和规则框架的经济原理和哲学理念。该文可被视为国内运用博弈论研究GATT/WTO的奠基之作。

夏晖和韩轶(2001)从博弈论角度,以两国关税政策静态博弈模型为基础,分析了WTO成立的原因及条件。该文为用数理博弈模型研究GATT/WTO提供了一个全新视角。

冯春丽和周骏宇(2005)从制度经济学的层面,运用博弈论的方法来分析WTO,指出最惠国待遇原则和多边争端解决机制是WTO规则体系中最重要的制度安排,并利用一个收益不对称的智猪博弈模型分析了权力结构的变动所引致的WTO制度变迁。

三、多边贸易谈判中的博弈

施锡铨(2001)运用不完全信息博弈、复杂变量的博弈和盈利函数的估计,分析了中国加入WTO谈判过程中一系列讨价还价的博弈问题。

刘光溪和查永贵(2003)运用“双层博弈”理论分析了中国复关入世谈判中的博弈现象,阐释了谈判历程复杂而艰巨的原因;他又与邹彦(2003)研究了国际贸易谈判中的博弈战略,建议我国必须抓住时机,改革“不谋于众”的谈判体制,增强政府谈判能力,为国内企业奠定迎接挑战、公平竞争的良好基础。

四、运用博弈论就WTO的某一具体规则进行研究

房向明和侯光明(2002)从博弈论的角度出发,通过建立我国反倾销部门与外国企业的博弈模型,给出了我国对外倾销企业的罚款系数以及我国反倾销调查概率的确定方法,进而提出了加强我国反倾销力度的建议。

杨仕辉(2005)将WTO保障措施规则转化为三阶段动态博弈模型,重点比较和讨论了对一国和两国同时实施保障措施的区别,以及保障措施对实施国和目标国贸易条件、产品选择的影响。

杨波(2007)运用博弈论和经验检验的方法,分析得出技术水平发展的不对称导致国家间技术性贸易壁垒通报数量的差距,发达国家由于具备在技术和贸易两方面的优势,更倾向于主动采取设置技术性贸易壁垒的战略,而发展中国家则被迫采取亦步亦趋的跟从策略。

综观上述研究成果,中外学者运用博弈论来研究WTO在国内外还很空白,在研究成果、内容上都带有探索性和尝试性。作为一种方法论,将博弈理论作为研究GATT/WTO的视角,不仅可以有效诠释GATT/WTO的制度基础、规则体系和运行机制,也能说明GATT/WTO成员在世贸组织谈判中的动态博弈策略,从而为GATT/WTO的确立和运行提供一个全新的解释途径。

然而,无论国外还是国内,对WTO博弈论的研究都处于起步阶段,在研究内容上显得过于分散,无法形成统一的整体,从而无法形成对WTO博弈论的全面解释。同时,在定量分析方面,由于统计数据的不同与缺失,多边博弈在确定真实支付函数时也受到很大限制。

参考文献:

[1]盛斌.WTO体制、规则与谈判:一个博弈论的经济分析[J].世界经济,2001,12:3-12.

[2]夏晖,韩轶.世界贸易组织的博弈分析[J].电子科技大学学报,2001,05:520-524.

[3]冯春丽,周骏宇.WTO制度的博弈分析[J].国际经贸探索,2005,04:54-57.

[4]施锡铨.由WTO谈判所衍生的博弈研究[J].上海财经大学学报.2001(03).

博弈理论论文篇7

关键词:博弈论;供应链管理;均衡

abstract: game theory focus on the status analyze of conflict and cooperation. with the development of competition and cooperation among modern enterprises, game theory is widely used in supply chain management(scm). this paper classified the applications of game theory in scm into two groups: applications in traditional problems of scm, and applications in scm network equilibrium. the paper made a depth literature review of these two categories and gave out the future research trends.

key words: game theory; supply chain management; network equilibrium

0引言

博弈论所研究的是多种决策情况(博弈)中,每位决策者的最优决策和这些最优决策所构成的可能结果,以及这些结果的相关特性[1]。wWW.133229.cOM博弈论关注于包含冲突与合作的状态分析[2],目前的应用领域非常广泛。供应链管理是对从原材料采购到产成品消费整个过程所产生的各种关系、信息、物流等进行管理,以改善顾客服务和增加经济价值的流程[3]。近年来,随着供应链中企业间的竞争与合作不断增强,博弈论作为一种分析企业间相互竞争及相互合作的工具再次被广泛应用,主要用于解决供应链管理中的库存决策、产量/价格博弈、多决策分析及供应链网络的均衡等问题。

1博弈论在供应链管理中的应用现状

供应链由不同的企业组成,企业间相互竞争的同时也相互合作,随着供应链由“链”向“网”的转变,企业间关系越来越复杂,不仅存在着上下游企业的竞争与合作,还包括不同供应链的核心企业间的竞争与合作问题。纵观供应链管理弈论的应用研究,本文将博弈论在供应链管理中的应用分为两大类:博弈论在传统供应链问题中的应用;博弈论在供应链网络均衡中的应用。

(1)博弈论在传统供应链问题中的应用

cachon和netessine根据供应链管理的应用,将博弈论分为四种类型:非合作静态博弈、动态博弈、合作博弈和贝叶斯博弈[2];leng通过对130多篇供应链管理中运用博弈论的文献进行总结,认为博弈论在供应链中的应用主要有五种类型:固定单位采购成本与库存博弈、数量折扣下的库存博弈、产量和价格竞争博弈、其他属性的博弈(能力决策、服务质量、产品质量等)及联合决策博弈(能力、服务/产品质量、产量/定价、广告/新产品开发等决策内容的组合博弈)[2]。

在供应链的传统问题中,博弈论主要用于解决单阶段或两阶段供应链的上下游企业间存在的决策博弈,parlar分析了单阶段,两个零售商出售同质可替代产品进行订货决策以使各自利润最大化的问题[4];cachon研究了两阶段情况下,一个供应商与一个零售商的库存决策问题[5];monahan针对数量折扣现象,研究了供货商和购买者在顺序决策情况下,供货商的最优折扣决策[6],而kohli和park就供应链两阶段成员间基于数量折扣的合作问题进行了探讨[7];随着市场竞争的加剧,企业需要在控制成本的前提下提供令顾客满意的服务和产品,gans研究了m个供应商之间的服务质量竞争问题[8],而cohen和whang研究了售后服务质量决策问题[9];最近10年来,随着供应链问题研究的深入,多决策博弈问题也受到了重视,例如bernstein和federgruen研究了两阶段下,单个供应商和n个零售商在库存和产量/定价联合决策下的零售商利润最大化问题[12]。

(2)博弈论在供应链网络均衡中的应用

随着供应链成员的增加,供应链中“流”的复杂化,供应链由链状结构逐步发展成网络结构,而供应链网络的均衡问题也受到了越来越多学者的重视。

nagurney对由制造商、零售商以及市场组成的三层供应链建立了单一产品下需求确定的网络均衡模型,指出供应链网络均衡是其中的产品流、资金流等满足所有决策者的优化条件,即控制供应链网络的有限维变分不等式的解[11];dong在nagurney的研究基础上对单一产品的随机需求情况进行了研究,以三方各自追求利益最大化(非合作)为目标,建立了相应的供应链网络均衡模型[12];张铁柱对需求确定情况下的多产品供应链网络进行了均衡建模研究[13];藤春贤对多产品随机需求的供应链网络进行了均衡建模研究[14]。以上这些研究都是基于静态博弈进行的供应链上下游企业间的博弈问题研究,由于企业间的博弈随着时间的变化而不停变化,如何解决供应链企业间存在的动态博弈成为研究的下一个方向;此外,在供应链网络中,不仅仅存在上下游企业间的竞争与合作,不同供应链之间的核心企业之间也普遍存在竞争与合作。李春发假设需求受时间影响,针对单产品供应链网络进行了上下游企业间的动态博弈研究[15];黎继子针对不同供应链的核心企业间博弈进行了相应研究,但仅局限于同质产品的情况[16]。

2总结与趋势

博弈论在供应链管理中的广泛应用证明了博弈论在帮助解决供应链中存在的多种问题的有效性,包括库存决策、产品定价与产品数量、库存/定价/质量/广告等多决策问题,以及供应链成员间的竞争合作问题等,而且随着供应链网络的复杂化,也需要利用博弈论来解决相关网络均衡问题。

在当前研究中,nash均衡和stackeberg均衡常常作为解决非合作博弈的方法被广泛使用,而旁支付方法较多地运用于解决供应链成员间的合作问题,核、shaply值及核仁的运用相对较少;而且多数研究是针对供应链的静态博弈进行分析,而在现实的供应链网络运作中,企业更多是随着时间的推移和根据其他供应链成员的决策进行动态决策,因此如何将动态博弈理论应用于供应链管理研究也将是下一个研究热点。

参考文献:

[1] 杨荣基,彼得罗相,李颂志. 动态合作——尖端博弈论[m]. 北京:中国市场出版社,2007.

[2] leng, m. and m. parlar. game theoretical applications in supply chain management: a review[j]. infor,2005,43(3):187

-221.

[3] b.j lalonde. supply chain management: myth or reality?[j]. supply chain management review,1997(1):6-7.

[4]m. parlar. game theoretic analysis of the substitutable product inventory problem with ramdom demands[j]. naval research logistics, 1988(35):397-409.

[5] g.p. cachon, et al. competitive and cooperative inventory policies in a two-stage supply chain[j]. management science,1999,45(7):936.

[6] j.p. monahan. a quantity discount pricing model to increase vendor profits[j]. management science,1984(30):720-726.

[7] b. kohil and h. park. a cooperative game theory model of quantity discount[j]. management science,1989,35(6):693-707. [8] n. gans. customer loyalty and supplier quality competition[j]. management science, 2002,48(2):207-221.

[9] m.a. cohen and s. whang. competing in product and service: a product life-cycle model[j]. management science, 1997,43(4):535-545.

[10]d.j. reyniers and c.s. tapiero. the delivery and control of quality in supplier-producer contracts[j]. management science, 1995,41(10):1581-1589.

[11]nagurney a, dong j, zhang d. a supply chain network equilibrium model[j]. transportation research: part e, 2002(38):281-304.

[12]dong, j., d. zhang, et al.. multitiered supply chain networks: multicriteria decision—making under uncertainty[j]. annals of operations research,2005,135(1):155.

[13] 张铁柱,刘志勇,滕春贤. 多商品流供应链网络均衡模型的研究[j]. 系统工程理论与实践,2005,25(7):61-68.

[14] 滕春贤,潘晓东. 供应链网络均衡中的利润协调问题[j]. 哈尔滨工程大学学报,2007,28(7):818-821.

博弈理论论文篇8

【关键词】博弈论;非合作博弈;纳什均衡;应用

文章编号:ISSN1006―656X(2013)12-0043-01

一、博弈论的概述

博弈论(game theory),又称对策论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,也就是一些个人或组织,面对特定的环境条件,在一定的规则约束下,同时或先后,一次或多次,从各自的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

一个完整的博弈一般包含几个要素:参与者,行动,策略,结果,均衡等。参与者、行动和结果统称为博弈规则,博弈分析的目的是使用博弈规则来决定均衡。但是,博弈的行动不等同于博弈的策略,博弈的结果不等同于博弈的均衡。根据参与人的数量,可分为二人博弈和多人博弈;根据参与人是否合作,可分为合作博弈和非合作博弈;根据博弈结果的不同,可分为零和博弈、常和博弈和变和博弈。

博弈论对我们的经济生活有重要意义,人们之间决策行为相互影响的例子有很多:从国家角度出发,在国际贸易中合理运用博弈论可使本国和其他国家都受益,取得双赢效果;从个人角度出发,在生活中合理运用博弈论可使自己选择最优策略,减少不必要的成本开支。

二、非合作博弈――纳什均衡

非合作博弈是指不允许存在有约束力协议的博弈。完全信息静态博弈属于非合作博弈,该博弈中,每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念“纳什均衡”。

用表示一个博弈,如果有个博弈方,每个博弈方的全部可选策略的集合称为“策略空间”,用表示;表示博弈方的第个策略,其中可取有限个值(有限策略博弈),也可取无限个值(无限策略博弈);博弈方的得益用表示,是各博弈方策略的多元函数。个博弈方的博弈常写成。在博弈中,如果由各个博弈方的每一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略组合的最佳对策,即

,对任意都成立,则称为的一个“纳什均衡”。

纳什均衡的求解,常采用得益矩阵法。在囚徒困境中,每个参与者都能猜出对方策略,称该纳什均衡为纯策略纳什均衡。囚徒困境问题反映了非合作博弈的根本特征,体现了个人理性与集体理性的矛盾。两寡头企业选择产量的博弈就是囚徒困境问题在经济学上的应用。若两企业联合形成卡特尔,选择垄断利润最大化的产量,每个企业都能得到更多利润。但卡特尔协定不是纳什均衡,给定对方遵守协议,每个企业都有增加产量的冲动,最后每个企业只能得到纳什均衡产量的利润,它严格小于卡特尔产量下的利润。

在某类博弈中,每个理性人都不能猜出对方的策略,参与人是以一定的概率选择某种策略的,这样的策略称为混合策略,相应的均衡称为混合策略纳什均衡。纯策略是混合策略的特例。相关的例子有日常生活中的打扑克、划拳等。

三、治理河流污水排放的制度设计

环境保护,人人有责,限制企业的污水排放符合社会各界的呼声。检查和制止排污是政府的职责,对于以利润最大化为目标的企业,其一直采取各种措施尽可能降低生产成本。政府和企业间的关系可用经济学中的监督博弈来解释。

该博弈的参与者是政府和企业,政府的策略选择是检查或不检查,企业的策略选择是排污或不排污。假设是企业治理污水(不排污)增加的生产成本,若排污,为自己多得的收益。是政府检查所需成本。是政府对企业排污的罚款金额。是企业排污对社会利益的损害。假设且,即政府对排污企业采取重罚措施。对应不同策略组合的得益矩阵可见下表。

政府和企业的得益矩阵

在以上假设条件下,政府和企业都猜不出对方会采取何种策略,因而不存在纯策略纳什均衡,只能求解混合策略纳什均衡。如果假定条件不成立,通过劣策略剔除可得到占优策略,即(检查,不排污)或(不检查,排污)为占优均衡。

在得益矩阵中,用表示政府检查的概率,表示企业排污的概率。给定,政府检查和不检查的期望收益分别为:

由,得。即如果企业排污概率小于,政府的最优选择是不检查;如果大于,政府的最优选择是检查;如果等于,政府随机地选择检查或不检查。

政府的最终目标是降低企业排污概率并保护环境。据的结果,有两种措施:一是增大分母,即采取重罚措施,使企业平日不敢排污;二是减小分子,即降低检查成本。现阶段可行做法是设立举报电话,避免政府盲目检查,提高办事效率。

再者,给定,企业选择排污和不排污的期望收益分别为:

由得,即如果政府的检查概率小于,企业的最优选择是排污。现实中,政府对排污的惩罚越重,企业因排污获得的收益越低,企业的排污概率就越小。反之,企业的排污概率就越大。

企业因排污获得收益的大小,政府难以准确把握。前面谈到的企业都是以利润最大化为目标的企业,适于民营企业。现实中大多排污者是国有企业,这就涉及企业经营的控制权收益问题。企业因排污获得的生产成本降低部分可以很容易转化为企业经营者的控制权收益,这些收益包括奖金、福利或者因企业效益上升而带来的升迁机会。反过来,如果企业因为排污而受罚,经营者并没有控制权损失,因为罚款由企业出,经营者只是没有控制权收益而已。

四、小结

本文以纳什均衡为理论基础,分析了纯策略纳什均衡和混合策略纳什均衡在经济生活中的应用。但本文探讨的只是博弈论中一个很小的方面,对均衡问题中的子博弈精炼纳什均衡等没有涉及到,但它们的应用也很广泛。在日常经济生活中,小到购物时的讨价还价,大到企业间的竞争与合作、国家间的倾销与反倾销等,都可归结为博弈问题。

参考文献:

博弈理论论文篇9

关键词:数学建模;博弈论;静态

一、笛Ы模与博弈论

(一)数学建模

按通俗意义讲是通过生活中的实际问题建立相应的数学模型去解决各种问题,但数学建模并不是生活中所有解决问题方法的代名词,它是运用适当的数学理论以及工具找寻问题原型中的内在规律,建立一个数学方程或模型去解决求解并得到最优结果。数学建模理论中需要用到的基础学科例如图论、线性代数、概率与统计等等,这都是常见的数学学科。但在实际应用或比赛中,很多问题的综合性与抽象性使得数学这门理论学科在应用方面显得格外艰难,很多案例都不能具体直观的建立模型,特别是对于非数学专业的学生来说,他们只学过高等数学、概率论等基础理论,另外的运筹学与优化问题、泛函分析等专业数学知识并未涉及。另一方面,数学专业的学生对其他应用专业的认知和涉及也是非常浅的,即便数学专业理论知识很扎实,也不能很好的与其他学科结合应用,这样就造成了数学建模的短板,所以数学建模需要综合许多应用学科和专业型人才结合应用。近年来,越来越多的前沿科学与数学建模交叉应用,比如神经网络算法、小波分析、图像处理、博弈理论等等,这样数学建模才可以广泛被应用于各类生活问题中。

(二)博弈论

博弈论是由游戏规则理论演变而来的,在我们日常生活中随处可见的、等各种不同类型的游戏中,当然我们也可以将博弈论看作是一个游戏的原型理论,但不管是哪种形式的游戏都有一个相似之处,也就是游戏中参与者选择的策略方式,我们都知道在任何游戏中,计谋是最重要的,语气说游戏是看概率的大小或运气的好坏,还不如说是选择计谋的好坏。在许多军事策略和市场经济中,所谓的竞选和谈判都和游戏相似,都是需要依赖提前选好优化的策略和方式才可能有较好的结果。博弈论分为合作博弈与非合作博弈,在现代更多地方提到的是非合作博弈,并且合作博弈与非合作博弈是互斥的,二者只能存在其一,至于合作博弈与非合作博弈在本文中就不再详细作介绍。在非合作博弈中又分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。在任何一个博弈活动中,除了具备满足博弈过程的四个条件以外,还要具备能有利用数学建模等专业知识对其进行分析的先前条件。

二、博弈论在数学建模中的应用

在许多的数学建模问题中,虽然有不少设计博弈论的实际问题,但大部分都展示的不够直观,解题者不能从问题中清晰的了解其问题指向性,这就更加需要学生多学习数学建模与博弈论的相关理论。举一个数学建模中的经典实例:

问题提出:某人带狗、羊以及蔬菜渡河,一小船除需人划外,每次只能载一物过河.而人不在场时,狗要吃羊,羊要吃菜,问此人应如何过河?此问题可化为状态转移问题,用四维向量来表示状态,当一物在此岸时相应分量取为1,而在彼岸时则取为0,第一分量代表人,第二分量代表狗,第三分量代表羊,第四分量代表菜。根据题意,井不是所有状态都是可取的.通过穷举法列出来,可取状态是:

总共有十个可取状态.

模型求解:引入一个四维转移向量,用它来反映摆渡情况.用1表示过河,0表示未过河. 此状态只有四个允许转移向量:(1,0,0,0),(1,1,0,0),(1,0,1,0),(1,0,0,1)规定状态向量与转移向量之间的运算为0+0=1,1+0=1,0+1=1,1+1=0问题化为,由初始状态(1,1,1,1)出发,经过奇数次上述运算转移为状态(0,0,0,0)的转移过程。

则可得两种等优方案

这是一个重复的博弈问题,通过重复的博弈来说明在数学建模的过程中可供选择的方案是多样的,重点就在于选择最优的策略方案解决具体问题,运用博弈理论的建模案例有很多,本文就不一一详尽。总之,数学建模需要用到的专业知识太多,我们应该不断学习与进步。

参考文献:

博弈理论论文篇10

【关键词】博弈论;经济学;信息经济学

自80年代中期开始,博弈论的广泛应用促使经济学经历了一次巨大变革,而且,目前这场变革还在加速进行。博弈论是数学的一个分支,1951年纳什的文章和1953年夏普里的文章都是发表在数学杂志上。但博弈论作为一种研究方法,在经济学上的应用却最为广泛成功。经济学是研究资源如何有效配置以达到或实现既定目标的一门学科。但从现代经济学的发展来看,这种观点将被另一观点所取代:经济学是研究人的行为,即研究理性人的行为。博弈论在短短10余年对经济学产生的如此深刻的影响是史无前例的。近年来,博弈论的思想和建模方法已渗透到了几乎所有的经济分析领域。而影响最大的便是微观经济学,甚至可以说成为微观经济学的基础

80年代以后博弈论迅速地成为微观经济学的基础。其原因在于它建立起了一个内容丰富、体系健全、逻辑合理和更加贴近现实的经济学分析体系。博弈论不但强化了经济分析的深度,而且拓宽了经济分析的广度,从而不但使经济分析以更加符合现实的方式揭示经济活动的内在规律,而且也使信息经济学得以迅速发展。

博弈论在经济学中的应用深深地影响了经济学家的思维方式,成为经济学家的必备分析工具之一,多位博弈论专家也因对博弈论的贡献获得了诺贝尔经济学奖,博弈论获得了经济学的中心地位,成为微观经济学的基础。博弈论在经济学中熠熠生辉,引人注目。

博弈论在经济学中的应用十分广泛,如寡占理论、产业组织理论,并形成了经济学新的分支――信息经济学。1994年诺贝尔经济学奖授予了对博弈论做出开拓性的三位博弈论专家纳什、泽尔腾和海萨尼。相隔十年,2005年诺贝尔经济学奖再度授予在博弈论领域做出杰出贡献的两位专家――托马斯・谢林(Thomas C.Schelling)和罗伯特・奥曼(Robert J.Aumann)。博弈论广泛而深刻地改变了经济学家的思维方式,为研究各种经济现象开拓了新视野,博弈论成为微观经济学的基础,取得了主流经济学的中心地位。

博弈论之所以被经济学家普遍使用,是与传统经济学的缺陷和经济学自身发展的要求分不开的。传统经济学在谈到人(或其他经济主体)的决策时,往往是假定在其它条件不变的条件下最大化自己的效用,个人的效用也只决定于自己的选择,其他所有人的行为都归结在价格这个参数中;市场是充分竞争的,垄断和寡头是特殊情况;信息是充分和对称的。然而现实中这些条件都是很难成立的。第一,充分竞争的市场是很少有的(例如,国内具有一定规模的钢铁生产厂家屈指可数,占据一定市场份额的彩电生产厂家也为数不多),由于存在产品差异、地域差异和信息差异,任何一个厂商总是处于某种垄断地位(正是这样他们才有利可图),所以与充分竞争相比,垄断和寡头倒很常见;第二,每一主体在做出自己的选择时不仅要受到其他主体的影响,而且自己的选择也往往影响到其他主体的选择(考虑一下1998年长虹大规模吸纳彩管的情形);第三,在市场竞争中信息几乎总是不充分、非对称的,获取信息经常是有成本的,有时成本还是相当大的。如果不考虑以上这几方面因素,经济学所讨论的决策其实仅仅是规划问题,是在没有竞争对手时的决策,所解决的也只是资源分配问题。现实世界中决策者要在面对有智能和充分理性的对手与之激烈竞争时做出选择。在竞争对手日益明显、竞争越来越直接的情况下,博弈论为经济学研究提供了一种不可替代的工具。另外,经济学现在已经越来越重视对经济个体的研究,而在各个经济个体之间,博弈是无时无处不在的。

博弈能够融入主流经济学,为主流经济学家所接受,主要有两方面原因:一是博弈论分析范式与新古典经济学不谋而合;二是博弈论符合了新古典经济学的科学化趋势。

1.分析范式的趋同。即强调个人理性,也就是在给定的约束条件下经济利益主体各自追求效用最大化,最终达到一种稳定状态,实现均衡。可以说博弈论与新古典经济学的关键链接就是理性人的假设。任何一门学科都有一套有别于其他学科的独特体系,而经济学不同于物理、化学等学科就在有它的理性人假设。对此,经济学家张五常曾举过一个很有趣的例子:如果我把一张百元钞票放到游行人的街道上,没有风吹,也没有警察,我敢打赌,这张钞票会不翼而飞,在人类发明的所有科学中,只有经济学可以推断,可以解释。整个新古典经济学理论的大厦便基于这样一个假设之上,即人类在其经济选择行为中是绝对理性的。这个假设意味着,每个人的所有行为,都是在局限条件约束下争取最大化报酬。消费者根据自己的偏好和市场既定价格,在收入约束下最大化自己的效用;厂商根据外生的价格水平选择利润最大化产量。各经济行为主体的趋利行为通过竞争,最终达到稳定状态,实现均衡,这包括从单个市场的局部均衡到所有市场的一般均衡。而博弈论研究范式是给出个人的支付函数及战略空间,然后看当事人都选择其最优战略以最大化个人支付函数时将发生什么,这与经济学效用最大化的方式完全吻合。博弈论从行为分析入手,坚持并突出了个人理性在经济分析中的重要作用。不论冯・诺依曼和摩根斯坦因的“最小最大解”,还是后来的“纳什均衡”及其精炼,都是以个人理性为基础的,并对理性人的行为进行了深刻的剖析,揭示了理性人行为背后心理作用的过程,加深了对个人理性的信念。博弈论通过研究拥有不同利益的主体在发生冲突时是如何进行理性决策的,并研究利益冲突的主体如何通过理性决策最终达到均衡,从纳什均衡到精炼纳什均衡再到贝叶斯纳什均衡和精炼贝叶斯均衡,博弈均衡概念的创立、精炼和完善及模型界的存在、性质与应用的研究是现代博弈论的主要内容。正是由于分析范式的趋同,经济学家很容易用博弈论工具对经济问题进行研究,使博弈论在经济学有着广泛的应用领域。

2.符合了新古典经济学的科学化趋势。对于经济学是否是一门科学这一话题,历来争论不休,本文作者也不想就此展开论述,但有一点是可以肯定的,即西方学者一直致力于将数学、物理学等精密科学的分析方法应用于经济学,试图使经济学变成一门科学,他们把现有制度视为外在,只研究可以纯粹用目的和手段来刻画和判断的人类理,强调将复杂社会现象简约成某种可以向物理学那样可以准确把握的东西进行研究,试图将经济学变成一门科学。因此,经济学的分析和论证尽量仿效精密科学尤其是数学和物理学的做法,在研究方法上,除了无法回避的规范分析之外,主要是实证分析,大量采用了数学方法。作为一种数学方法的博弈论,其创立之初就是为了是对经济行为的分析更加精密、科学,《博弈论与经济行为》本身就是用深奥的数学理论写成的,对博弈论发展起过奠基作用的论文最初都是发表在数学杂志上。运用博弈论分析工具对存在利益冲突的理性人的选择行为进行定量分析,可以使经济学向科学化目标迈出一大步。

自从将博弈论引入经济学以后,经济学改变了传统经济分析地那种以个人孤立决策,其他经济活动者的行为影响则被典型地简化为价格信号为基础的分析方法,而侧重于经济活动中多个利益主体的行为所产生的相互作用和影响的分析,从而使经济分析更能反应经济系统的本质。

参考文献

[1]张维迎.博弈论与信息经济学[M].上海:上海三联书店,上海人民出版社,1996.

[2]谢识予.经济博弈论[M].复旦大学出版社.

[3]彭建刚.博弈论与西方经济学的发展[J].经济动态,1998(5).