博弈论范文10篇

时间:2023-04-07 01:22:54

博弈论范文篇1

博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。

2.博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述

G={P,A,S,I,U}

P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。

A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。

S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。

I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。

U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。

还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。

文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。

4.4基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。

博弈论范文篇2

博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。

2.博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述

G={P,A,S,I,U}

P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。

A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。

S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。

I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。

U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。

还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。

文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。

4.4基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。

博弈论范文篇3

[关键词]博弈论;通识教育;教学改革

党的报告指出,要优先发展教育事业。建设教育强国是中华民族伟大复兴的基础工程,必须把国家的教育事业放在优先发展的位置。同时对于高校通识课程的改革与发展是完善高等教育的重要一环,是进一步实现教育现代化的必要发展路径。本文在通识教育的大背景下探索博弈论课程的教学改革与发展。博弈论对于人类行为的研究大多集中在应用决策与抽象分析研究等相关领域,近年来博弈论在社会科学实践中的成功应用使其成为了学术界研究的重点内容,各个高校也逐渐将博弈论作为重要的通识类课程。目前国内博弈论课程开设时间不是很长,在教学过程中存在理论教学过多,实践应用较少等问题。因此,在通识教育的背景下,对当今博弈论课程的教学思路与方法进行探讨,提出博弈论教学过程中存在的问题,在此基础上结合博弈论教学特点进行教学改革,对于培养学生的综合素质与学术应用能力具有重要作用。

一、博弈论课程的学科特点

(一)学科内容繁杂,授课难度大。博弈论是研究社会个体之间相互决策与抽象分析行为动机的学科,以经济学为理论基础分析个体在决策时的动机,并利用数学模型进行描述与推演,最终得出博弈结果并应用到现实,属于经济学与数学交叉产生的较为重要的学科。1944年美国数学家JohnvonNeumann与OskarMor-genstern合著的《博弈论与经济行为》一书的出版,是博弈论的基本理论与方法论产生的开始,也使博弈论作为一门重要的学科活跃在学术界。20世纪以来,政治学、国际关系学(特别在二战时期广泛应用博弈论)与进化生物学等都大量引用博弈论的研究方法。20世纪70年代中期之前,博弈论主要还是作为数学的一个分支,现在,博弈理论已大量应用到经济学领域,逐渐发展成为主流经济学的重要组成部分,也正成为社会科学研究的一种核心工具,被各门学科所应用。而博弈论的学科体系较为复杂,与传统经济学和数学相比,博弈论在两者的基础上又融合了心理学、统计学、运筹学与情报学等多门学科,学科系统宽泛,内容较为繁杂。这也使国内的博弈论教材在编写过程中存在较多的分歧,同时由于其内容的繁杂性,博弈论的教学涉及到大量的图表,数理模型与专业用语,这为通识教育博弈论课程的教学带来了较大的困难,相比其他通识类课程,博弈论教学内容复杂,学科体系庞大,对于授课教师的专业水平与授课能力要求较高,授课难度较大。(二)课程理论性强,实践要求高。博弈论课程中的不确定性分析、市场分析与委托分析等需要经济学理论作为支撑,并在此基础上抽象为数学模型进行应用,因此博弈论课程的教学要求学生有一定的经济学基础和数学功底。对于经济学理论基础的理解,并与博弈论数理模型推演的不同纳什均衡结果相结合,最终学会将现实中的经济问题抽象为博弈论模型进行求解是这门课的教学目标。因此博弈论课程教学涉及到大量的理论阐述,需要具备一定的经济学功底。同时博弈论课程与现代信息技术联系较为紧密,因此在理论性较强的同时,教学也要注重实践性。在引导学生扎实学习经济学理论基础的同时,注重理论运用到现实的实践能力培养,将理论运用到现实中解决具体问题。而传统的博弈论课程教学,缺乏教师与学生的互动,大多采用灌输式的教学方法,学生学习课程的效率较低,教师的教学成果也难以得到改进和提高。

二、现行博弈论课程存在的问题

(一)理论教学枯燥,缺乏应用性。博弈论的学习在经济理论的基础上需要运用大量的数理模型进行分析推演,与其他经济学课程相比,对于学生数学功底的要求较高,这使很多学生在学习过程中将博弈论作为数理课程学习。但博弈论的教学目的是让学生在面临现实的经济问题时可以抽象建立博弈模型,提高学生对于经济现象的理解与分析解决现实中经济学相关问题的能力,因此博弈论课程教学对于经济学理论学习与实践性应用性要求很高。在当今高校的博弈论教学过程中,更为注重理论教学,更为强调博弈论学习过程中需要用到的数学思想与经济学理论,忽视了博弈论教学过程中的实践性与应用性。当今博弈论教学采用灌输式的理论教学法,课堂教学缺乏应用性与趣味性,使博弈论的课程教学艰涩难懂,学生容易失去学习兴趣。(二)选课学生学习基础差异大。博弈论作为基础通识课程面向的对象是整个高校的学生,选修该课程的学生涵盖各个专业,学生学习博弈论的基础存在较大差异,学习博弈论课程的目的也不尽相同。同时博弈论学习虽然是以经济学为理论基础,但建立模型最终需要数学方法和思想进行定量,这对于学生的经济学基础与数学基础要求较高,但选课的学生专业跨度与学习基础都差异较大,部分专业学生在学习过程中会感到抽象难懂,授课内容也与学生原本的专业背景脱节,在学习过程中无法将博弈论应用到实践当中去,解决专业的难题。这使博弈论这门课程作为通识选修,教师在授课时难度加大。(三)课时少,选课人数多。博弈论是经济学与数学的交叉学科,除经管类部分专业作为必修课之外,大部分的高校通常将博弈论作为一门通识课程开放,学生可自由选择。选课学生多为经管类专业与信息技术管理专业的学生,学生总量较大,但作为选修课课时量较少,同时作为选修课的学生存在基础较弱,学习兴趣不足,学习自主性不高的情况,需要教师合理的引导,提高教学内容的趣味性,克服因为课时少,人数多带来的教学困难。(四)缺乏实践教学,重视不足。与基础理论课程不同,博弈论课程的教学有很强的实践与现实应用性。理论基础与实践应用应达到紧密结合的程度,在教学过程中教师应结合现实案例,并让学生作为“博弈人”参与到案例分析中,提升博弈论教学的趣味性,并实现实践教学。然而,部分教师在博弈论授课过程中,教学内容仍旧以理论教学为主,并不重视实验与案例分析,严重缺乏实践教学,这样即使学生掌握了理论模型,也缺乏将博弈论应用到实践中的能力,将导致博弈论课程学习的理论与实践脱节。

三、通识教育对博弈论课程提出的新要求

博弈论为经济管理类专业的核心课程,对学生专业课方面的培养与思维拓展具有积极作用,逐渐成为经济与管理类以及其他专业的重要通识课程,但作为通识教育背景下博弈论课程的开设,其教学体系仍未发展成熟。因此,通识教育对博弈论课程的教学提出了新的要求:(一)对教学主体提出的新要求。当今教学系统较为复杂,包括教师、学生与教学内容等诸多因素,教学质量的高低是多种因素共同作用的结果。相比其他通识类课程,博弈论的课程教学要求较高,其理论与实践应用性都较强,且内容繁杂,较为抽象。因此,教师应具有扎实的经济学功底和一定的数学基础,有强大的课堂调度和逻辑梳理能力,使枯燥和困难的课堂教学工作变得生动有趣。博弈论课程的知识覆盖面较广,对数学基础要求较高,这对于经管类和其他专业的学生在缺乏理论基础和数学基础知识的情况下有一定的接受难度。(二)对教学客体提出的新要求。博弈论教学内容主要包括教学大纲,课件、教材等。而博弈论课程教学在专业课领域与通识课程方面的要求不同,博弈论专业课教学要求专业能力与学术能力的培养,教学强度较大,教学要求精深,而博弈论作为通识课程的教学要求相对宽泛,要求学生学习博弈思维并学会在实践中应用博弈论即可,课程教材需要去除较为艰深的部分,强调宽泛性与实践性。因此,博弈论课程的教学目标面临着一个如何选择专业性和全面性之间平衡的问题。(三)对教学方式提出的新要求。在通识教育背景下,博弈论课程的教学目标不是培养经济管理人才的专业技能,而是专注于众多专业学生相对广泛的基础知识和综合素质培养。博弈论的经济学基础与数理模型的建立都需在现实中得到实践,才能实现博弈论通识课程的教学目标。当前的博弈论课程教学缺乏实践教学意识与设施,因此博弈论作为通识课程的教学应摒弃传统的博弈论教学模式,运用实践性与多样性的教学手段,对于教师的教学方式提出新的要求。

四、通识教育背景下博弈论课程的改革路径

(一)丰富理论教学,拓展案例分析。在完整阐述博弈论理论的基础上,完善并丰富博弈论教学内容,关注博弈论的学术发展与学术前沿动态,在博弈论通识教育过程中引入部分博弈论学术前沿内容,让学生充分了解学科发展动态,培养学生学科兴趣。在理论教学时引入丰富的案例,例如囚徒困境、智猪博弈等经典案例,在介绍案例的同时联系生活或者专业领域的热点问题,使学生更为准确的理解博弈模型的内涵。同时对于教学案例的选择要注重几点准则。首先案例的选择不应过于繁杂,案例教学的目的是为了使学生更深入的理解博弈模型,过于繁杂的案例会转移学生的注意力,因此案例的选择应简单易懂。其次,博弈论教学案例要与当前的理论教学紧密结合,符合当前的教学目标,具有实践性与针对性。最后,案例选择要多样化,博弈论广泛应用于各个学科,因此在选择案例时不应局限在经济学领域,而应涉及各个学科,对于学科差异较大的通识课程来说,来源广泛的案例教学更容易引起学生的学习兴趣与学习热情。(二)改进教学模式与当地经济环境相适应。博弈论在教学过程中可注重联系当地的经济环境,发展适应当地经济环境的教学培养模式。高校的教学培养应具备与当地经济发展环境相适的特征,因此在博弈论通识教育的培养过程中也应重视与当地经济发展相适应的实践教学。具有地方经济社会特色的现实环境为博弈论实践教学提供了真实和便利的经济、产业、人文环境,并且围绕地区特殊的经济环境,学生可以根据当地具体的经济问题自主建立博弈模型并提出相应的对策建议,将博弈论中的理论与实践有效结合。同时这种带有当地特色的博弈论实践教学模式会引起学生较高的学习热情,实现较好的授课效果,圆满完成教学目标。(三)进一步强化实践教学。博弈论通识课程培养中,实践教学是较为重要的一环,对于学生综合素质与学以致用能力的培养有重要意义。博弈论的传统教学模式是教师以经济学与数学的理论灌输为主,缺乏与学生的互动联系,建议在学习的主要形式中增加链接交互式教学。而高校学生需要锻炼学以致用的能力与实际中运用博弈论知识解决问题的能力。在课堂教学过程中,教师可以介绍一些博弈论基本概念和模型,让学生寻找生活中的例子来说明对理论模型的理解,并利用模型解决现实中的问题。通过这种方法,学生可以深入理解博弈的精髓和博弈分析的方法,增强自主学习的能力,为今后的进一步学习奠定基础。

五、结语

近年来,随着博弈论研究在社会科学多个领域的不断深入与成功应用,大学教育对博弈论知识的需求日益高涨。传统的教学模式对于博弈论这种内容庞杂,基础要求较高的学科来说,很难启发学生的自我思考,更难将所听到的知识转化为自己可运用的知识,教学效果不佳。本文针对通识教育背景下博弈论课程教学所存在的问题,提出了丰富理论教学,拓展案例分析、改进教学模式与当地经济环境相适应、进一步强化实践教学等对策建议,使学生提高博弈论学习的热情与自主学习能力,从而达到提高博弈论教学效果的目标。

[参考文献]

[1]谢识予.经济博弈论[M].上海:复旦大学出版社,1999.

[2]相里静.财经类博弈论课程启发式教学模式研究[J].内蒙古财经大学学报,2018(16).

[3]浦徐进.本科博弈论教学过程中的案例运用[J].江南大学学报(教育科学版),2009(4).

[4]李太龙.博弈论公选课的教学内容与方法探析[J].教育探索,2012(1).

[5]李稚,周炜智.管理专业本科《博弈论》课程教学改革探讨[J].教育教学论坛,2016(3).

博弈论范文篇4

关键词:刑事和解;博弈论;斗鸡博弈

一、刑事和解:利益兼得的正和博弈

从经济学的角度看,犯罪是一种外部不经济的行为。根据科斯定理,外部不经济可由争议当事人通过谈判方式来解决。随着人类文明程度的不断提高尤其是人权观念的深入,越来越多的国家认识到刑罚最重要的目的是让罪犯复归社会以及国家惩罚犯罪并非刑罚的唯一方式,相反,犯罪更多地被看成是因加害人对被害人的侵害而导致的一种人际的紧张与冲突,从而被害人或被害方享有解决此紧张与冲突的主导权。由此,刑事和解便应运而生。刑事和解指的是这样一种新型的刑事纠纷解决方式:在刑事诉讼中,在司法人员调停、监督下,犯罪方以自愿认罪、赔偿、赔礼道歉等形式与被害人达成和解后,国家司法机关不再追究其刑事责任、免除处罚或者从轻处罚。由此,不难看出,刑事和解的目的是恢复犯罪方破坏的社会秩序与犯罪方与受害人的社会关系以及促使犯罪方复归社会。进一步,刑事和解是在国家、被害方和犯罪方共同合作下出现的共赢结果。表面地看,传统刑事诉讼活动表征为在以国家与犯罪方的互动关系的基础上,通过冲突各方在对抗式互动达至利益的平衡,实质上,则是一种零和博弈。这是因为,零和博弈中一个博弈方偏好的结果是另一个博弈方偏好的结果,博弈方的互动是种对抗式的互动。在零和博弈中,博弈方之间的利益关系是对立的,博弈方的基本关系也是对抗关系,因而博弈结果不可能出现大家分得或满意的一份,从而博弈方之间无法和平共处。

据此可以判定,刑事和解尽管也是一种博弈,但出现的共赢结果显示其不可能是表征为零和博弈的传统刑事诉讼活动之产物。也就是说,“刑事和解在传统的对抗性司法的正义观之外,创造了一个全新的基于合作的正义观。以这种合作的正义观为指导,社会各方实现了互利与共赢。”既然刑事和解是在合作的正义观为指导下社会各方实现互利与共赢的博弈,那么此种博弈是种正和博弈,因为在正和博弈中,存在出现博弈方满意的结果或者存在社会总得益大小方面的差异,从而博弈方比较容易相互妥协和合作。既然刑事和解是种利益兼得的正和博弈,那么从理论上讲我们主要关注的问题无非有两个:一是,如何构建本土化的刑事和解制度;二是,如何在司法实践中促使刑事和解的达成。我国于2011年第十一届全国人民代表大会第五次会议通过的刑事诉讼法修正案第五篇特别程序中增加“当事人和解的公诉案件诉讼程序”一章。也就是说,我国已经确立了刑事和解制度。

于是,我们当前所要关注的问题就是如何在司法实践中促使刑事和解的达成。前面已指出,刑事和解制度是种利益兼得的正和博弈。由此,本文从博弈论的视角来探讨如何在司法实践中促使刑事和解的达成。“促使刑事和解的达成”的潜台词是国家运用相应的策略促使被害方与犯罪方由拒绝刑事和解走向接受刑事和解以及被害方与犯罪方共同努力达成刑事和解。“关于非合作博弈的研究表面上是描述合作的规律,更深的目标是寻找合作之路”。据此,博弈论在刑事和解司法中的应用包含了两个主题:一是对刑事和解过程中主体的动态行为选择研究;二是在研究的基础上寻找合作之路。

二、斗鸡博弈与刑事和解过程中主体的动态行为选择

法律从来都是服从于社会的内在要求而不是社会的内在要求服从法律。既然事实的真相是犯罪方与被害方以及他们生活的区域之间存在众多的共同利益甚至彼此是相互依存的,那么对刑事和解过程中主体的动态行为选择分析实际上就是寻求一个双赢的结果即他们的共同利益。寻求双赢的结果必然离不开博弈论,而恰当地用不同类型的博弈模型来解释不同问题是一条有效的解构路径。

下面运用斗鸡博弈来对刑事和解过程中主体的动态行为选择做具体分析。斗鸡博弈的内容大致是这样的:两个参与人相遇在一个独木桥上,每个人都有两种策略:继续前进,或让对方先过。如果两个人都选择T(T表示“强硬”),则他们在独木桥的中央顶牛,结果两败俱伤,从而每个人的得益是-1;如果两个人都选择W(W表示“软弱”),则他们等待而谁都没有通过独木桥,从而每个人的得益是0;如果一个参与人选择T而另一个选择W,那么强硬的参与人先通过,得益是2,软弱的参与人后通过,得益是1。经计算的,混合策略是(12;12),即参与人1和参与人2均以概率12采取T策略。斗鸡博弈中的一个重要的问题是,究竟哪一方采取W策略,因为采取W策略比两败俱伤好;若每一方都寄希望于对方采取W策略,两败俱伤的结局也可能出现。

此外,在混合策略均衡情况下,两败俱伤的结局同样也可能出现。具体到刑事和解,被害方与犯罪方因为没有谁采取支持刑事和解策略而导致两败俱伤的结局出现。需要注意,这里所说的两败俱伤指的是这两种情形:一是没有谁先采取支持刑事和解策略而案件进入诉讼程序的情形,二是案件进入诉讼程序后犯罪方和被害方认识到刑事和解对双方都有利但没法进行刑事和解的情形。在司法实践中,凡是能够适用刑事和解程序的案件都应当极力促成犯罪方与被害方达成和解。人们所作出的一切行为都会以实现其利益最大化为标准和参照对面临的各种策略选择进行成本—收益式的考量。犯罪方与被害方亦是如此。

因此,尽管刑事和解是一种双赢的结局,对犯罪方与被害方均是利益兼得的结果,但因为彼此或一方对于各种策略选择的考量导致起初没有谁支持刑事和解或者一方支持而另一方不支持刑事和解的情景的出现。这些情景一旦出现,犯罪方与被害方之间的博弈便陷入了斗鸡博弈中两败俱伤的结局。新制度经济学研究表明,法律是影响人们为其偏好所支付成本的一种但不是唯一的重要变量。也就是说,法律可以通过影响人们为其偏好所支付的成本来引出法律所期待的偏好类型。刑事和解在本质上是种谈判活动,谈判能否成否首先要看是否存在议价区间。

因而,要想避免犯罪方与被害方之间的博弈陷入斗鸡博弈两败俱伤的结局之中,在司法实践中应当创造性利用法律的规定,运用扩展式博弈向犯罪方与被害方分析选择和解还是诉讼更能满足其心理预期,并且提供和解的议价区间供当事人参考,从而达至犯罪方与被害方之合作目的。至于如何运用扩展式博弈向犯罪方与被害方分析选择和解还是诉讼更能满足其心理预期以及提供和解的议价区间以下进一步分析。

三、合作之路:博弈论在刑事和解议价区间的

运用《史记•货殖列传》中有言:“天下熙熙,皆为利来;天下攘攘,皆为利往”。在多人社会之中,“利益只有在结成的社会关系中才能得到实现和满足”,而每个人所追求的利益常常因为种种原因而发生冲突。正因如此,人们在追求自身利益最大化时需要相互合作,但合作中又存在着冲突是一种社会常态。人们为了达到合作和解决冲突,在面临给定的约束条件选择能够实现自身利益最大化的策略。这是因为,不同的策略能够导致不同的结果,而结果的好坏不仅取决于自身的策略选择,还取决于其他参加者的策略选择,简言之,策略的选择同利益有相互依存性。今天“没能充分利用博弈理论是不幸的”。因此,要想利用博弈论分析刑事和解的议价区间首先要清楚有多少种可选择的策略以及各种策略选择的得益。不同内容的刑事和解能供犯罪方与被害方选择的策略及其得益不尽相同,然而对不同内容的刑事和解逐一分析不现实也没有必要。

我们可以从个案入手进行分析。【案例】某村民甲与乙因为宅基地边界纠纷发生械斗,经权威机构的鉴定,甲和乙都是轻伤。尽管鉴定都是轻伤,但乙认为自己伤得比较重,而甲也认为自己的伤势比鉴定的要重很多。该案件后被法院立案。此案件和与此类似案件在现实中比较常见,最后会出现的结局有这样几种:(1)乙向甲提出和解,甲接受;(2)乙向甲提出和解,甲拒绝;(3)双方都选择由法院判决。为了分析的方便,我们假设甲在追究阶段支付的律师费用是e,应诉成本(主要是准备诉讼所付出的时间和精力等)是d。乙在追究阶段支付的律师费用是c,诉讼成本是k,胜诉的概率是l,胜诉获得的赔偿是p,答应和解可获得的赔偿是m。经计算可得到,乙和甲之间存在一个和解的空间(c,lp+d),且甲提出的m上限受胜诉的概率、胜诉后获得的赔偿、准备诉讼所付出的时间和精力与律师费用等因素的影响。根据国家的诉讼收费标准和诉讼经验,司法人员与律师可以估算出前述那些变量的值,从而帮助或促使双方当事人接受和进行和解。由此,刑事和解就是司法人员和律师充分利用其诉讼经验对胜诉的概率、胜诉后实际获得的赔偿、准备诉讼所付出的时间和精力与律师费用等因素进行估值,引导当事人心理预期朝刑事和解的均衡点方向发展,最终让当事人接受和进行刑事和解。于是,司法人员和律师在进行刑事和解所要做的工作是对胜诉的概率、胜诉后实际获得的赔偿、准备诉讼所付出的时间和精力与律师费用等因素进行估值。

对胜诉的概率、胜诉后获得的赔偿、准备诉讼所付出的时间和精力与律师费用等因素进行估值,我们认为可以建立类型案件诉讼的统计一览表。此表的制作需要法院、检察院和律师协会甚至律师的通力合作。具体而言,法院的工作是统计与提供各类型案件的被害方胜诉率、胜诉后获得的赔偿金额、诉讼了结的耗时等;检察院的工作是统计与提供被害方支出的交通费、误工费与住宿费等;律师协会甚至律师的工作是统计与提供被告方支出的律师费、交通费、误工费、住宿费等。其中被害方胜诉率和被害方胜诉后获得的赔偿,法院分别通过对某一年度(法院统计的惯例以年为单位)各类型案件被害方胜诉情况与实际获得损害赔偿情况统计得出;交通费、误工费和住宿费主要计算方法是案件了结的开庭次数分别乘上当事人及其人或律师的往返次数、工作日与请假扣除的工资之积与在外住宿日与本地每日住宿平均价格之积。最后,强调一点,各项数据必须真实可信。因为建立类型案件诉讼成本的目的是能够促使刑事和解是被害方与犯罪方占优策略选择之纳什均衡出现。

要做到数据真实可信就必须详细说明各项数据得出的原始数据的出处与各项数据得出的计算方法。如果可能应当附上能证明原始数据是真实可信的相应文件。

参考文献:

[1]沈海平.寻求有效率的惩罚[D].北京大学2008年博士论文:312.

[2]赵汀阳.博弈问题的哲学分析[J].读书,2003(2):77.

[3]王春业,聂佳龙.论博弈语境下法的生成[J].甘肃理论学刊,2011(4):140.

[4]王春业、聂佳龙.外部不经济理论视角下的权利冲突分析[J].湖南师范大学社会科学学报,2012(1):48.

博弈论范文篇5

站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。

纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现———非合作博弈的均衡,即“纳什均衡”并不是一帆风顺的。

1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(OskarMorgenstern),并与其合作才使博弈论进入经济学的广阔领域。

1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈———“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimaxsolution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。

1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。

纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

囚犯的两难处境

大理论中的小故事

要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。

博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

价格战博弈:

现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对博弈论(vivalrygame)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

污染博弈:

假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。

博弈论范文篇6

[摘要]随着我国保险业的迅速发展和网络的普及,网上保险业务作为一种新兴的交易方式越来越受到人们的关注。如何认识和发展网上保险业务,成为当前的一个热点问题之一。本文借用了博弈论的分析手段,分析了网上保险能够顺利开展的必要条件,并对如何发展网上保险,提出自己的意见与建议。

[关键词]网上保险博弈论得益措施

在现代社会经济科技高速发展的大背景下,互联网已融入社会的各个领域当中,给人们的生活与工作带来了极大的便捷。与此同时,人们对网络的依赖也越来越强烈,基于互联网、电话等通信网络的电子商务,正在不知不觉中改变着人们的生活状态和生活方式。作为新型购物方式与时尚生活方式之一的网上购物,也正随着互联网的普及而发展,成为计算机世界中又一重要领域,受到了包括经济学家和社会学家在内的广大学者,以及社会不同群体的关注。

网上保险交易作为网上购物的一种,在这个网络浪潮中也受到了越来越多人们的关注,但与一般的网络购物性质不同,网上保险交易的实质是无形的,实现的是资金的流动。因此它比一般的网络交易具有更大的不可测性与管理难度。下面从博弈论的角度出发,分析网上保险交易发展的利弊。

一、网上保险交易的博弈论分析

考虑到网上保险交易时间上的特性,本人认为相较之于静态博弈,动态博弈更能体现出网上保险交易的特点。因此本文这里选用了一个博弈树的动态博弈结构来分析保险公司开展的网上交易。

在这个博弈中,我们有两个参与方,即经营网上保险业务的保险公司与网上投保人,为了给他们的行为有个合理的解释,我们采用经济学里的经济人的解释。即他们的行为都符合他们自己的利益最大化。另外我们还假设两个参与方的行为具有独立性,即一个参与方的行为与决策是完全独立的,不受另一方的束缚。

在博弈过程中,我们假设博弈参与双方对信息和博弈过程均是了解的,不存在信息不对称的情况,因此这是一个完全且完美信息的动态博弈。

有了以上假设,我们可以开始我们的博弈分析。

保险公司与投保人网上交易博弈的博弈树描绘如下:

在这个博弈树中,顶上第一个白圈表示的是投保人在第一阶段的行为,在这里,投保人作为选择的第一顺序人。可以选择是否通过网上进行保险的交易,如果选择是,则博弈进入第二阶段;如果选择否,则双方的得益为A(0,0),均为0,既没有损失也没有得益。(当然这是一个简化的描述,保险公司的网上开办费与两管理费等成本被省略了)

在第二阶段,黑圈表示保险公司在第二阶段的决策。保险公司接受了投保人的投保,这时他开始作为博弈的主体进行选择,在这阶段,他可以有两种经营方式,一种是有差错的经营方式(这里所指的“差错”既包括保险公司内部经营的种种不规范,也包括保险公司网络外部管理的无力与缺陷),一种是规范的经营方式,即能通过有效监督使得网上保险交易能够顺利进行,投保人的权益能够得到保障。保险公司的两种经营状态将导致B和C两种得益情况的出现。

在得益B(-a,b)中,投保人获得的得益为-a,之所以为负数是因为保险公司的差错经营方式,往往会对投保人造成信息外泄、退保金被人冒领等等的意外损失。而保险公司仍然可以获得投保人缴来的保费b。

在得益C(c,d)中,投保人在保险公司通过规范的经营管理的状态下获得了自己的理想投保得益结果c,而保险公司的经营得益为d。

让我们来对博弈的结果做一个简单分析,很明显,投保人的得益依赖于保险公司的不同经营状态,在投保人能够有效预知得益结果的情况下,他会在保险公司选择差错经营时选择不投保,因为投保会给他带来负得益;而当保险公司规范经营时,投保人会选择投保,达到他购买保险的理想状态。因此在这个博弈的第二阶段,保险公司的经营状态对投保人起到决定作用。但要保险公司选择得益C而不是得益B,则需要保险公司在得益C下的结果d大于得益B下的结果b,这样保险公司才有动力去选择得益C。

但从实际出发分析,我们了解:如果没有有效地对保险公司网上经营情况的监管,而投保人又不能对保险公司的行为做出约束(出自我们的独立性假设),则保险公司的得益C下的结果d往往和得益B下的结果b没有区别。甚至由于规范经营要付出更多的经营成本,很有可能出现得益d要小于b的情况。在这种情况下保险公司出于经济人的思维自然会毫不犹豫选择得益B,而投保人在预见到保险公司在第二阶段选择得益B自己获得负得益的结果后,选择在第一阶段不投保。于是博弈在第一阶段即告结束,网上保险开办失败。

幸运的是,我们博弈可以从两方面进行修正。一是投保人可以对保险公司的行为进行约束,只要放松我们的独立性假设,从而使得单次博弈的结果中第二阶段保险公司的得益C的结果d大于得益B下的结果b(投保人可以通过投诉、联合抵制等手段促成上述的结果),在这样的情况下,保险公司出于经济人的目的自然会选择得益C;二是我们可以进行重复博弈。很明显,重复博弈需要保险公司与投保人之间的长期关系。而刚才的博弈树分析显然是“一次买卖”,保险公司不能奢望投保人参与一个他自己此次吃亏的博弈。而N次重复博弈的得益Nd,则是一个相当巨额的利润,远远大于保险公司通过一次投机所获得的得益b。因此,在预见到N次重复博弈的理想结果下,保险公司有足够的理由去选择在第二阶段的得益C,从而获得投保人的信任与继续支持,让博弈能够一直进行下去。

二、结论

从以上博弈分析我们了解,要发展网上保险业务,至少要从以下三个方面进行努力:

1.加大网上保险业务的宣传。很明显,投保人要在我们的博弈树中第一阶段选择投保,必须是在他知道已经有网上保险业务存在的条件下。因此,要让投保人能够在投保时选择我们的网上保险,前期宣传是必不可少的。在宣传中,我们需要开动脑筋,用能为大众接受和喜闻乐见的方式来宣传网上保险。这方面,我们可以参考网上银行的宣传经验,成立专门的宣传部门,通过宣传人员的不间断、连续的工作。从网上保险的使用到网上保险的优点,真正为客户全面解读网上保险的功用。解除客户的疑惑,消除客户的后顾之忧,让更多的群众能够接受网上保险,理解网上保险。

2.完善网上保险的法律环境。只有具备一个良好的法律环境,我国的网上保险才会取得迅速的发展。有了法律制度框架的保护,投保人才能够放心地选择网上保险进行交易。因此,有关部门应当针对网上保险的特点及风险成因,从我国网上保险发展的全局出发,加快制定相关的法律法规,建立较为系统的网上保险法律体系,通过法律保护网上交易者交易的安全,为我国网上保险的发展提供有力的法律保障。我国的网上保险法律体系,应既包括关于保险资金的流通、网上保险欺诈与犯罪、网上保险监管等公法的内容,又应包括涉及网上保险与客户、网上保险与网络服务商之间权利义务关系的私法内容;应既包括确立网上保险法律关系中各当事人权利义务的实体规范,又包括实施各项权利义务的程序性规范。而且,相关法律法规的制定要具有前瞻性。由于网上保险依托的是计算机网络技术,计算机网络技术的发展速度非常迅猛,而各种法律法规为维护其权威性,不能频繁地进行变动、更新,都具有稳定性的特点。因此,在制定相关的法律法规时,要将眼光放长、放远,要在充分考虑计算机网络技术发展趋势的基础上进行。

3.加强对网上保险的监管。监管部门应根据有关的法律法规对网上保险进行有效的监管,这对于网上保险业务的发展能起到较好的规范作用,能够确保网上保险业务有序、健康的发展。但很明显,只依靠上层监管的单方面监管是远远不够的,针对网上保险风险的复杂性和从我们上面的分析可知,网上保险业务的监管体系应是一个由上层管理者、保险公司自身、投保人、专业媒体等多方构成的立体监管结构。市场调查公司或会计咨询公司可以对网上保险的服务进行监管,投保人集团也可以对网上保险的服务质量及价格进行监管,新闻媒体也可以对网上保险遵守执行国家金融法律法规的情况进行监管。只有形成广泛的社会监督,才能提高监管的效率和质量。才能让网上保险的发展,走上一条健康而有序的道路。

参考文献:

[1]张海燕:《网上保险势在必行》.金融理论与实践,2002年第6期

博弈论范文篇7

[关键词]基金监管博弈论

一、相关文献回顾

俞国平、邹川达(2000)从监管体系、政府监管、行业自我监管和基金内部监管角度入手,分别介绍了美国集中监管为主的体系和英国自律监管为主的体系,并认为我国现在对基金的认识不够,比较适合使用集中型的监管体系,应该加强对基金业的立法并另设立专门的监管机构。

陈明生(2003)从信息不对称的角度入手,认为信息不对称所导致的逆向选择和道德风险问题存在于我国的证券投资基金业中,对投资基金的治理和监管要从这个方面入手。在治理和监管体系中要注意治理和监管主体的独立性,建立完善的风险评级制度和信息披露制度,以及加强基金行业的自律监管。

王刚、凌媛(2006)从博弈论的角度出发,分析了在基金监管体系中的四个参与主体的成本和收益,并根据博弈论原理简单分析参与主体的关系,认为证监会要建立合理的激励制度,托管人要加强监管和信息披露制度的管理。

以上文献都从不同角度分析了我国证券投资基金的监管问题,都认为我国基金监管的关键在于基金行业的自律监管和信息披露制度。但是,他们都有一个共同的缺点,即对基金行业监管没有进行定量分析,现有的分析比较简单。现从博弈论的角度入手,将四个监管主体的成本和收益定量化,从而建立模型,并以此为依据给出政策建议。

二、参与主体的成本和收益分析

在现有的证券投资基金的监管体系中,有四个参与主体,分别是证监会为主的监管机构、托管银行、基金持有人和基金管理人。四个主体在监管体系中担任不同的角色。

证监会等监管机构主要负责监管证券投资基金机构的业务活动,监督基金业的信息披露情况,对违规的行为进行查处等。证监会的监管成本可以分为固定成本和可变成本两部分。固定成本包括监管人员的工资支出和培训费用等,用C1表示,是固定不变的。可变成本包括监管人员的差旅费、现场办公费用等费用。可变成本随着监管力度的变化而变化,监管力度越大,可变成本越大。如果监管力度大,则可变成本用C1′表示,如果监管力度小,则可变成本用C1″表示,可知C1′>C1″。而证监会的收益主要来源于向基金收取的监管费用。证监会按年交易额的0.04‰向证券投资基金收取监管费,用S1表示。

托管银行主要负责保管基金财产,办理基金托管业务的信息披露事项,对基金的定期报告出具意见,监督基金管理人的投资运作。托管银行的成本可以从两个方面考虑,一部分是固定成本,另一个部分是措施成本。固定成本指托管银行对监管人员支付的工资和费用、信息披露的文件制作等,它不随监管力度的改变而改变,用C2表示。措施成本可以理解为当托管银行发现基金管理人出现违规现象采取措施的成本,包括报告证监会的费用,协助调查费用和由于举报而带来的潜在的收入损失,用C2′表示。托管银行的收益主要包括托管费用收入,用S2表示,而如果托管银行不能很好地执行监管义务,则可能面临处罚和赔偿,这部分收益可以看作是负的,用-S2表示。

基金持有人作为基金的所有者,有权获得基金的投资收益,参加基金份额持有人大会并投票,以及了解基金的信息资料。由于信息不对称的存在,基金持有人对基金管理人的监管是很难的,其监管成本也相应地比较高。基金持有人的成本包括了解关于基金的相关信息、收集关于基金的资料以及参加基金持有人大会的费用等。如果基金持有人积极参与对基金的监管,可以认为成本为C3,而如果基金持有人对基金监管没有热情,则可以认为持有人的监管成本为0。如果基金持有人对基金管理人的违规行为提出诉讼,那么在成本计算中还要考虑诉讼费用、律师费用等,用L表示。而基金持有人的收益可以分成两个部分,一部分是基金持有人对基金投资收益的分享,用S3表示;一部分是基金持有人对基金管理人的违规行为提出诉讼,要求赔偿,用S3′表示,同时,基金持有人会由于基金管理人的违规行为导致损失的发生。

基金管理人主要负责对募集的资金进行证券投资,编制定期报告和信息披露及向基金持有人分配投资收益。基金管理人在监管中的成本是当管理人出现违规行为的时候监管主体对基金管理人的惩罚措施,包括罚款、吊销执照等,用C4来表示。而基金管理人的收益可以分为两个部分,如果基金管理人没有违规操作,收益就是管理费用和手续费等收入,用S4表示,如果基金管理人违规操作,收益除了管理费用和手续费以外,还包括通过违规操作而获得的超额收益S4′。

三、监管主体的博弈论分析

根据以上的成本收益分析可以看出,监管主体间成本收益的关系就决定了他们的行为的方向和可能性。下面用博弈论的方法从不同的角度分析监管主体间的行为。

1、证监会与基金管理人的博弈

证监会作为监管的核心,其行为可以分为严格监管和不严格监管。基金管理人选择自己的行为,是违规操作还是不违规操作。假设如果证监会不严格监管,他不会发现基金管理人违规。所以,他们之间的博弈可以看成是一个静态博弈,其得益矩阵如表1:

从得益矩阵中可以看出,因为C1′>C1″,严格监管相对于不严格监管来说是严格下策,证监会在监管中会选择不严格监管。而如果C4<S4′,不违规相对于违规来说是严格下策,基金管理人会选择违规,那么该博弈的Nash均衡就是(违规,不严格监管);如果C4>S4′,那么违规对不违规来说是严格下策,基金管理人会选择不违规,那么该博弈的Nash均衡就是(不违规,不严格监管)。

2、基金管理人与托管银行间的博弈

基金管理人和托管银行间是监督与被监督的关系。由于托管银行保管着基金资产,则托管银行对基金管理人的行为是完全了解的,即如果基金管理人违规操作,托管银行就会发现。所以,托管银行的选择是在基金管理人违规的情况下是否举报和协助调查。基金管理人与托管银行间的博弈可以看成是一个完全且完美的动态博弈,该博弈的扩展形如图1:从图1中可以看出,如果C4>S4′和S2′>C2′,策略组合“基金管理人在第一阶段选择‘不违规’;托管银行如果有第二阶段选择‘行动’”,是该博弈的子博弈完美Nash均衡。如果C4<S4′和S2′>C2′,策略组合“基金管理人在第一阶段选择‘违规’;托管银行在第二阶段选择‘行动’”,是该博弈的子博弈完美Nash均衡。如果C4>S4′和S2′>C2′,策略组合“基金管理人在第一阶段选择‘违规’;托管银行在第二阶段选择‘不行动’”,是该博弈的子博弈完美Nash均衡。

3、基金持有人与基金管理人间的博弈

基金持有人与基金管理人的关系是委托-关系。基金持有人的监管选择与基金管理人的违规行为可以看成是一个静态博弈。而如果基金管理人违规,则基金持有人有权提出诉讼。基金持有人是否诉讼可以看成是该静态博弈后面的一个动态博弈。假设基金持有人的诉讼是可信的威胁,而且如果基金持有人不监管基金管理人,则基金持有人不会发现基金管理人的违规行为,那么该博弈的扩展形如图2:

其中,

A=(-C4+S4+S4′,S3-W-C3-L+S3′)

B=(S4+S4′,S3-W-C3)

D=(S4,S3-C3)

E=(S4+S4′,S3-W)

F=(S4,S3)

从图2可以看出,如果S3′>L且C4>S4′,则基金持有人会选择“不违规”,而若C4>S4′,则基金管理人会选择违规。所以,如果,S3′>L,S3′>W+C3且S4′>C4,最优策略为“基金持有人‘监管’;基金管理人‘违规’;基金持有人‘起诉’”;如果,S3′>L,S3′<W+C3,最优策略为“基金持有人‘不监管’;基金管理人‘违规’;基金持有人‘起诉’”;如果S3′<L,最优策略为“基金持有人‘不监管’;基于不对称的存在,基金持有人对基金管理人的监管是很难的,其监管成本也相应地比较高。基金持有人的成本包括了解关于基金的相关信息、收集关于基金的资料以及参加基金持有人大会的费用等。如果基金持有人积极参与对基金的监管,可以认为成本而如果基金持有人对基金管理人‘违规’;基金持有人‘不起诉’”。

四、政策建议

1、在证监会的监管制度上要充分考虑一定的激励机制。从第一个博弈可以看出,严格监管的成本要高于不严格监管的成本。如果没有相应的激励机制,证监会选择不严格监管。如果从对违规基金的罚款中抽出一部分给证监会,作为对其严格监管的奖励,该奖励可以弥补严格监管带来的成本支出,那么证监会的最优选择就会是严格监管,从而有效地提高证监会进行基金监管的积极性。

2、要加大对违规基金的惩罚力度。从以上三个博弈分析都可以看出,如果对违规基金的罚款大大超过基金通过违规所得,那么多数基金的最优选择都是不违规。所以,我国对违规基金的惩罚力度要加大,尤其要在剥夺违规基金的非法所得的基础上,还要对违规基金进行进一步的惩罚,从而减小基金的违规冲动。

3、加大对包庇违规基金的托管银行的惩罚力度和减少托管银行的行动成本。从第二个博弈可以看出,托管银行是否会对基金的违规行为及时采取措施,主要考虑的是托管银行包庇违规基金的惩罚力度和对违规行为采取措施的成本。所以,一方面要加大对包庇违规基金的托管银行的惩罚力度,可以考虑剥夺其托管资格和进行罚款;另一方面要减少托管银行采取措施的成本,在一定程度上要保护托管银行的监管地位。

4、保护基金持有人的监管积极性。我国基金持有人的监管积极性不高,其主要原因就是监管成本一直居高不下。所以,要保护基金持有人的监管积极性,最重要的就是要降低基金持有人的监管成本,主要体现在以下三个方面:首先,加强基金信息披露的监管,充分披露基金信息,降低基金持有人收集信息的成本;其次,对积极参加基金持有人大会的基金持有人给予一定的补助,从而降低基金持有人参加基金持有人大会的成本;最后,保护基金持有人起诉的权力,如果基金持有人对基金违规的起诉属实,对基金的惩罚要考虑对基金持有人的损失的补偿,包括基金持有人的起诉费用以及基金持有人由于基金的违规行为所造成的损失。

参考文献:

[1]张维迎.博弈论与信息经济学[M].上海人民出版社,1996.

[2]谢识予.经济博弈论[M].复旦大学出版社,1996.

[3]王刚,凌媛.我国基金业监管的成本收益分析-从博弈论的视角[J].特区经济,2006(1).

博弈论范文篇8

[关键词]网上保险博弈论得益措施

在现代社会经济科技高速发展的大背景下,互联网已融入社会的各个领域当中,给人们的生活与工作带来了极大的便捷。与此同时,人们对网络的依赖也越来越强烈,基于互联网、电话等通信网络的电子商务,正在不知不觉中改变着人们的生活状态和生活方式。作为新型购物方式与时尚生活方式之一的网上购物,也正随着互联网的普及而发展,成为计算机世界中又一重要领域,受到了包括经济学家和社会学家在内的广大学者,以及社会不同群体的关注。

网上保险交易作为网上购物的一种,在这个网络浪潮中也受到了越来越多人们的关注,但与一般的网络购物性质不同,网上保险交易的实质是无形的,实现的是资金的流动。因此它比一般的网络交易具有更大的不可测性与管理难度。下面从博弈论的角度出发,分析网上保险交易发展的利弊。

一、网上保险交易的博弈论分析

考虑到网上保险交易时间上的特性,本人认为相较之于静态博弈,动态博弈更能体现出网上保险交易的特点。因此本文这里选用了一个博弈树的动态博弈结构来分析保险公司开展的网上交易。

在这个博弈中,我们有两个参与方,即经营网上保险业务的保险公司与网上投保人,为了给他们的行为有个合理的解释,我们采用经济学里的经济人的解释。即他们的行为都符合他们自己的利益最大化。另外我们还假设两个参与方的行为具有独立性,即一个参与方的行为与决策是完全独立的,不受另一方的束缚。

在博弈过程中,我们假设博弈参与双方对信息和博弈过程均是了解的,不存在信息不对称的情况,因此这是一个完全且完美信息的动态博弈。

有了以上假设,我们可以开始我们的博弈分析。

保险公司与投保人网上交易博弈的博弈树描绘如下:

在这个博弈树中,顶上第一个白圈表示的是投保人在第一阶段的行为,在这里,投保人作为选择的第一顺序人。可以选择是否通过网上进行保险的交易,如果选择是,则博弈进入第二阶段;如果选择否,则双方的得益为A(0,0),均为0,既没有损失也没有得益。(当然这是一个简化的描述,保险公司的网上开办费与两管理费等成本被省略了)

在第二阶段,黑圈表示保险公司在第二阶段的决策。保险公司接受了投保人的投保,这时他开始作为博弈的主体进行选择,在这阶段,他可以有两种经营方式,一种是有差错的经营方式(这里所指的“差错”既包括保险公司内部经营的种种不规范,也包括保险公司网络外部管理的无力与缺陷),一种是规范的经营方式,即能通过有效监督使得网上保险交易能够顺利进行,投保人的权益能够得到保障。保险公司的两种经营状态将导致B和C两种得益情况的出现。

在得益B(-a,b)中,投保人获得的得益为-a,之所以为负数是因为保险公司的差错经营方式,往往会对投保人造成信息外泄、退保金被人冒领等等的意外损失。而保险公司仍然可以获得投保人缴来的保费b。

在得益C(c,d)中,投保人在保险公司通过规范的经营管理的状态下获得了自己的理想投保得益结果c,而保险公司的经营得益为d。

让我们来对博弈的结果做一个简单分析,很明显,投保人的得益依赖于保险公司的不同经营状态,在投保人能够有效预知得益结果的情况下,他会在保险公司选择差错经营时选择不投保,因为投保会给他带来负得益;而当保险公司规范经营时,投保人会选择投保,达到他购买保险的理想状态。因此在这个博弈的第二阶段,保险公司的经营状态对投保人起到决定作用。但要保险公司选择得益C而不是得益B,则需要保险公司在得益C下的结果d大于得益B下的结果b,这样保险公司才有动力去选择得益C。

但从实际出发分析,我们了解:如果没有有效地对保险公司网上经营情况的监管,而投保人又不能对保险公司的行为做出约束(出自我们的独立性假设),则保险公司的得益C下的结果d往往和得益B下的结果b没有区别。甚至由于规范经营要付出更多的经营成本,很有可能出现得益d要小于b的情况。在这种情况下保险公司出于经济人的思维自然会毫不犹豫选择得益B,而投保人在预见到保险公司在第二阶段选择得益B自己获得负得益的结果后,选择在第一阶段不投保。于是博弈在第一阶段即告结束,网上保险开办失败。

幸运的是,我们博弈可以从两方面进行修正。一是投保人可以对保险公司的行为进行约束,只要放松我们的独立性假设,从而使得单次博弈的结果中第二阶段保险公司的得益C的结果d大于得益B下的结果b(投保人可以通过投诉、联合抵制等手段促成上述的结果),在这样的情况下,保险公司出于经济人的目的自然会选择得益C;二是我们可以进行重复博弈。很明显,重复博弈需要保险公司与投保人之间的长期关系。而刚才的博弈树分析显然是“一次买卖”,保险公司不能奢望投保人参与一个他自己此次吃亏的博弈。而N次重复博弈的得益Nd,则是一个相当巨额的利润,远远大于保险公司通过一次投机所获得的得益b。因此,在预见到N次重复博弈的理想结果下,保险公司有足够的理由去选择在第二阶段的得益C,从而获得投保人的信任与继续支持,让博弈能够一直进行下去。

二、结论

从以上博弈分析我们了解,要发展网上保险业务,至少要从以下三个方面进行努力:

1.加大网上保险业务的宣传。很明显,投保人要在我们的博弈树中第一阶段选择投保,必须是在他知道已经有网上保险业务存在的条件下。因此,要让投保人能够在投保时选择我们的网上保险,前期宣传是必不可少的。在宣传中,我们需要开动脑筋,用能为大众接受和喜闻乐见的方式来宣传网上保险。这方面,我们可以参考网上银行的宣传经验,成立专门的宣传部门,通过宣传人员的不间断、连续的工作。从网上保险的使用到网上保险的优点,真正为客户全面解读网上保险的功用。解除客户的疑惑,消除客户的后顾之忧,让更多的群众能够接受网上保险,理解网上保险。

2.完善网上保险的法律环境。只有具备一个良好的法律环境,我国的网上保险才会取得迅速的发展。有了法律制度框架的保护,投保人才能够放心地选择网上保险进行交易。因此,有关部门应当针对网上保险的特点及风险成因,从我国网上保险发展的全局出发,加快制定相关的法律法规,建立较为系统的网上保险法律体系,通过法律保护网上交易者交易的安全,为我国网上保险的发展提供有力的法律保障。我国的网上保险法律体系,应既包括关于保险资金的流通、网上保险欺诈与犯罪、网上保险监管等公法的内容,又应包括涉及网上保险与客户、网上保险与网络服务商之间权利义务关系的私法内容;应既包括确立网上保险法律关系中各当事人权利义务的实体规范,又包括实施各项权利义务的程序性规范。而且,相关法律法规的制定要具有前瞻性。由于网上保险依托的是计算机网络技术,计算机网络技术的发展速度非常迅猛,而各种法律法规为维护其权威性,不能频繁地进行变动、更新,都具有稳定性的特点。因此,在制定相关的法律法规时,要将眼光放长、放远,要在充分考虑计算机网络技术发展趋势的基础上进行。公务员之家

3.加强对网上保险的监管。监管部门应根据有关的法律法规对网上保险进行有效的监管,这对于网上保险业务的发展能起到较好的规范作用,能够确保网上保险业务有序、健康的发展。但很明显,只依靠上层监管的单方面监管是远远不够的,针对网上保险风险的复杂性和从我们上面的分析可知,网上保险业务的监管体系应是一个由上层管理者、保险公司自身、投保人、专业媒体等多方构成的立体监管结构。市场调查公司或会计咨询公司可以对网上保险的服务进行监管,投保人集团也可以对网上保险的服务质量及价格进行监管,新闻媒体也可以对网上保险遵守执行国家金融法律法规的情况进行监管。只有形成广泛的社会监督,才能提高监管的效率和质量。才能让网上保险的发展,走上一条健康而有序的道路。

参考文献:

[1]张海燕:《网上保险势在必行》.金融理论与实践,2002年第6期

博弈论范文篇9

关键词:博弈论;经济学;应用;探讨博弈理论

在近20年实现飞速发展,也带动了我国市场经济的腾飞,其基本出发点是追求经济利益的行为,主要研究行为和利益的决策,以及市场均衡问题,涉及到决策的原则、方法以及收益、均衡和结果等。因此,博弈论的方法承认个体利益和局部利益,因此适用于分析市场经济下人们的经济行为,还包括各种经济关系以及社会经济活动效率。然而我国长期以来为计划经济体制,其强调集体利益和国家利益,追求集体利益最大化,所以博弈论和计划经济融合较差。

一、博弈论的现实问题

博弈论模型的优势在于根据其特定的结构,可以将很多经济学、政治学、国际关系、军事战略等问题在一个模型下解释。比如在国际社会中,如何应对国际恐怖组织是热门的话题,假设防御方先做出决策,而恐怖袭击方根据防御方的策略做出决策,进而制定出最终的袭击计划,最优决策也因此形成。因此,防御方所制定的防御决策必须使恐怖袭击方做出的袭击计划损失最小。再如“纳什均衡”,以囚徒困境为例(见表一),在甲乙都招供的情况下就是“纳什均衡”。同时,博弈论还提供分析和解决经济问题的思想方法。当前,我国处于经济转型的重要阶段,适用于以下条件的经济分析:a不确定性;b不完全信息;c不完全竞争;d动态条件,同时还强调机制、制度和规则的优化博弈论,这对于我国经济的发展有着重要意义[1]。

二、如何利用解决博弈论解决问题

利用博弈论可以解决诸多经济学问题,比如企业老板和员工之间的矛盾就可以利用博弈论分析,老板想到:员工干得这么糟,凭什么要给高工资?而员工认为:老板工资开这么低,凭什么要努力干活?作为员工要深知这样的道理,当前达到的工资水平是之前自己的努力而来,如果现在的薪资没有达到预期,可能是已经跳槽,也可能当时和老板谈妥。究其原因,其一在于双方都缺乏信心,其二在于双方都抱有期望,最后,双方都知道分手换人需要付出代价。辩证的讲,如果员工跳槽浪费了时间并且承受了风险,但是可能面临福利没有提升的情况所以多数会选择坚守岗位;而跳槽后真正面临福利没有提升的情况时,员工也会心有不甘[2]。如何利用博弈论解决此问题?首先,企业的工资要调整要快,随着员工能力的提升会对薪资有更高的期望,如果等到员工反映加薪问题必将对企业凝聚力造成影响,然而企业也会认为培养员工花费的时间和心血没有回本,双方都难以从对方的角度考虑问题。因此,企业要对不同阶段的员工实行工资定档,入职培训期间可以不予发放工资,在转正后开始发放,同时员工的工作能力显著提升后企业要主动提升福利待遇,并且企业要建立绩效考核制度。其次,用博弈论的观点分析问题,道德风险问题也是企业与员工合作的问题,老板可以支付高工资也可以支付低工资,而员工也努力工作和消极怠工,通常企业老板会给工作努力的员工更多报酬,而员工出现自满情绪后会存在懈怠情绪,会导致薪资下调,这时员工在意识到问题之后又会努力工作,进而出现纯策略纳什均衡,解决问题的关键在于企业初期就选择到合适的员工,假设员工了解自身的能力,老板需要合理安排岗位人员,制定出合理的薪资计划,进而激励员工证明自己的工作能力[3]。

三、博弈论的实际应用

作为决策和策略理论,博弈论对人们的日常生活和工作起到重要影响,同时在微观经济学中也得到了广泛的应用,比如金融领域的股份公司的债权和股份发行量比例会利用到博弈论,再如厂商理论涉及到的如下细节:a产量;b成本;c定价;d市场类型,在宏观经济学中,博弈论也时常出现,以进出口贸易为例,包括关税、进出口限额、出口津贴,比如我国与美国打响的“贸易大战”,每当美国首先不合理的提升税率,我国也必然在其它贸易领域中实现反制裁策略,这样才能在博弈中维护国家利益。本文以电商领域的价格大战分析背后隐藏的博弈理论[4]。事件回顾:2012年8月14日,京东总裁刘强东向苏宁易购发出价格战挑战书,指出从8月15日起,京东商城大家电(冰箱、彩电、洗衣机、电脑、空调等)价格一定要比苏宁线上线下便宜,甚至打比方苏宁卖1元的大家电,京东的价格将是0元!通过这个事件人们会疑惑为何价格战可以打响,对京东更加有利吗?如果价格战持续下去最终结果会怎样?京东与苏宁价格战的博弈矩阵,如表二:表二:博弈矩阵---京东与苏宁价格战纳什均衡基于最终结果的角度分析,体现出纳什均衡具有稳定性特征,在策略组合上京东和苏宁都有动机做出战略的选择,最终也一定会达到纳什均衡。从做出选择的视角使用纳什均衡,即做出己方的选择时,需要分析和预判对方的选择,进而找到最有利于自身发展的方法对对方进行博弈。如果双方都理性的做出选择时,那么最终的策略组合必将实现纳什均衡[5]。从京东的视角分析,如果苏宁降价,那么京东不降价是更好的选择,因为0利润比失1倍利润好得多;而苏宁不降价,那么京东就要兑现承诺进行降价,这样更加有利于实现京东利益最大化;反之对于苏宁来说,分析结论也是相同的,相较于囚徒困境,在价格战博弈中京东和苏宁都不存在绝对占优得地位和策略,双方制定的策略取决于对方的策略。最终稳定的策略组合如下:a京东降价/苏宁不降价b京东不降价/苏宁降价,通过前文分析,这两种策略组合符合纳什均衡,两种结果的任意一方在对方不改变动机的前提下首先改变,但最终的市场只会存在苏宁获得2倍利润或者京东获得2倍的利润,为说明该问题,就要引入博弈精炼纳什均衡的概念[6]。该理念要求参与者的决策无论何时都是最优的,决策者必须具备随机应变的能力和用发展的眼光看待问题,进而排除不可置信的威胁,所以精炼纳什均衡在通常情况下缩小纳什均衡的个数,使预测分析更加合理化、准确化。从表二可以看出,无论京东如何制定销售策略,都将达到纳什均衡,简而言之,苏宁只要制定与京东相反的战略,就是最佳策略,于是京东在思考之后会知晓苏宁一定会制定相反的行动策略,如果京东降价就可以获得2倍的利润,反观苏宁,由于行动时间趋于一致,于是苏宁在行动前也对京东做出同样分析,得出不论苏宁如何制定策略,京东也一定会反向而行,进而立刻决定降价。于是,价格战轰轰烈烈的拉开序幕,也由于成本问题和商家利益问题,导致价格战草草收场。纳什均衡在经济学中是存在的,在电商寡头垄断市场环境下,政府为避免一家独大,需要与电商企业达成商业协议,这样双方都有利可图,而消费者当然不愿意看到这种情况,最终导致竞争双方都通过营销手段刺激消费,不仅有效降低了商品价格,还可以刺激消费者去购买大家电商品,使自身的生活质量提升[7]。

综上所述,在我国市场经济不断发展的背景下,博弈论必然成为现代经济学发展的有利策略和发展趋势。在信息技术和大数据不断发展的今天,随着人们对博弈论研究不断深入,同时经济复杂性程度不断提升,对于复杂性问题可以更好的解决,使得博弈论研究呈现新的发展趋势。在今后的社会经济发展中,需要更加重视对博弈论在经济学领域的应用,使得人们的生活质量提升,经济走向繁荣。

参考文献:

[1]钱洁莹.博弈论在经济学中应用分析[J].合作经济与科技,2017(14):120-121.

[2]陈卓群.博弈论应用于我国稀土产业研究的探讨[J].商,2016(19).

[3]陆美玲.博弈论在建筑经济学中的典型应用[J].山西建筑,2015,41(6):216-218.

[4]周洁.微观经济学博弈论角度下企业管理行为的探讨[J].山西农经,2016(16):44-44.

[5]李娟.浅析博弈论在经济学研究中的局限性[J].中国科技纵横,2015(1):239-240.

[6]高京燕.博弈论对经济学发展的影响--基于诺贝尔经济学奖视角[J].华北水利水电大学学报(社会科学版),2016,32(2):46-49.

博弈论范文篇10

关键词:博弈论;碳市场;监管

随着全球生态环境问题的凸显,碳排放已成为人们关注的焦点[1-3]。为了满足全球气候治理的需要和企业减排的需求,碳交易市场逐步形成,这不仅有效地解决了林业生态补偿问题[4-6],也成了国内外一个重要的减排工具[7]。截至2017年年底,我囯7个碳交易试点累积成交量超过2亿吨,成交额高达40多亿元,已成为全球最大的碳交易系统[8]。全国碳市场的全面开启将改变未来的世界碳市场格局,因此碳市场的安全稳定对于世界政治和经济格局都有着十分重要的作用。但目前的碳市场监管制度存在立法效力不高,监管制度不全,交易信息披露不够等问题,降低了碳交易市场的稳定性和高效性。加上碳交易市场监管体系尚未成熟,既是一种新兴市场,也是一个信用市场,尚未建立完善的监管机制督促碳交易者公正交易。碳交易的正常进行源于市场中各个主体的公正严格的监管行为,一个有效严格的市场监管体系对碳市场的发展有着直接的影响。政府必须采取行之有效的监管措施保障节能减排行为和市场行为的健康发展,避免出现操纵市场、欺骗消费者等违规现象[9]。高山[10]认为碳交易监管可通过价格监管、行政和经济处罚来避免市场违规行为。樊威[11-13]借鉴外国做法,从政府角色定位、双重监管制度(碳交易与碳排放)和多元化惩罚机制提出了法律建议。陈波[14]提出可以将法律、制度和管理条例有机结合、优势互补,完善法律治理和监督体系。但是大多数的文献都局限于定量方法,文章引入博弈论的思想,构建碳市场中监管部门和交易者的博弈模型,讨论混合策略下的博弈均衡结果,为我国碳交易市场监管的健全化、标准化发展提出若干政策建议,促进碳市场的健康发展。

1模型建立与分析

1.1基本假设。该博弈模型的主体有2个,一个是政府监督部门,另一个是碳市场交易者。为了简化问题,文章做出如下假定:一是政府监督部门有2种选择:监管和不监管,碳市场交易者有2种选择:守法和违法;二是政府部门的监管成本为C,交易者守法产生的机会成本为B,交易者违法的收益为E,违法处罚为T。其中,监管成本C、机会成本B、违规收益E和处罚T都是常数。1.2混合纳什均衡分析。监管部门和碳市场交易者之间的博弈模型用矩阵形式表示,如表1所示,政府监管部门有2种选择:监管和不监管。交易者有2种选择:守法和违法。当监管部门选择监管的时候,守法的交易者需要付出一定的机会成本B;违法的交易者会因为政府监管部门的监管而被发现违法行为,受到处罚,罚金为T;政府监管部门只要进行监管就会付出监管成本C,但是如果交易者违法,还会得到惩处违法者的罚金T。当监管部门选择不监管的时候,政府部门监管成本降低为0,守法的交易者还是会付出机会成本B;违法的交易者会因为违法行为获得违法收益E,并且也不会受到惩罚,因为政府不会监管交易者的违法行为,所以对违法者不产生任何影响,所以违法者的收益是(E+B)。假设监管部门进行监管的概率为p,不监管的概率为(1-p),交易者守法的概率为q,违法的概率为(1-q)。给定q,监管部门选择监管(p=1)和不监管(p=0)的期望收益分别为UG(1,q)=(-C)q+(T-C)(1-q)=-Tq+T-CUG(0,q)=0解UG(1,q)=UG(0,q),得q*=(T-C)/T=1-C/T。当交易者守法概率小于1-C/T,政府部门的最优选择是不监管;当交易者守法概率大于1-C/T,政府部门的最优选择是监管;当交易者守法概率等于1-C/T,政府部门随机选择监管或不监管。给定p,交易者选择守法(q=1)和违法(q=0)的期望收益分别为UC(p,1)=-Bp-B(1-p)=-BUC(p,0)=(E-T+B)p+(E+B)(1-p)=-Tp+B+E解UC(p,1)=UC(p,0),得p*=(E+2B)/T。当政府监管概率小于(E+2B)/T,交易者的最优选择是守法;当政府监管概率大于(E+2B)/T,交易者的最优选择是违法;当政府监管概率等于(E+2B)/T,交易者随机选择守法或违法。

2研究结论

博弈模型的结果表明,混合纳什均衡解是p*=(E+2B)/T,q*=1-C/T。因此,政府监管部门以(E+2B)/T的概率监管,碳市场交易者以C/T的概率违法。换句话说,就是碳市场的交易者中有1-C/T比例的人会选择守法,C/T比例的人会选择违法。政府部门会随机去监管(E+2B)/T比例的人的交易行为。由此可见,均衡解与违规收益E、机会成本B、监管成本C和政府处罚T都有一定的关系,并且监管的概率与违规收益成正比,与交易者机会成本成正比,与政府处罚成反比,而守法的概率与监管成本成反比,与政府处罚成正比。由此可知,当监管成本越小,处罚罚金越大,交易者守法的概率就越大;当机会成本越小,违规收益越小,处罚罚金越大,政府监管的概率就越小。为了实现碳市场不出现违法交易,政府不需要监管的最优状态,则必须尽可能地减小p,增加q,即降低政府监管成本、交易者机会成本和违规收益,增加违规处罚的额度。

3监管建议