康翠翠:博弈论的学习


 

博弈论game theory,什么是博弈?博弈论能给我们什么启迪和帮助?我们一起来解读博弈论吧!

博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。

策略性环境是指每个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指每个人要根据其他人的可能反应来决定自己的决策和行动。而非策略性决策和行动无须考虑这些决策和行动对其他人的影响以及由此而引起的其他人的反应。

任何一个博弈都具有三个基本的要素:参与人、参与人的策略、参与人的支付。

参与人(局中人)就是在博弈中进行决策的个体。参与人通过在博弈中选择最优的行动和决策来使自己的目标函数(如效用或期望效用)达到最大。在任何博弈中都至少有两个参与人。

参与人策略指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动。每一个参与人至少应有两个可供选择的策略。只有一个策略的话,就没有选择的必要了。

参与人的支付指在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。在一个博弈中,当所有的参与人都选择了自己的策略时,就得到一个策略组合;对于每一个策略组合,每一个参与人会得到一个支付;所有这些参与人的支付合在一起,构成相对于某个策略组合的支付组合。

博弈的类型根据不同种分类有以下几种:

1.根据参与人数量不同,分为二人博弈和多人博弈;

2.根据参与人的支付情况不同,分为零和博弈和非零和博弈;

3.根据参与人拥有的策略的数量多少,分为有限博弈和无限博弈;

4.根据参与人在实施策略上是否有时间先后,分为同时博弈和序贯博弈。其实博弈的两种基本类型就是“同时博弈”和“序贯博弈”。

博弈论是一门科学,一门研究策略的科学!在策略性环境中进行策略性决策和策略性行动。我们都知道寡头市场是典型的策略性环境。在该市场中,寡头厂商的行为相互影响,寡头厂商的行动和决策是典型的策略性行动和策略性决策。因为每个寡头厂商都需要了解其他厂商对自己所要采取行动的反应,并根据这些反应,制定自己的决策和采取最有利的行动。可见博弈论是分析寡头厂商行为的一个恰当工具。

什么是寡头呢?

寡头,是指掌握着庞大的金融资本,并在实际上控制着国民经济命脉和国家政权的大垄断资本家或垄断资本家集团,具有厂商数量少,厂商相互依存,价格稳定,厂商进出不易的特征。

寡头在经济学上主要指寡头市场。

寡头(Oligopoly)市场又称为寡头垄断市场,它是指少数几家厂商控制整个市场的产品的生产和销售的这样一种市场组织。寡头市场被认为是一种较为普遍的市场组织,西方国家中不少行业都表现出寡头垄断的特点,例如,美国的汽车业、电气设备业、罐头行业等,都被几家企业所控制。

假定在某个寡头市场上,只有甲、乙两个厂商。每个厂商都有两个可供选择的策略,合作和不合作。

1.如果两个厂商都采取合作的策略,则分别可得到5和6个单位的支付;

2.如果两个厂商都采取不合作的策略,则分别只得到2和3个单位的支付;

3.如果甲厂商采取合作的策略而乙厂商采取不合作的策略,则采取合作的甲厂商得到1个

单位的支付,采取不合作的乙厂商得到5个单位的支付;

4.如果甲厂商采取不合作的策略而乙厂商采取合作的策略,则采取不合作策略的甲厂商得到7个单位的支付,采取合作策略的乙厂商得到1个单位的支付。

像这样一个只有两人参加且两人同时进行决策的简单博弈(所谓“二人同时博弈”),可以用一个以二元数组为元素的矩阵(称为博弈矩阵,或支付矩阵)来描述和分析。

矩阵的左边表示甲厂商的策略,即合作或不合作,上边表示乙厂商的策略,也是合作或不合作,矩阵中四个单元格里的数字组合分别表示博弈的四个结果即支付,其中,每一个数字组合的第一个数字是甲厂商得到的支付(简称甲厂商的支付),第二个数字是乙厂商得到的支付(简称乙厂商的支付)。

1.当甲厂商选择合作、乙厂商也选择合作时,结果得到矩阵左上角单元格里的数字组合(5,6),其中,第一个数字5,是甲厂商的支付,第二个数字6,是乙厂商的支付;

2.当甲厂商选择合作、乙厂商选择不合作时,结果是矩阵右上角单元格里的数字组合(1,5),其中,第一个数字1是甲厂商的支付,第二个数字5是乙厂商的支付,如此等等。

这个支付矩阵可以一分为二,即拆成两个“小”的子支付矩阵。其中,一个为甲厂商的支付矩阵,由原矩阵每一单元格中的第一个数字组成,另一个为乙厂商的支付矩阵,由原矩阵每一单元格中的第二个数字组成。实际上,整个支付矩阵可以看成就是由这两个厂商的子支付矩阵合并而成。

我们把甲厂商在乙厂商选择合作条件下的最优策略即不合作叫做甲厂商的条件优势策略,或者叫做相对优势策略,简称条件策略。

我们把甲厂商的这一条件策略相联系的策略组合,(合作,不合作)叫做甲厂商的条件优势策略组合,或者叫做相对优势策略组合,简称条件策略组合。

当两个厂商的条件策略组合恰好相同,那么两个厂商都不再有单独改变策略的倾向时,整个博弈就达到了均衡。

博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解。这种均衡有个专门的名称,叫“纳什均衡”。

纳什均衡指参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

有两个问题:1.单独改变策略,指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略,其他人也同时改变策略的情况不在考虑之列;2.不会得到好处,指任何一个参与人在单独改变策略之后自己的支付不会增加。支付减少或支付不变,而不会支付增加,因为存在改变的成本和风险,参与人也不愿意单独改变策略。

上述确认博弈均衡或不均衡的方法可以更加直观也更加方便地表示为所谓的“条件策略下划线法”。

在一个单元格中,如果两个数字之下均画有线,则两个参与人都没有单独改变策略的动机,因为这两个数字分别是列最大值和行最大值;如果两个数字之下均没有画线,则两个参与人都有单独改变策略的动机。因为这两个数字分别不是列最大值和行最大值;如果两个数字中一个下面有线一个下面没线,则有线的数字所代表的参与人没有单独改变策略的动机,没线的数字所代表的参与人有单独改变策略的动机。

在同时博弈中,纯策略的纳什均衡既可能存在,也可能不存在。

在纳什均衡存在的条件下,它既可能是唯一的,也可能不唯一。

如果纳什均衡存在,则它既可能是最优的,也可能不是最优的。

纯策略的纳什均衡不存在,相应的混合策略纳什均衡却总会存在;纯策略的纳什均衡往往作为特例被包括在混合策略纳什均衡之中。

在同时博弈中,参与人原来的策略叫“纯策略”,他们赋予这些纯策略的概率向量叫“混合策略”。所有参与人的混合策略的组合构成“混合策略组合”。

混合策略组合与参与人的支付的乘积之和为参与人的期望支付。当其他参与人的混合策略确定之后,某个参与人选择的可以使自己的期望支付达到最大的混合策略是该参与人的条件混合策略(其几何表示为“条件混合策略曲线”)。不同参与人的条件混合策略曲线的“交点”就是混合策略条件下的纳什均衡。

如何从多个纳什均衡中,排除掉那些不合理的纳什均衡?

如何在所有的纳什均衡中,找到所有可能实现的纳什均衡?

这就是对纳什均衡的“精炼”,即要从众多的纳什均衡中进一步确定“更好”的纳什均衡。

我们使用“逆向归纳法”,1.先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈;2.对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解。

“序贯博弈”是参与人的决策和行动有先有后的博弈。博弈树来简单方便自然的描述序贯博弈。博弈树用“点”:起点、中间点、终点,来连接点的“线段”以及标在这些点和线段旁边的文字和数字组合。在博弈树中,一个纳什均衡代表一条均衡的路径。在该均衡路径上,没有哪个参与人愿意单独改变自己的策略。

在序贯博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。所谓对纳什均衡的“精炼”,就是要从众多的纳什均衡中进一步确定“更好”的纳什均衡。纳什均衡的精炼方法就是上面提到的“逆向归纳法”。

博弈论是一种数学方法,其本身的正确性是不容置疑的。它在经济学中的应用,特别是在寡头市场的应用已经取得了大量的成果。然而,也必须指出,这些成果基本上是在解释的方面,如对于寡头行为的解释。但是,它对于如何解决寡头的弊端这一问题却还未能提出有效的方案和对策,而研究经济学的目的归根到底还是在于提供解决问题的方案。

与其他西方经济学的理论一样,博弈论也以“自利”和“理性”作为自己的基础。然而,在该基础上推导出来的结果却并不一定总是符合实际的。例如,考虑如下的同时博弈:A、B两个旅客买了同样的花瓶,但托运时摔坏了,于是向航空公司索赔。航空公司的回答是,请他们在100元以内写下花瓶的价格,如果两个价格一样,就按该价格赔,如果两个价格不一样,就按较低的价格赔,并对写得低的人奖励2元,对写得高的人罚款2元。这个博弈的解是什么呢?如果A、B两人都写100,则两人都会得到100,但是,A会想,如果B写100,那我应当写99,因为这样可以得到99+2=101,而B又会想,如果A写9,我应当写98,如此等等,于是,最后两人都写0!这个结果显然并不符合实际。

因此,迄今为止,博弈论方法在经济学上的应用所取得的真正有实效的成果可以说仍然是有限的。