《<萨缪尔森经济学>批判》连载三十二:博弈论、纳什均衡与囚徒困境


      二十五、博弈论、纳什均衡与囚徒困境

       博弈论又称对策论,其实直译是“游戏理论”(game theory),研究的是在对抗性活动中双方或各方战略的相互影响。我们在第一节中已经指出,在每个人追逐自身利益最大化的前提下,冲突、对抗是经济活动的本质,而妥协、平衡则是其表象。因此,研究各双如何制定使自身利益最大化的战略及其相互影响,本来应该是经济学研究的主题。萨缪尔森实际上也承认:“博弈,博弈,无处不在……对博弈论的深刻领悟已遍及经济学、社会科学、工商业活动以及日常的生活之中。”(P166)遗憾的是,由于这一主题不利于占统治地位的利益集团掩盖自己巧取豪夺的本质,在经历了长达数百年的市场经济实践后,才终于有一个所谓“博弈论”来羞羞答答地处理这一主题。

令人惊奇的是,博弈论并不是军事战略家提出来的,而据说是一个叫约翰·冯·纽曼的数学家所开创和发展的。“博弈论的指导思想是:假设你的对手在研究你的策略并追求自己最大利益行动的时候,你如何选择最有效的策略。”(P161)然而,这恰恰就是军事战略本质。任何有效的一个军事策略都是建立在掌握对方的兵力部署,判断对方将领的战略战术基础的之上。这就是所谓“知己知彼,百战不殆。”于是,“兵者,诡道也。能而示之不能,用而示之不用,近而示之远,远而示之近。”具体来说,有侦察、间谍,有用间之道,有反间之计;有声东击西术,有调虎离山术等等。目的只有一个,即千方百计隐蔽自己的真实力量和意图,使对手发生错觉,而自己则尽可能刺探对方情报,正确判断对方的作战意图,据此来部署兵力,战胜对手。在作战时,则尽可能使己方兵力数倍于敌,在局部战场上占据绝对优势,从而击败对手。军事对手之间的博弈之复杂,绝不是数学公式可以归纳、推导的,需要从大量的情报中辨别真伪,做出决策。不仅如此,在实际经济和军事博弈中,决策是连续的,一次决策的结果成为下一次决策的起点,双方在连续的博弈中判断对手的意志、能力、耐心以及士气、装备、情报等各作战要素。

事实上,在企业间的竞争也是这样,追求自身利益最大化的各方就进行着这种连续的、复杂的博弈,博弈的结果同样是弱肉强食。有时候,强者能够不战而屈人之兵,弱者自动投降,如被兼并或收购,双方不发生激烈冲突。有时候,双方势均力量,于是就价格战,直至分出高下。有时候,弱势方拼死反抗,强弱双方激烈较量。即使最终弱者战败,但强者也可能会伤元气,以至被第三方所获。也有可能弱势方神机妙算,或凭借地利优势,总是在造成局部优势,总是攻击强者的弱处,于是就有以弱胜强的战绩。

可以说,孙子兵法是博弈理论和博弈实践相统一的最高水平。孙子兵法以后的军事理论的发展,无非是孙子兵法原则在不同装备条件下的应用和展开而己,克劳塞维茨的《战争论》在战略原则的表述上其实远逊于孙子兵法。因此,博弈论的真正大师是中国春秋末期的孙武。

放在这一视野下,纽曼的博弈论又是什么呢?纽曼无非是建立了单因素、一次性博弈的数学模型。当这种数学模型被用于解释多因素、复杂的企业竞争时,就显得非常苍白可笑。例如,我们来看看萨缪尔森是怎样用博弈论来解释“双寡头垄断的价格战”的:“当双方都运用正常价格战略时,每个企业各赚10美元。而在另一个极端,就是双方都采用削价战略时都会遭受最大损失。”如果其中一家“SAX坚持正常的价格战略,而BERNEY却采取降价战略。BERNEY拥有了市场,可它却损失了大笔金钱。因为它的售价低于成本。SAX一直以正常价格销售而不是对BERNEY的策略作出反响,处境反倒好一些。”(第161页)“因此,一个企业无论采用什么战略,与之博弈的企业的最佳战略就是仍按正常价格销售,正常价格在价格博弈中,对两个企业来说都是一种占优战略。”(第162页)此论意味着,双寡头垄断企业间的价格战是不可能发生的。

但是,这与事实相去何止十万八千里!双寡头垄断的企业间也会打价格战。如果说双寡头间的价格战发生得比众多企业间的价格战少,那并不是因为博弈的结果,而是双寡头之间的合谋比众多企业间的合谋容易。为什么双寡头间也会发生价格战?难道它们不知道价格战的最终结果是双方两败俱伤吗?

假如这两个寡头的一切条件——技术、资金、质量、成本、规模、运输条件、顾客对商品的认同程度、员工的激励水平等等——都相同,那么价格战的结果的确会指向零,导致两个企业都毁灭。问题在于,两个寡头间的这一切条件常常都不相同,其中一个可能自认为成本更低、质量更好、品牌更有影响、有更强大的资金作后盾、管理水平更高等,这个寡头就会发动价格战,以夺取更大的市场份额,直至把对手挤出市场,形成单寡头垄断。当一个寡头发动价格战时,另一个寡头可以保持正常价格吗?实际上不可以。如果另一个寡头还保持正常价格,则其销售量会急剧下降,虽然单件利润仍较高,但利润总量则会急剧下降,直到无法支付固定成本为止。这才是价格战,其结果是一方获胜,占领全部市场,而另一方则被淘汰。形成单寡头垄断后,垄断企业再提高价格,不但可以收回在价格战期间的利润损失,而且还可以获得超额垄断利润。价格战的激烈程度取决于参战企业对各自实力的判断及应战意愿。双方或多方势均力敌,互不服气,则价格战将十分激烈;如果双方相互承认对方的实力,则可能形成价格默契甚至市场分割;双方或多方实力悬殊,则弱势方接受强势方的购并,或接受强势方的定价,可能会迅速形成垄断局面。

实际上,在双方实力接近的情况下,价格战的胜负常常取决于备战、后援、士气、谋略等因素,先发制人,后发制于人。例如,长虹在发动价格战前,廉价囤积了一批显像管,造成显像管市场供应紧张,价格上扬,然后突然降价,使竞争对手陷于困境。当然,长虹还没有最终取胜。因为竞争对手实力相当,又各自有政府或银行支持,虽然利润越来越薄,但由于退出成本很高,价格战仍然会持续下去,直至一方宣告失败或投降求和。尽管各方直接利益在价格战中都受损失,但战争还是会持续下去,暂时来看,形成双输局面,长远来看,则是一输一赢。即使一时没人发动价格战,由于有此类先例,商业竞争对手还是会双方相互保密,又相互刺探对手情报,造成经营成本也就不断上升。当然,价格战必须在性能、质量、品牌知名度相近的情况下才能激烈展开。如果经营同一类商品的不同企业各自占居高、中、低不同档次的商品,则他们之间很可能不是价格战,而是分档垄断。

由此可见,在双寡头垄断情形下,如果双方力量不平衡,则两个寡头各自追求利益最大化的正常结果并不是双方保持正常价格,而是陷入“双输局面”,套用纽曼的博弈论模型,即所谓“囚徒困境”;如果双方力量平衡,则在双方追求各自利益最大化时,各自将保持正常价格,形成所谓“纳什均衡”,即非合作均衡,在不合作的情况下双方利益都能最大化。

显而易见,双方力量完全平衡是不可能的。由于企业的人、财、物、供、产、销各要素都处于不断的变动之中,即使有某个瞬间双方力量曾经平衡,下一个瞬间也会不平衡。因此,对双寡头垄断竞争的理论分析必须立足于力量不平衡,从而“纳什均衡”就成为虚构。

然而这一虚构对于斯密开创的经济学具有重大意义。“纳什均衡”实际上是从博弈论的角度对“看不见的手”的逻辑进行的论证。如果说“纳什均衡”为虚构,则“看不见的手”就不适用于双方策略互动情景,从而不适用于一切经济活动。萨缪尔森毫不隐瞒这两者之间的关系:“竞争性均衡是纳什均衡或非合作均衡。注意,当每个企业都采取非合作行为时,总社会效用会最大化。这一点让我们想起了亚当·斯密关于看不见的手的学说。”(第163页)所以,毫不奇怪,提出这一子虚乌有的“纳什均衡”的数学家约翰·纳什因为博弈论方面的贡献而获得了诺贝尔经济学奖。

实际上,符合市场交易的博弈模型还是囚徒困境。所谓囚徒困境者,是这样一个故事:甲乙双方为同案嫌疑犯,一同被警方逮捕。审讯者将甲乙双方单独监禁,并告诉他们,如果双方都不供出对方,自己也不承认有罪,则双方都可获释;如果一方招供,另一方拒供,则招供方可获释,拒供方判刑;如果双方都招供,则双方都判刑。甲乙双方各自独立判断,各自根据利益最大化做出决策,则双方都选择招供,结果是双方利益最小化。

囚徒困境刻划出市场交易的本质性困境。近来经济学界热衷的所谓“逆向选择”和“道德风险”问题是无非是囚徒困境的又一个典型情景而已。在讨论保险市场时,萨缪尔森承认,“由于市场不灵活,会出现许多不确定性和风险。市场不灵活的两个重要因素为‘逆向选择’和‘道德风险’。当这些因素存在时,市场可能会给出错误的信号,破坏激励机制,甚至有时会不存在市场。”(第159页)

       什么是道德风险呢?如果受保人减少避免风险的动力,甚至增加风险,则风险发生的概率就会增加,承保人利益就会损失。最极端的例子是,某人受保房产火险,高估房产价值,然后故意制造火灾,索取赔偿金;一般情况则是,由于受保,减少了防止火灾的动力,使火灾发生机率增加。由于存在道德风险,保险公司就会提高保费,从而使受保人数量减少;由于受保人少,保险费就得更高,如此恶性循环,可导致相应的险种消失,即不存在市场。

       什么是逆向选择呢?如果高风险者参加保险,而低风险者不参加保险,则受保人的风险发生概率将大大高于平均风险发生概率,从而使保费上升,受保人进一步减少,直至该类险种消失。例如医疗保险,多病者愿意投保,而健康者则不愿投保。

       这两种情形都可以归结为受保和承保(即买与卖)双方信息不对称,而且是有利于买方的信息不对称。由此,人们不禁会替保险公司担忧起来。其实,大可不必,因为还有有利于卖方的信息不对称,可称卖方道德风险和卖方逆向选择。

       所谓卖方道德风险是指,保险公司在设计保险条款和理赔时,设下很多障碍和陷阱,在受保人看来可以得到的赔偿,实际上得不到或比预期少得多。

       所谓卖方逆向选择是指,保险公司选择低风险者作为受保对象,而回避高风险者。例如给在校学生医疗保险,而不给退休职工承保。

       把买卖双方的道德风险和逆向选择合起来看,则是双方自各利用信息不对称进行博弈,而博弈的结果则是双方落入囚徒困境,若干信息不对称比较严重的保险市场将不能存在。例如失业保险,医疗保险等。中国目前的保险覆盖率还很低,根本原因就在于人们对卖方道德风险和逆向选择问题的估计。

       当然,保险公司之所以出现并发展,是利用了一个根本的信息不对称,即风险发生概率的估计。例如,设20元钱购买民航保险,保额20万元,飞机的事故率为百万分之一,平均每架飞机座150人,则可以计算,保费收入为20×1000000×150=300000万,而理赔支出则为200000×150=3000万。这就是保险公司的赚钱奥秘。

       实际上,一旦把信息不对称引入,则每一次交易都成为博弈,因而保险市场上的所谓道德风险和逆向选择问题是一个普遍性问题。而且,只要这个问题被提出,“看不见的手”就无法成立。

有意思的是,在“看不见的手”的思维屏障下,道德风险和逆向选择这一交易信息不对称所产生的最简单的问题,居然被作为经济学研究的高级领域看待。当然,作为折衷主义大师的萨缪尔森也承认:“在许多情况下,非合作的行为导致经济无效或社会不幸。”(第164页)如污染博弈,军备竞赛等,萨氏甚至承认经济生活正在慢慢变成类似平民的军备竞赛,赢家通吃,导致最大的不平等。他至少比那些新自由主义者客观一些,还愿意面对一些事实。