寻觅张榜悬赏者


 
     找到对路的张榜悬赏者,的确不容易。凯恩斯认为,失业人数的多寡,并不是衡量一个社会经济好坏的标准,因为存在自愿失业的现象。这就如同一个婴儿,愿意自动断奶。功成而弗居的现象,并不是只出现在老子的理想社会里,人性本来就是这样。人自然会在某一个领域知足,从而迫使自己创新,去寻找自己对口的悬赏者。

 
     一个成功的房地产老板完全可以垄断这个行业,挤垮所有的竞争者,但他还是选择罢手,甚至退出这个行业,成为这个行业的失业者。这是为什么,当他在这个圈子里登峰造极的时候,必然会出现“知足”,你说是审美疲劳吧也未尝不可。人会贪婪地在低端不断复制,的确不错,但认为会永远无限下去,那是有点杞人忧天了。人有天生的知足本能,这样就激发了人类的另一种本能,寻找另类的悬赏。
 

     找不到悬赏者的确是好孤独,当年伯牙为此而摔琴,就因为没知音,没了悬赏者。人要找到对口的悬赏者,是不容易的。有些人很有钱,但并不对穷人具备悬赏资格,这就是为什么好多亿万富翁,跟你一点关系都没有的原因,当然有社会责任感的富翁除外,与其羡慕那样小圈子里的大富翁,还不如给那些对你微笑的乞丐留下点回忆。

 
     能够给你悬赏的人,是你生命中的导师,他或许没有更多的积蓄,但他一定比不能悬赏你的大富翁富有。一个人的富有,不是单项地看他银行里的存款数字,而是看他悬赏的次第在哪个层面。一个吸毒者,就算他有几万个亿,他的悬赏层次,也只能停留在悬赏那些行尸走肉一样的吸毒者身上。他实在是没有任何一个健康的穷人富有。

 
      都听过商鞅立木取信的故事:“能徙者,予五十金。有一人徙之,辄予五十金,以明不欺。卒下令。”商鞅就是一个悬赏者,为在恰当的时空做了恰当的事进行标价,这样的价值重估,是否吸引你看能否突破你的常规思维,能的话就是你的生命导师了。但有两种人不去应征,一种是不信,这种人多半以小人之心度君子之腹,这种人常常抓不住机会,跟看穿骗子的不同,能看穿的人,是因为相信了骗子更高价值的本性,故可以防范他误入歧途;一种是相信,但对悬赏已无兴趣,因为他知道,商鞅最终想做成什么,商鞅所达成的愿景不能满足于他,对此他采取自愿失业,不赚这个钱。应试者是刚知刚觉,而前一种不信者是后知后觉,后一种非常相信者是先知先觉者。因此先知先觉的人,多半都是信可信非常信的人,他已经在幕后做超级悬赏了。
 

      所以在老子眼里,是不提倡做悬赏的。老子说:“不尚贤,使民不争。不贵难得之货,使民不为盗。不见可欲,使民心不乱。是以圣人之治,虚其心,实其腹,弱其志,强其骨;常使民无知、无欲,使夫智者不敢为也。为无为,则无不治。”殊不知老子的不悬赏实际上在做大悬赏。老子虽然不敢为天下先,但老子分明在悬赏跑得最先最先的,先到无影无踪。老子最懂得集中优势兵力做一件事情。值得让他囤积的贵重物品几乎没有,在老子看来,没有比搞通货膨胀更傻的了。

 
      关于西方的悬赏理论,可以从经典的囚徒困境中看出端倪。1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

 
     警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

    * 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

    * 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

    * 若二人都互相检举(互相“背叛”),则二人同样判监2年。

    如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

    囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

    * 若对方沉默、背叛会让我获释,所以会选择背叛。

    * 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

     二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

     这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

 
     从以上囚徒困境中,我们知道,帕累托最优和纳什均衡是从两个不同方向思考问题的。按帕累托最优思路的话,法律应该不惩罚犯人,犯人也不要去报复社会是最佳选择。至少在本案例中都选择沉默对双方来说刑期是最少的。但这样做要承担巨大的风险,就是很可能被判10年徒刑。从减轻受罚的角度想,最可靠的办法,还是选择纳什均衡。这就说明,追求悬赏采用帕累托最优,要规避风险,还得要采用纳什均衡。那么如何将两种思想进行统一呢?变通一下就可以了,对犯人的惩罚机构,实际上是向犯人要悬赏的应征者,若实施纳什均衡理论的话,虽然可以规避最痛苦的局面发生,但他采用的手段是人人做恶而实现的,因此他是无法避免原罪的,在下一轮博弈到来的时候,很可能会加刑。

 
     因此说纳什均衡有风险规避功能,只能算是权宜之计。一旦有时间思考的话,还是赶紧用帕累托最优来解决问题。我们之所以悲观,是把惩罚者想象成至高无上了。其实惩罚性的法律,恰恰是一种较低级的法律,操弄这种法律的人,他们的层次甚至连犯人都不如,犯人欺负了好人,法律就可以欺负坏人了吗?螳螂捕蝉黄雀在后的黄雀就没有罪了吗?法律并不是犯人的吸血虫,如果是这样,犯人实际上对司法人员充当了悬赏者的角色,一切惩罚性的法律,犯人都是悬赏者,比司法者高贵。但真正正义法律是什么呢?它是没有惩罚的,关押根本就不是惩罚,而是为了保护你,隔离对你的迫害。所有的虐囚者都是穿警服的罪犯。真正的警察是犯人的保护者而不是征服者。

 
    明白这个方向后,我就可以向你表达如何由纳什均衡跃迁到帕累托最优。隔离犯人,避免追杀,就是法律要做的事情。关于这个理论,以后我会有专门的文章论述,这个理论的关键词是无限不相邻设置。用无限不相邻设置来避免相互追杀,将天敌进行不相邻设置,就是悬赏。法律所要做的工作就是这个,而不是惩罚。也许法律会出现类似惩罚的方式出现,但那只是一种自卫的隔离,绝对没有惩罚的动机在里头,没有报复的动机在里头,这才是正义之师。按帕累托最优来思考,很可能判10年徒刑,但因为没有留后遗症,没有用惩罚他人陷害他人的方式来自卫,这就切断了加刑的可能,而纳什均衡并没有解决这样的后遗症。从战略的累计角度看,纳什均衡的权宜之计是暂时的。

 
    诺贝尔奖评委组织,是一个学术悬赏机构。作为悬赏机构,只能培养继承者,要找到超越者是很难的,因此更优秀的思想家,诺贝尔奖评委组织是发现不了。我们从历届经济学奖的得主看,就可发现,他们的经济学思想是有局限性的。这些得主的贡献主要体现在技术层面的经济学研究,他们对人类思想的影响远不如我们想象的以及主流媒体吹嘘的那样大,而且,在诺贝尔经济学奖设立之前,经济学界出现了很多经济学大师,但设立之后思想大师反而急速减少了或者说被主流淹没到民间了。

     这个例子我是想表达,不要把悬赏者看成至高无上,他是悬赏者,也是和我们一样是去寻找更高悬赏的应征者。敢于学习,还要敢于挑战。因此社会要发展,是一个无限寻找悬赏者的过程,而不是一个寻找威权的过程,民不畏威,则大威具矣。