《概率理论的线性局限分析》
概率理论在我们的学习、生活、和工作中,被非常广泛的应用着,但是,概率理论实际上也存在线性局限。
朋友:“概率理论”在16世纪就被创建了,这么多年来,概率理论越来越成熟和发展,难道这个理论还会存在什么线性局限吗?
商:老弟真健忘……“欧氏几何”的“资格更老”,我们上次不是刚刚讨论过它的线性局限吗?
朋友:“欧氏几何”与概率理论是有区别的!“欧氏几何”是关于两点一直线的理论,是一个研究确定性问题的理论;概率理论不是研究确定性问题的理论,是研究偶然性和必然性之间关系的理论,它不是两点之间一直线的理论,怎么会存在线性局限呢?
商:你说的不错!我在很长的一段时间中,也没有怀疑过它的正确性。但是当我用非线性思维模式重新审视概率理论后,发现了它也同样具有线性局限性。我们今天就专门讨论一下这个问题。
先看一个例子。假定我们有一串珍珠项链,把它弯成一个半圆后,尽量使这些珠子互相紧挨着没有缝隙,再把串珠子的线拉紧后打个结。
然后我们把这串珠子拉直,这时,这些珠子之间就会产生空隙。我们再把串珠子的线拉紧,再打个结,使这些珠子之间再次紧挨着没有缝隙。显然,我们现在再也无法让这串珠子弯成圆弧状了。
朋友:(过来摸摸我的脑袋)……老兄发烧了?珍珠项链与概率理论有什么关系啊?!
商:不要着急啊!我用这个例子想告诉你,尽管这串珠子的个数和珠子的形状在这两种情况下没有任何改变,这些珠子之间也一直是紧挨着的,但是,为什么按直线形状紧密排列的珠子,就无法弯曲了呢?
朋友:因为在这串珠子排成直线时,相邻两颗珠子圆心之间的距离等于它们的直径。在这串珠子弯曲排列时,串珠子的线明显比珠子直线排列时要长,说明在珠子弯曲排列的状态下,紧挨着的两颗珠子的圆心之间的距离,大于它们的直径了。可是这与概率有什么关系啊?
商:不要着急,听我慢慢讲。现在我们在一个直角坐标系上画一个半圆,让这个半圆的直径与X轴重合,圆心E落在X轴的原点上,如下图所示。
朋友:不错……这好像与那串珠子有关,但是与概率有关吗?
商:哈哈哈,别着急啊,迟早会与概率有关啊。现在我们不考虑Y轴的问题,只考虑X轴。我是不是可以这样说,这个半圆上的所有的点,都与X轴上的点一一精确对应?
朋友:可以这样说啊,因为这实际上就是把半圆投影在X轴上。
商:很好。那么我是否也可以这样说,这个半圆上的点与这个半圆直径上的点是一样多的?
朋友:……等一下,你好像在出花样了!……但是这个说法确实并没有错啊!
商:当然没有错啦!你为什么说我在出花样呢?
朋友:因为我估计你接下来会告诉我,这就证明半圆弧与直径是一样长的!
商:哈哈哈哈,你太英明了!我正想这样告诉你呢!因为我们知道,所有的点都是一样的,圆就是在一个平面上,与定点距离都相等的点的轨迹,既然半圆弧与直径上的点是一样多的,它们理应一样长啊,难道你认为不对吗?
朋友:我确实在纳闷,怎么会得到这样一个匪夷所思的推论呢?
商:不要着急,我还要再举一个更令你匪夷所思的例子。
我们再来看看下图:
图中的线段AC与AB显然是不一样长的,但是我们很容易证明,AC上的点,与AO上的点是一样多的,与CO上的点也是一样多的,因为AC上任何一个点的纵坐标,就是Y轴上的一个精确和唯一对应的点,它的横坐标,就是X轴上的一个精确和唯一对应的点。你不可能在AC上找到任何一点是没有纵坐标或横坐标与它对应的,你也不可能在AC上找到两个点,它们对应同一个纵坐标或横坐标。
同样道理,AB上的点,与AO上的点和BO上的点也是一样多的。
这里显然出现问题了,因为AO上的点与AC和AB上的点是一样多的,所以AC上的点与AB上的点也是一样多的,可是它们明明不一样长啊?更离奇的是,因为CO 和BO上的点都与AO上的点一样多,所以CO与BO上的点也是一样多的,CO与BO是在同一根直线上的,CO与BO上的点怎么可能一样多呢?
朋友:我都被你搞糊涂了!我这几十年来,一直在用数学搞工程设计,尤其是经常用坐标系来作图和计算,怎么没有发现这么简单的一个逻辑矛盾呢?
商:这有什么稀奇?你住了那么长时间的房子,你发现房子两边的墙壁是不平行的吗?
朋友:这两者是不能类比的!房子的墙壁不平行,是因为房子的墙壁都垂直于地面,但是我们的地面实际上是个球面,因此房子实际上都是扇形的,扇形房子的墙壁当然就不平行了。这是真实世界与理想的理论世界之间的矛盾,很容易理解。但是你今天说的矛盾,是发生在理想的理论世界中的,这很难理解!
商:你的思路很清晰啊!不错,这两个矛盾的性质是不同的。我通过这个例子想告诉你的,就是不要认为数学是绝对精确的、严密的、自洽的,数学在这个例子上显现出来的矛盾,在其他很多地方都会显现,数学出现这类问题,就是“整数维三维空间概念”的线性局限问题。
朋友:你能解释一下吗?
商:可以。我在前面的文章已经多次谈到,我们现在大家脑子里的三维空间概念,都是整数维的三维空间概念,也就是维度都是整数的,如果一根直线有一点点宽度,它就变成两维了;一张纸由于有一点点厚度,它就是三维了,所以我们定义乌龟和鸟都是三维动物,实际上它们几乎相差了整整一维! 同样道理,数学上关于点、线、面的定义,都是绝对的整数维的概念,实际上我们很容易从一个更常见的现象中发现问题:曲线是一维的,没有面积和体积,为什么任何曲线都不能在一维坐标上存在?很多曲线(譬如否定之否定系统的发展轨迹——螺旋线)甚至不能在两维坐标上存在?
朋友:是啊,我怎么就没有想过这个问题呢?你又如何用分数维的概念来分析这个问题呢?
商:很简单啊,因为按非线性的连续维度概念,曲线都具有大于1维的分数维,所以不可能在1维的坐标系上存在;如果曲线的分数维大于2维,就无法在2维的坐标系上存在。同样道理,任何曲面都具有大于2维的分数维,所以任何曲面都无法在2维坐标系(平面)上存在;克莱因瓶是个曲面,具有大于3维的分数维,所以只能在4维空间中存在……
朋友:我理解你说的意思,可是我希望你还是先对刚才说的问题做个解释。
商:好的。我们来看下图:
从这两个图中我们可以明显的看出,假如半圆弧与直径上的点是严格一一对应的,那么显然,半圆弧上的点与点之间一定有空隙。同样道理,斜线段上的点如果与坐标轴上的点是严格一一对应的,斜线段上的点与点之间也一定有空隙。我们还可以明显的看到,半圆弧中点与点之间的空隙是不均匀的,圆弧切线的斜率越大,空隙越大。
这个事实我们很容易用一个最简单的实验来论证,任何人都可以试一下。拿十来个硬币,沿着桌子的边,一个紧挨一个的排成一条直线,然后你把这些硬币一个个垂直桌子边向上移动,让它们排成一条圆弧,那么你就会发现,这些硬币之间一定会出现空隙。如果你先把硬币紧挨在一起排成弧线,那么你就没有办法将这些硬币“摊直”到桌边排成一条直线,它们一定“挤不下”。
朋友:我明白了,说点是0维的,是没有面积和长度的,又说线是点的某种轨迹(或集合)……这些都是线性理论人为的规定,显然这种规定就是产生逻辑矛盾的原因。但是线性理论又是很好用的,这种逻辑矛盾在应用中并没有给我们带来太大的影响啊。
商:你说的不错,因为在这里没有人关心点的多少问题,大家关心的是长度问题,数学用公理化的办法规定了测度的概念,掩盖了这些点之间出现的空隙问题,保证了数学运算的正常进行。但是掩盖矛盾不等于解决矛盾,所以这些矛盾还是客观存在的。
朋友:分形理论能够解释这些矛盾吗?
商:可以的。我来解释一下:按非线性的连续维度观点来看,真实世界是连续维度的,在真实世界中不存在0维的点,0维的点只在理论上存在。但是,即使在一个线性的理论体系中,也不是所有的点都是0维的。假定我们设定坐标轴的点是0维的,那么半圆弧上的点,就不是0维的,而是具有大于0维的分数维度的,因为这些点“占据空间的能力”,比在直线上的点要大,而我们用于度量系统占据空间能力大小的“尺度”,就是该系统的维度,所以,占据空间能力大的点,一定具有大于0维的分数维度……
朋友:等一下,我有二个问题先请你回答一下,第一个是,你一直在说整数维的三维空间概念是离散结构系统,你能不能用个具体的例子来说明一下?第二个问题是,从前面的分析我们知道,半圆弧的长度大于直径,是因为组成半圆弧的点与点之间有空隙,你为什么不提及这些空隙问题呢?
商:你问的太好了!先回答你的第一个问题。以我们上面谈及的两维坐标系为例,这个坐标系实际上可以看做是一张“方格图”(见下图),
这些方格是由无数条分别平行于X轴和Y轴的直线组成的,坐标的精度决定了这个方格图中格子的密度,在这个方格图中,任何曲线都由一组点阵组成,很像我们生活中的十字绣,实际上我们用的计算机屏幕和数码电视机也是这样的方格图。当我们把计算机屏幕上的曲线不断放大后,我们就能看到这些曲线其实是由互相没有联系的点阵组成的,它们是不连续的、是离散的。所以坐标系统是个典型的离散结构系统。
朋友:你这样一说,我就明白了,在整数维三维空间中,实际上是不存在连续结构系统的,只是当坐标系的格子取得足够密的时候,这些点看上去连在一起了,才会像一根连续的曲线。线性理论用点是没有面积和长度的、直线上的点是无穷多的,来掩饰这个结构的离散问题,但是这个理论是无法解释半圆弧与直径上的点是一样多、但是长度却不同的问题,因为不管坐标的精度取得多高,我们只要把图形一放大,我们就可以清楚的看到,两者的点确实是一样多的,但是两者“占据空间的能力”是不一样的,圆弧上的点与点之间的空隙大于直线上点与点之间的空隙,并因此而造成两者的长度不一样。另外,坐标系的精度再高,只要一放大,结构的离散性就一目了然了。
问题是,线性理论的创建者一定也知道这个问题,他们为什么不解决这个问题呢?
商:问得好!我来解释一下。因为从这张方格图上我们可以看到,组成图像的点阵中的每一个点,都是有一组确定的Y轴和X轴上的坐标定义的,但是这些点之间的空隙是非常不规范的,是非线性的,也是无法定义的。而且不管你把坐标定义到多密,这些空隙是永远存在的,所以任何整数维坐标系对这些空隙是无法描述和“管辖”的,我们也不可能另外搞一个系统去定义这些空隙。因此,离散结构的数学对此是无能为力的,于是只能把眼睛一闭,回避这个问题。
我们不妨再来看一下下面这两张半圆的图,比较一下它们的差异,问题就更清楚了:
在这个图上,半圆上的点与直径上的点完全一样多,但是,这个半圆实际上是“残缺”的。
在这个图上,半圆弧不“残缺了”,因为我们加上了一些点,所以这个半圆弧上的点是多余X坐标上的点的。我们很容易看到,这些加上去的点,是这个坐标系无法表达的。上图中那些白色的小圆点,它们有确定的Y轴坐标,却没有对应的X轴坐标;同样,我们可以发现,那些我们用虚线方框框住的点,它们有对应的X轴坐标,却没有对应的Y轴坐标。
朋友:这是不是因为坐标轴的精度不够引起的呢?如果我们让X轴的坐标再密一点,这个问题还存在吗?
商:哈哈哈,老弟仔细想一下,如论你把密度定的多高,我都把图可以放大,一直放大到这个图所示的状况,所以精度问题无法解决这些矛盾。因为这是维度问题,与尺度和精度无关。图中那些有Y轴坐标没有X轴坐标的点,实际上对应的是X轴的分数维坐标;同样,那些有X轴坐标却没有Y轴坐标的点,对应的是Y轴的分数维坐标。遗憾的是,整数维三维空间的坐标系,是没有分数维度的概念的,所以在整数维三维坐标系中,这些点实际上是无法标出来的,只能表现为“空间”。
所以在整数维三维坐标中,半圆弧只能按下图表示,线性的整数维三维系统对这些空隙只能“置之不理”。
但是分形理论却可以处理这些空隙问题。我们先把这些空隙的存在和变化归属到点,也就是由点去“管辖”这些空隙,因为点在坐标系中是被精确定位的。再用坐标系中不同状态下的点具有不同的分数维度,来处理因空隙而带来的点的占据空间的能力大小问题,也就是维度大小的问题。这样处理问题,既顾及了这些空隙增加了这些点占有空间的能力,又无需对这些空隙重新设立新的坐标标识。所以,我们认为这些点具有了大于0维的分数维度,并依据这些空隙的大小,确定它归属的点的维度大小,来描述这些点的占据空间能力。通俗的讲,就是由于点与点之间空隙的存在,使得这些点加上空隙,变成了具有微小长度的“微线段”,不同点的不同的分数维,决定了这些微线段不同的形状和长度。所以分数维的概念,把离散的点变成了连续结构系统。在非线性理论的分数维概念出现前,线性理论怎么可能来解决这个问题呢?所以,所有的线性理论都是离散结构理论。
分形理论告诉我们,由于半圆弧上的点占据空间的能力大于坐标轴上的点,具有大于0维分数维,因此半圆弧上的点虽然和直线上的点是一样多的,但是它们总的长度是不同的。同样道理,同为直线,如果这些直线的斜率不同,那么斜线上的点,占据空间的能力大于坐标轴上的点,也就是它们的分数维度大于坐标轴上的点,因此长度也不同。
朋友:你这个说法能够解释半圆与直径上点是一样多的问题了,可是,你这个观点没有办法解释上图中那两个斜率不一样的线段,它们在X轴上的点数是一样多的问题啊?
商:老弟问的太好了!跟你这样一个较真的朋友讨论问题真是一种乐趣!
注意听我的解释:两个正交的直线组成的坐标系,是整数维度的两维空间,在这样的坐标轴上的点,被精确定义为0维,而且在坐标轴上,刻度是绝对线性均匀的。在这样的一个坐标系统中,只要一个斜线段不是45°角倾斜,它上面每一个点虽然精确的对应Y轴和X轴上的一组坐标,但是组成这组坐标的两个点(x和y),在Y轴上和X轴上“占据空间的能力”不是一样的,也就是斜线段上点的“微线段”,在Y轴上的投影与在X轴上投影是不一样的。
朋友:我明白了,我们在这里可以用合力和分力来做比喻。在一个直角平面坐标系中,一个表示合力的矢量如果不是以45°角倾斜的,那么这个合力在Y轴上的分力与在X轴上的分力是不一样的。
商:就是这个意思!也就是说,尽管斜线段在Y轴上投影的点(微线段)数与在X轴上投影的点(微线段)数是一样多的,但是,这些微线段的长度是不一样的。
因此,在上面这个图中,AO、AC、AB、CO、BO上的点数(微线段数)确实是一样多的,但是,由于这些点(微线段)的分数维其实都不一样,所以这些微线段的长度是不一样。在这里我要提醒大家注意两个概念,第一个是,坐标轴本身也是由点组成的,但是坐标轴的点实际上只是一种刻度,是绝对均匀和线性分布的;第二个是,如图所示,同一个Y轴坐标对应了两个斜线段上的两个点,但是这两个点对应的X轴的坐标是两个,不是一个。见上图,Y1对应的是AX1和BX1、Y2对应的是AX2和BX2,所以AX和BX是两套不同的坐标,只是用同一根X轴来表达,尽管AX和BX 有同样多的点(微线段),但是它们的微线段的长度不一样,所以CO和BO的长度不同。
朋友:你这个说法听起来是有道理的,可是我总觉得有点不对劲啊?
商:哈哈哈哈,很正常啊!因为在你的脑子里,整数维三维空间的概念很深,在你的概念中,数轴上的点都是没有面积和长度的0维的点,所以对在同一根坐标轴上,拥有同样点数的两个线段却不一样长,是难以想通的。但是在非线性连续维度的概念中,点是可以有分数维度的,也可以说是有长度的,点的分数维的维度不同,点的长度也不同,所以用同一根坐标轴来表示同样的点数,由于这些点的长度不同,它们在坐标轴上占据的长度就不同了。
从哲学角度看,整数维三维空间坐标是“看不到(或者说不承认、或者说忽略)”存在于点与点之间的空间的,在真实生活中,它们其实不是空隙,也是点(就像我们加上去的那些白色的点和用虚线方框框住的点,只是这些点在坐标轴上找不到对应的坐标,因为这些点具有分数维度,整数维的坐标系统无法标定具有分数维度的点。这就是很多朋友都跟我说的,如论如何也想象不到分数维系统是如何在三维空间中存在与表现的根本原因。
由于尺度和精度的变化不会改变维度,所以对于分数维系统,我们一定要改变“维度”的观念,才能“看到”和理解。
朋友:好像我开始有一点想通了……,可是,我们讨论的这一切,与概率理论有关吗?
商:不要着急,分数维的概念不只是对空间结构有效,它对于功能结构和序结构也是有效的。我们现在所讨论的是分数维在空间结构上的表现,概率理论是研究偶然与必然、可能与不可能、有序与无序等矛盾的理论,我下面会说明,分数维的概念在功能结构和序结构中,也是一种客观的存在。
由于概率理论研究的是充满辩证特征的可能性问题,但是构建概率理论的逻辑,还是严密的形式逻辑,所以概率理论也是个离散结构系统,用离散结构系统区解决辩证问题,系统的线性局限是不可避免的。
我们先来看一个典型的古典概率的例子:
一个袋子里有9个材质、形状、重量都一样的小球,现在我们用1、2、3三个数字来给这9个小球做标识,每个数字标3个小球。我们随机摸3个小球,请问:摸到3个数字相同的小球和摸到3个数字都不同的小球,哪个概率大?
朋友:这个问题很简单,3个数字相同的小球只有3个组合:111,222,333;而3个数字都不同的小球有6个排列(123,132,213,231,312,321),所以答案一定是摸到数字都不同的3个小球的概率大。
商:很好。现在我们用三种不同的颜色分别代替三个不同的数字,给这些小球上涂上红兰棕三色,每种颜色涂3个小球。
我们还是随机摸3个小球,问:摸到3个颜色相同的小球和3个颜色都不同的小球,哪个概率大?
朋友:与上题的答案类似,颜色相同的3个小球只有三个组合——红红红、蓝蓝蓝、棕棕棕;颜色都不同的3个小球有6种不同排列(红蓝棕、红棕蓝、蓝红棕、蓝棕红、棕红蓝、棕蓝红),所以答案一定是摸到颜色都不同的3个小球的概率大。
商:很好。现在我们再在三组颜色相同的小球上分别写上123三个不同的数字,如下图所示:
1 2 3
1 2 3
1 2 3
于是,在这9个小球中,颜色相同的小球,数字一定不同;数字相同的小球,颜色一定不同。
我们还是随机摸3个小球,问:概率最小的是摸到什么样的3个小球?
朋友:……你好像又在搞花样了!
如果我回答“摸到3球颜色相同的概率最小”,那么颜色相同的3个小球上的数字一定不同,这是同时发生的必然事件,显然,我们在前面刚刚讨论过,摸到3球数字不同的概率一定不是最小的。
如果我回答“摸到3球数字相同的概率最小”,那么数字相同的3个球的颜色一定不同,这也是同时发生的必然事件,摸到3球颜色不同的概率一定不是最小的。
太奇怪了!这好像是一个悖论啊?概率是门严密精确的数学,怎么可能得到如此矛盾的结果呢?
商:不要奇怪,我们来分析一下其中的原因。
我们先来研究一下,这里颜色和数字的互相关系。如上图所示,如果我们按行取球,那么无论取哪一行,取到的3个小球的颜色一定相同,但是数字一定不同。如果我们按列取球,那么无论我们取哪一列,取到的3个小球数字一定相同,但是颜色一定不同。因此,颜色和数字在这里的关系是一种“正交”的关系。
从哲学角度看,两个处于正交关系的标识,两者之间就是一种对立统一的关系,对立在数字相同的球,颜色一定不同;颜色相同的球,数字一定不同。统一在颜色和数字是等价的,只要旋转90°,两者的关系就互换。对立统一关系的逻辑特征就是辩证逻辑。
数学是严格遵守形式逻辑的科学,是以形式逻辑为生命(存在前提)的,因而绝对排斥辩证逻辑。所以在同一个题目里,它只能认定同时出现的两个正交特征中的一个,而将另一个排斥。
我们以“数字”作为标识特征来具体论证上述结论:
我们随机摸3个小球,当3个球的数字都不同时,会出现六种排列(123,132,213,231,312,321);而3个球数字相同时,却只有三个组合 ——111,222,333 ,不是排列,为什么这3个球不能排列呢?我们很清楚的知道,这里的3个1(或3个2、3个3)肯定不是同一种球(看颜色就知道,3个1其实是三种不同颜色的小球),完全可以排列,也应该排列,但实际上你就是排列了,也没有用,因为排列后产生的各个项,会因为它们的数字相同而被压缩(同类项合并),原因在于形式逻辑在这里只认数字,数字相同的小球,虽然颜色不同,但无论你如何排列,它们都只是同一个数字,所以被合并(压缩)了!
以“颜色”作为标识特征,也能得到相类似的分析结果。
这个现象显然与计算概率的理论相悖,根据概率的计算理论,任何一种可能出现的排列或组合,就是一种可能出现的基本事件,在计算概率时,都应该被包括进去,不能因为形式逻辑“识别能力”的局限,遗漏了不该遗漏的基本事件,因为这些排列客观上是存在差异的,并不是同类项!
遗憾的是,形式逻辑只能识别一个特征,除非你用两个特征的组合作为条件,这就是条件概率了。但是,没有人规定遇到这种情况必须用条件概率来解决问题,关键看提出问题的人是否给出条件。
我有意提出了一个没有条件的问题,也就是摸到什么样的3个小球概率最小,于是就出现了上述的“悖论”。
朋友:我明白了,所以我的答案应该是摸到3个小球颜色相同或者数字相同的概率最小。
商:是的,因为我的问题没有给出条件,你的答案就只能包括这两种可能。这个例子告诉我们,数学所严密遵循的形式逻辑,在遭遇具有辩证逻辑内涵的两个正交特征时,其中一个特征会失效。
朋友:你说得不错,但是我们可以用求条件概率的办法来解决这个问题。
商:你说得很对,因为所谓条件概率的办法,在这道题目里,就是把两个互相正交的特征,“摊直”在一个维度上,用逻辑“与”的办法将这两个标识组合成一个新的两维码标识,使得形式逻辑也能够识别。
朋友:你说得不错,所以,你说的这个矛盾是可以解决的。
商:但是,概率理论还存在其他难以解决的矛盾。
下面我还是用这9个小球为例来说明我的观点。
请你来计算一下,如果我们只判断颜色,不考虑数字,我们随机摸到3球都为红色的概率是多少。
朋友:这个不难啊,3球同色的组合只有3个(其中一个组合是3球都为红色),3球颜色都不同的排列有6个,2球颜色相同、1球颜色不同的排列组合有18个,所以共有27个基本事件,因此3球都为红色的概率为
同样道理,如果只看数字,不看颜色,3球数字相同的概率也是
商:很好啊!我们现在换一种计算的办法。
由于我们在把手伸进袋子里摸小球的时候,没有规定要一下子摸到3个小球,完全可以一个一个的捏进手里,所以,我们可以根据这个过程,采用另一种计算概率的办法。我们在摸第一个球的时候,摸到红球的概率为
为什么这个计算方法与刚才算出来的结果差异这么大呢?我想看看你是如何来解释这个矛盾的?你总不至于说,一下子摸3个小球和一个一个的捏小球会影响摸到小球的概率吧?
朋友:……确实有点奇怪啊?!……也许是你的那个计算概率的办法有点问题,我不是太确定……
商:好,我们再换个办法。下面我们给这三种颜色的9个小球标上1-9的数字,如下图所示:
1 2 3
4 5 6
7 8 9
现在再请你算一下,随机摸到三球的数字为123的概率是多少?
朋友:很简单啊,做个排列组合就可以了。由于9个小球的数字都不同,所以,每次摸3个小球的排列组合为:
商:很正常啊!因为数字为123的3个小球就是颜色为红色的3个小球,结果当然一样了!问题是,为什么我们不在颜色球上写数字,你算出来的结果是
朋友:说实话,我被你搞糊涂了!但是我们如果不在颜色球上写数字,只根据颜色来排列组合,确实只能排出27个基本事件啊!
商:你说得不错,随机摸3个小球,假定我们按小球的颜色排列组合,只能得到27个基本事件。假定每一个小球都有确定的数字标识,按数字排列组合(这次不会有任何遗漏),我们可以得到504个基本事件。原来,形式逻辑对“正交”特征的排斥,不仅排斥了同色小球的排列,也排斥了不同色小球的组合!
形式逻辑排斥辩证逻辑——这就是《概率理论》在这里出现问题的根本原因!你也看到了,面对同一个情况,概率计算却可以得出差异很大的不同结果。
朋友:我明白了,尽管在颜色球上是不是写数字、写什么样的数字,按理是不应该影响摸到3个红球的概率的,但是由于概率理论遵循的是严密的形式逻辑,它的计算结果完全依据它对计算对象识别的能力(精度),所以,按概率理论得到的计算结果,只能作为一种参考,因为它的计算结果取决于对标识的识别精度。
商:你说的不错。我用乒乓球做过多次试验,实际上摸到三球都为红色的概率远远大于
朋友:我想不出还有什么问题,你觉得还有什么问题呢?
商:我们现在来回顾一下最初对珍珠项链的讨论,那个讨论告诉我们,串成直线的珍珠如果紧挨着,就不能弯成曲线形状;弯成曲线的珍珠串上的珍珠即使紧挨着,把它们拉直后,珠子之间会产生空隙,说明珠子在按不同形状排列时,占据空间的能力是不一样的。随即我们对整数维三维空间概念的直角坐标系做了分析,指出,把点定义为没有面积和长度的0维的理想质点,即使在理论世界,也无法掩盖不同曲线上的点,具有分数维度的本质。
事实上概率理论也存在同样的问题。
在我们计算概率时,规定所有的基本事件发生的概率都是相同的,譬如,在你前面计算的那道题中,随机摸3个小球,如果按颜色做标识,共有27个基本事件,概率理论规定这27个基本事件发生的概率是一样的,这就像数学规定所有的点都是0维的一样,必然带来线性的局限。
朋友:我明白你的想法了,你认为基本事件本身发生的概率不一定是一样的,也就是说,随机摸3个小球的27个组合中,可能有些组合(事件)发生的概率大一点,有些组合(事件)发生的概率小一些,是这个意思吗?
商:是的。我认为概率也应该是个分形系统,基本事件就像上面我们说到的点,也具有不同的分数维度,点的分数维度决定了它们“占据空间的能力”;概率基本事件的分数维度决定了它们“占据事件发生可能性的能力”。如果我们把偶然与必然、有序与无序看成“功能空间”或者“序空间”,那么,我认为概率计算中的基本事件,也有不同的分数维度,这种分数维度表征着不同的基本事件“占据功能空间或序空间的不同能力”。
朋友:你的这个说法我还是第一次听到,好像有点意思。不过仔细想想,我们把所有的基本事件都看成等价的,主要是为了概率运算可以进行下去,如果基本事件不是等价的,我们就无法进行概率计算了。
商:你说的不错,就像我们不规定点都是0维的,线都是1维的,就无法建立几何体系一样,如果我们不规定基本事件都是等价的,就无法建立概率体系。所以我不否定这种规定的必要性,因为线性理论就是忽略一切非线性特征,只研究线性特例的。我想提醒大家的是,正是这种规定,造成线性理论一定有局限性和存在逻辑矛盾。就像我在第一本书中对“欧氏几何”和“牛顿力学”的分析、我在前面对半圆弧和直径上的点的分析……
朋友:我希望你举个具体的例子,来说明概率理论的这个局限性。
商:好的。扔硬币是我们大家都熟悉的一种抉择手法,即使在奥运会这种国际级的重大比赛中,裁判员也都用扔硬币的办法,来“公平”的决定比赛双方谁先开球或选择场地。我下面就用大家都熟悉的扔硬币为例,来说明我的观点。
AB两人用扔硬币赌博,正面向上A赢,反面向上B赢。两个人赌了一会,来了第三者C,C也要参与赌博,但是由于扔硬币只有两种结果(硬币“站着”的结果几乎不会发生,所以被排除),C表示他通过把赌注押在A或B一方,来参与赌博,A与B都同意了。但是C并不是每次都下注,他要看到A或B连输几次,才把赌注押在输的一方。这样赌了一会儿后,A与B发现,他们之间的输赢相当,但是他们都输钱给C了。于是,他们提出C的这种赌法是不公平的,因为我们都知道,尽管在一定次数中统计扔硬币的结果,出现正面与出现反面的结果未必相等,但是扔硬币的次数越多,出现正面与出现反面的结果会越来越接近,扔硬币时两面出现的概率总是趋向于50%。所以如果A与B有一方连输了几次,再输的概率就小了,因此,A和B都认为C的这种押注方法,赢的概率大,不公平。
朋友:我觉得他们的意见是对的,C赢的概率大,而且即使C的某此下注输了,他一定会继续押在输的一方,很容易赢回来……
商:哈哈哈,老弟,我问你一个问题:硬币有意识吗?
朋友:没有啊!
商:那好,我再问你,硬币知道它前面已经出现了几次正面(或反面)向上的结果吗?
朋友:当然不会知道。
商:那么我问你,我们都知道每一次扔硬币的结果,出现正面或出现反面的概率是一样的,都是50%,既然硬币不知道前面扔硬币的结果,也不会因为前面的结果“主动”改变这次扔硬币的概率,那么C的押注法有什么不公平呢?所以C坚持说,他赢的概率也是50%,
朋友:……是啊,听你这么讲也很有道理!硬币是没有意识的,我们每一次扔硬币的概率与前几次的结果是没有关系的,任何一次扔硬币都是独立事件,正反面出现的几率是一样的,所以C的说法有道理。
商:A和B反驳C说,我们说每一次扔硬币正反面出现的概率都是50%,是一种理论上的计算结果,因为在这个概率计算中,只有两个基本事件,理论上认定基本事件出现的概率是一样的,所以正反面出现的概率都是50%。但是我们从统计学的角度看,如果我们画一条直线,在直线上均匀刻度表示扔硬币的次数,然后我们把扔硬币时硬币正面向上作为一个点记在直线上方,反面向上记在直线下方,如果连着出现正面向上(或者反面向上),就把点标记在前面那个点的上方(或下方),扔了一定次数的硬币后,我们很容易发现,这些点有一个明显的特征——回归特征,也就是不管直线上方或直线下方的点,都有一个趋势,就是回到直线的附近。离开直线的距离越大的点,出现的频率越低。
如果C的押注固定在某一个人处,那么C赢的概率也是50%,但是C的押注是有选择的,他总是选择点子离开直线的距离大的时候再押注,也就是他总是选择点的轨迹可能出现回归特征的时候押注,所以C赢的概率就大了。
朋友:对啊!尽管C每一次下注时,扔硬币正反面出现的概率都是50%,但是,他的下注是有选择的,我怎么就没有想到统计学里的回归特征呢?还是A和B有道理。
商:不要急着表态!C反驳他们说,你们说扔硬币正反面出现的概率为50%,是理论上计算的结果,不错!但是你们说的回归特征也是理论上的特征,你能画一条曲线出来,然后确保每一次扔硬币的结果都与这条曲线相符吗?你根据一次实践的结果画出曲线,能代表其他次实践的结果吗?统计结果是我们人类思维的结果,不是硬币思维的结果,硬币知道自己什么时候要“回归”吗?它在每一次被扔的时候,不还是按50%的概率出现正反面吗?
朋友:是啊!统计结果与硬币是没有关系的,C说得对,硬币根本就不懂什么统计和回归概念的!
商:哈哈哈哈,提醒你一下,老弟现在可不是修正主义,而是机会主义了!机会主义在学术讨论中是最忌讳的!
朋友:老兄不要取笑我,你能给出一个有倾向性的意见吗?
商:当然可以啊!我认为AB的说法是对的,C这样下注是不公平的,赢的概率大,实践也能说明这一点,你敢叫个朋友来,让我按C的办法与你们两个一起赌吗?
朋友:我也觉得C的赢面大,但是,你是研究哲学的,你这么说,总应该有内在的道理吧!?
商:当然有道理!我的道理与AB说的道理不同。我认为每次扔硬币出现正反面的概率不是确定性的50%,而是一种分形,有内在的自相似性……
朋友:什么意思?你是说每一次扔硬币正反面出现的概率都不一样吗?它与什么自相似呢?
商:与前面曾经出现的正反面次数有内在的联系。
朋友:老兄,我要提醒你,你可不要变成唯心主义啊!硬币难道有灵性啊?
商:哈哈哈,老弟不要那么健忘!我在介绍伯纳德花纹时就告诉你,水分子是没有灵性的,但是它们却在一定的条件下“自动组织起来”,形成了极其规则的六角形花纹;蜜蜂是没有几何学知识的,数以千计的蜜蜂却会协同工作,极其有序的建成规则的六角形蜂窝。
朋友:你的意思是说,硬币也会自动的按前面硬币出现正反面的情况改变每一次扔硬币的概率?
商:不错。
朋友:我需要科学的证明!
商:好啊,请你做一道题目。有一袋只有红白两色的小球,其中红色球和白色球各占一半,每次从袋子中摸一个小球出来,再放回去。请问,连续3次摸到红球的概率是多少?
朋友:很容易啊,因为红白小球各占一半,所以每次摸到红球的概率是50%,连续3次摸到红球的概率就是50%X50%X50%=12.5%.
商:那么扔硬币连续出现3次正面(或反面)的概率是多少呢?也是12.5%吧?所以C在看到硬币连续出现两次同样的面之后,认定后面再出现同样一面的概率肯定很小了,概率计算的结果也是这样告诉我们的,连没有灵性的硬币也一定是这样认为的,所以C的赢面就大了,不是吗?
朋友:……啊、啊、啊……你说的对啊!既然按概率的计算规则,我们可以得到硬币连续两次出现同一面的概率只有25%,那就说明,我们在扔硬币时,看到刚扔的硬币是哪面向上,就知道再扔硬币出现另一面的概率更大一些,如果看到被扔的硬币连续两次出现同一面,就知道再扔硬币出现另一面的概率更大。这与“每一次扔硬币出现正面或反面的概率都是50%”的定义是矛盾的!
商:是的!这就是线性理论的局限性和无法避免的内在矛盾。就像说点是0维的,又说线是点的轨迹或集合一样,只有非线性的分数维理论可以解决这些矛盾。所以就扔硬币这个系统来讲,实际上每一次扔硬币与前几次扔硬币是有联系的,所以概率其实也是一种连续结构的分形系统,而不是离散结构系统。把每次扔硬币说成独立事件,并认定每一次扔硬币两个面出现的概率都是50%,但是根据概率的计算法则,又可以得出扔硬币时连续两次出现同一面的概率为25%,互相之间是矛盾的。这个矛盾与前面我们讨论的点与线矛盾的例子,本质是一样的,只不过点与线矛盾的离散特征表现在空间结构上,概率对独立事件的定义与概率计算结果矛盾的离散特征表现在时间结构——序结构上。
朋友:我现在明白你为什么在讨论概率问题前,先与我讨论项链的问题了,因为点的0维的定义与点在不同情况下占据空间能力不同的矛盾,是离散结构系统在空间结构上的表现,空间结构是“可见”的,所以很容易被看到和被证明。而概率把所有的基本事件定义为等价的、与概率计算结果之间的矛盾,是离散结构系统在时间结构(序结构)上的表现,时间与序是“不可见”的,所以不容易被发现和被证明。但是在你看来,两者的本质问题是一样的,都是维度的问题,都是分数维与整数维三维空间概念的矛盾,是这样吗?
商:你理解得很对!事实上维度的概念远比方向、尺度、角度、标度、精度、速度、有序无序、规则不规则……等概念要重要得多,看问题的维度不对时,我们用上述这些概念对一个系统做的判断,都会出错。就以海岸线的长度为例,在我们没有分数维的概念时,会觉得海岸线的形状极其不规则,因而无论我们怎样改变尺度、角度、精度……都无法测出海岸线的长度;但是当我们意识到海岸线是一个分形系统、具有分数维度以后,海岸线就变成一个很规则的系统的,测出海岸线的分数维以后,海岸线的长度测量问题就迎刃而解了。同样道理,只要具有了分数维的概念,那个半圆弧与直径上的点子一样多的问题、斜线段上的点子与XY轴上的点子一样多的问题、每一次扔硬币的概率与概率计算结果的矛盾问题……都迎刃而解了。我在第一本书中反复强调,对于线性理论,我们不仅要“知其然、知其所以然”,还要“知其不然、知其所以不然”。
很高兴你现在意识到了,我在讨论珍珠项链时,并没有发烧啊!
朋友:哈哈哈,老兄气量这么小啊?还在记仇啊?
商:不是记仇,老弟与我讨论时的种种表现,是很有代表性的。在分数维的概念没有被别人接受之前,我用分数维观点表达对大家所熟知的系统的不同看法,往往被别人视为在发烧,在说胡话。包括我们党派的一些专家学者在内,他们在拿到我的一些文章后,粗粗一看,就认为我在说胡话,是典型的民科和草根学者,是想骑着自行车上月球……
讨论到这里,我相信你很容易发现,线性理论的局限性,我们完全可以用线性理论本身来发现和证明,只是由于我们自己的思维模式也是线性的,就会对这些问题熟视无睹。
朋友:是啊!我只是不太相信,为什么那么多年来,专家学者也没有看出这些问题呢?
商:我也很纳闷啊!不过,也许我再举一个例子,你会更吃惊!
朋友:是吗?
商:你知道有个著名的概率计算的结果——“生日悖论”吗?
朋友:知道啊!我们在学概率理论的时候,老师特意讲了这个例子,并告诉我们,不要怀疑理论计算的结果,即使这个计算结果很令人意外,但是往往错的是我们的直觉,而不是理论计算。
商:你知道就好,为了方便不知道的读者继续看这篇文章,我还是把百度百科对生日悖论的介绍摘录一下:
生日悖论是指,如果一个房间里有23个或23个以上的人,那幺至少有两个人的生日相同的概率要大于50%。这就意味着在一个典型的标准小学班级(30人)中,存在两人生日相同的可能性更高。对于60或者更多的人,这种概率要大于99%。从引起逻辑矛盾的角度来说生日悖论并不是一种悖论,从这个数学事实与一般直觉相抵触的意义上,它才称得上是一个悖论。大多数人会认为,23人中有2人生日相同的概率应该远远小于50%。计算与此相关的概率被称为生日问题,在这个问题之后的数学理论已被用于设计着名的密码攻击方法:生日攻击。
生日悖论是这样描述的:
不计特殊的年月,如闰二月。
先计算房间里所有人的生日都不相同的概率,那么
第一个人的生日是 365选365
第二个人的生日是 365选364
第三个人的生日是 365选363
:
第n个人的生日是 365选365-(n-1)
所以所有人生日都不相同的概率是:
(365/365)× (364/365) ×(363/365) ×(362/365)× ... ×(365-n+1/365)
那幺,n个人中有至少两个人生日相同的概率就是:
1-(365/365)× (364/365) ×(363/365) ×(362/365)× ... ×(365-n+1/365)
所以当n=23的时候,概率为0.507
当n=100的时候,概率为0.9999996
真是不算不知道,一算吓一跳。
【理解生日悖论】
理解生日悖论的关键在于领会相同生日的搭配可以是相当多的。如在前面所提到的例子,23个人可以产生23 × 22/2 = 253种不同的搭配,而这每一种搭配都有成功相等的可能。从这样的角度看,在253种搭配中产生一对成功的配对也并不是那样的不可思议。
看到百度百科的这个介绍,我开始在网上查,看看有没有人提出过这个论断是错的,结果不但没有找到有人说它错,还看到了这些数据:
当:
N=50,概率为96.3%,
N=60, 概率已经大于99%;
N=100,概率为99.99996%;
N=200时,居然为0后面29个9!
我也看到了描述这个结论的曲线——N过了60人之后,概率已经大于99%,曲线就像一根渐近线,以几乎平行的方式接近概率等于1的直线,最终在N=366处达到1。(见后面的图)
我还找到Paul Halmos (1916-2006)用数学论证(非数字方法)对这个论断的证明,Halmos还写了这样一段话:
“这个推导是基于一些数学系学生必须掌握的重要工具。生日问题曾经是一个绝妙的例子,用来演示纯思维是如何胜过机械计算:一两分钟就可以写出这些不等式,而乘法运算则需要更多时间,并更易出错,无论使用的工具是一只铅笔还是一台老式电脑。计算器不能提供的是理解力,或数学才能,或产生更高级、普适化理论的坚实基础。”
同一篇文章中还有这样的说明:生日悖论普遍的应用于检测哈希函数:N-位长度的哈希表可能发生碰撞测试次数不是2N次而是只有2N/2次。这一结论被应用到破解cryptographic hash function的生日攻击中。生日问题所隐含的理论已经在[Schnabel 1938]名字叫做capture-recapture的统计试验得到应用,来估计湖里鱼的数量。
还有不少国外的数学家,用其他一些方法,也得出了生日悖论的结果;甚至还有很多如何用各种程序产生随机数来检验这个悖论正确的例子!我在网上查到的概率学,不管国内外,无一例外将它作为教材;我还查到很多用生日悖论作为直观靠不住的例子的文章和书,很多还是科学家写的书……
“生日悖论”在这百把年来,一直作为概率理论的一个经典例子,在教育着全世界的孩子们,“生日悖论”难道真的是如此神奇而正确的吗?
我在前面的文章中说过,熵是超越一切尺度、维度、精度……最抽象的概念,也是一切系统有序度的一个统一测度。我决定用熵的概念,来检验一下“生日悖论”结论的正确性。
根据题目的设定,我们知道这个“生日悖论”的结论可以适用于任何标度。假定1年有1000天、10000天、100000天……它的计算公式都是适用的。
于是, 按“生日悖论”的算法,我计算出1-1000中,只要随机取38个数,其中两个数相同的概率就达到50%;在1-10000中,只要随机取118个数,其中两个数相同的概率就达到50%;在1-100000中,只要随机取363个数,其中两个数相同的概率就达到50%。
如果计算1-100000个数中,取多少数就能使发生两个相同数的概率超过99.999%, 我估计不会超过5000个,也就是总数的5%,将它画成曲线,我们一定会看到这根曲线离开0点后,会很快“直冲云霄”(接近1),这时离开“终点(100000)还有十万八千里!后面的数字却早就全部没有意义了,只有那个100001候补守门员在场外守候,因为最后确定概率为1 非它出场不可!
看看这些图像我们就明白,随着标度的扩大,这根直线简直就是一离开起点就直冲云霄(接近概率=1的线),然后就以渐近线的模式,紧贴着概率等于1的线以极其缓慢的速度发展,直到最后到达终点时,才与概率等于1 的直线相交。
我相信这里一定出问题了!也就是说,我们在365个数字中,只要随机取占总数6.5%个数——23个;在1-1000个数中,只要随机取占总数3.8% 的数——38个;在1-10000中,只要随机取占总数1.18%个数——118个,在1-100000中,只要随机取占总数0.36%个数——363个……则取出的这些数中有两个相同数的概率就都达到了50%!
朋友:我注意到了,这个比例随着总数的变大,会变得越来越小!
商:是的!如果我们把标度扩大到1亿,我相信这个比例会小于万分之一!也就是在1亿个数里,随机的取出不到万分之一的数,却能使这些取出的数里有两个相同数的概率大于50%——这绝对是个不符合事实的结论,与之相悖的不是直观,一定是事实和科学!
朋友:我同意你的观点。如果生日悖论是个科学的结论,那么,这个比例是不应该随着标度被扩大而不断变小的。但是我无法证明它。
商:我是从熵的角度来发现问题的。根据对题目的分析,我们知道这个被取样的系统,是一个熵为最大的系统,是最均衡的。无论你如何取样,无论你取样后如何对取样的数据进行计算,都不会改变原系统的熵值。这种系统分布处于熵最大的状态,意味着它也不会给任何用于计算的公式以任何影响,所以,计算结果的线性和非线性,完全取决于计算所用公式本身的线性和非线性。同样道理,无论你怎样取样、取样多少、取样后如何计算,被取样的群体,也应该还是一个熵最大的系统分布,与原系统的分布状况应该是一致的。但是生日悖论的结论却告诉我们,只要一取样,被取样部分的“熵值”就发生变化了,就变得有序了!而且这个被取样系统的熵值变小的程度,与取样的多少和原系统的标度都有关,取样越多、或标度越大的系统,被取样部分的熵值越低!
从我们上面所列举的数据中可以明显的看到,“生日悖论”的计算结果告诉我们,取样数占总数的6.5%(23人),被取样部分的数字中,发生两个数字相同的概率达到了 50%;如果取样数占总数17%(62人),则它们之间发生两个数相同的概率超过了99%。如果在标度为1-100000的系统中取样,那么只要取样数占全部数的比例达到0.36%,被取样的数中发生两数相同的概率就为50%。
这是一种典型的按几何级数变化的比例关系,前面我们已经说了,熵最大系统是不会给取样或取样后的计算带来任何影响的,所以,计算结果的线性和非线性,完全取决于计算所用公式本身的线性和非线性。假定我们所用的计算方式是正确的,那么这种按几何级数变化的计算结果,只会在一个熵值分布不均匀的系统中出现,或者在一个取样方式非线性的计算中出现,不会在一个取样随机的熵最大的系统中出现,所以从熵的角度,我们很容易得出“生日悖论”是个谬误的结论!
朋友:我们对熵的概念还不是十分明白,不过我们已经明白你的意思了。那几根直冲云霄的曲线确实很形象的说明了这个问题。从这些图来看,好像在一个庞大的系统中,只要取样数超过总数一个很小的比例以后,被取样数中发生数字相同的概率就很大了,而且很快就接近概率为1的直线,你后面哪怕取样再多,对概率计算也没有什么“贡献”了。“生日悖论”的结论给我们这样一个印象——尽管人群的生日分布是均匀的,但是我们只要一取样,好像生日相同的人就会汇聚到被取样的人群中,标度越大的系统,这种现象越明显。这就显得被取样的群体与大系统中的人,生日分布变是不均匀的。从这个角度讲,我们也觉得有点不对劲。
我们很愿意这样想象一下,如果“生日悖论”的结论是对的,那就是说,假定有23台彩票的摇奖机,每一台摇奖机里都放着写着1-365个数字的365个小球,这23台摇奖机每一次都摇出1个数字;平均每摇2次,就会有一次出现两个标着同样数字的小球,这确实有点不可思议。按照生日悖论的计算,如果有60台这样的摇奖机,那就是每一次摇出的60个数字中,一定有两个数字相同(概率大于99%),这确实难以令人信服,因为毕仅每一台摇奖机摇出的数字可以在1-365之间任意出现的。
商:哈哈哈哈,老弟是个财迷啊!说到熵就不明白,想到彩票就明白了!
我们不妨再来看看百度百科中对这个结论的解释:
【理解生日悖论】
理解生日悖论的关键在于领会相同生日的搭配可以是相当多的。如在前面所提到的例子,23个人可以产生23 × 22/2 = 253种不同的搭配,而这每一种搭配都有成功相等的可能。从这样的角度看,在253种搭配中产生一对成功的配对也并不是那样的不可思议。
我们用一个办法来验证一下这个说法的正确性:在一群生日分布均匀的人群中,随意抽取24个人。由于人群中生日的分布是均匀的,取样也是随机的,那么,这24个人的生日在一年12个月里的分布状况应该是怎样的呢?
朋友:如果从统计规律来看,平均每一个月出现2个人的概率是最大的,因为题目规定人群的生日是均匀分布的,取样也是随机的。
商:不错啊。那么我现在要问,不在同一个月出生的人,虽然也可以互相比对生日,但是,这种比对的结果,一定是生日相同的概率为0(不可能出现的事件),你同意我的结论吗?
朋友:我明白了!虽然这随机抽取的23个人的生日是随机的,但是我们可以把他们想象成每个人都坐着一把写着日期的椅子;虽然坐在不同椅子上的人也可以互相比对生日,但是这种比对是无意义的、是概率确定为0的事件。
商:是的,所以百度百科的那个解释是错的,研究生日问题不能取那样的思路。23个人虽然有253个互相比对生日的机会,实际上其中绝大多数是无效的比对。
朋友:明白了,正是因为这么多无效的比对参与了计算,所以才得出这么离谱的结论啊!
商:是啊!我们不妨先按百度百科的思路来计算一下,取样N个人的时候,这N个人之间发生生日相同的概率。
我们用直接计算生日相同的办法,先来算一下这个题目的答案:
由于每个人只能在365天里的某一天出生,所以每个人的生日取值就是
N=1 时,不可能发生生日相同的事件,概率P=0;
N=2 时,“任意两个人生日相同”的概率P=
N=3时;设这3个人为:A,B,C;
则,三个人之间有三个“任意两个人生日相同”的可能:
AB,AC,BC;
因为“任意两个人生日相同”的概率为
N=4时;设这4个人为:A,B,C,D
AB,AC,AD;
BC,BD;
CD
这里有六个“任意两人生日相同”的可能,所以P=
N=5时;设这5个人为:A,B,C,D,E
AB,AC,AD,AE
BC,BD,BE
CD,CE
DE
这里有10个“任意两个人生日相同”的可能,P=
……
显然,这是个等差级数,等差级数求和的公式为
则,N个人生日相同的概率为:
但是,当
N=20时,有两个人生日相同的概率为 52%,已经超过50%。
N=27时,有两个人生日相同的概率为 96%
N=28时,有两个人生日相同的概率为 103%!
算到这里显然看出这个公式错了!
但是我们从逻辑上看,没有任何错啊?!“任意两个人生日相同”的概率为
问题出在哪里呢?
朋友:是啊!很奇怪,按这个公式计算,取样23个人,他们互相比对生日的次数是253,与与百度百科介绍中说到的23个人互相有253次比对生日的机会也是一致的,为什么公式会出现概率大于1的错误呢?
商:我相信这就是得出“生日悖论”计算结果的人也碰到的问题,但是他回避了这个问题,采用了先算出N个人生日不同的概率,再用1减去这个概率的办法,来得出“生日悖论”。
朋友:看来你是胸有成竹、不会回避这个问题了?
商:当然啦!否则我怎么能说“生日悖论”是个延续了百年的谬误呢!
下面我们就按你刚才说到的那个坐椅子的想法来验证一下:
设想被取样的23个人进入一个大剧场,这个剧场的365把椅子是按日期严格排序的,他们进去后不是互相比对生日,而是直奔写着自己生日日期的那把椅子坐下。如果有人生日相同,他们就坐在同一把椅子上,这种情况下,23个人坐的椅子一定少于23把,空几把椅子,就是有几个人生日相同。
朋友:我明白了,坐在不同椅子上的人,根本不需要比对生日,因为比对的结果,生日相同的概率一定是0,是无效的。但是,由于这23个人的生日是随机的,我们怎么来计算他们生日相同的概率呢?
商:我来分析一下。现在我们假定前面22个人都坐在椅子上了,那么第23个人进来时,只可能有两种情况,我们分别讨论一下。
第一种情况:前面22个人之间没有人生日相同,那么,这22个人一定坐在22把椅子上,最后一个人就有22次与别人同坐一把椅子的可能,也就是有22个与别人生日相同的可能,在这种情况下,这23个人发生生日相同的可能数就是22(N-1)。你同意吗?
朋友:是的,这种情况比较简单。
商:你说得不错,先易后难、从线性发展到非线性么!
第二种情况:前面已经有人生日相同了,那么,前面22个人坐的椅子一定少于22把,他们之间发生几次生日相同事件,他们就少坐了几把椅子,这样,最后一个人与他们发生生日相同的可能也少了几次。你同意吗?
朋友:我同意,因为最后一个人要比对的不是人,而是被人占用的椅子。
商:说得太对了!……我们继续分析。
现在我们假定取样人数为N,然后用数学公式来表示上述分析:
最后一个人与别人生日相同的可能性有两种情况,一种情况是假定前面的人之间没有发生生日相同的事件,那么他与前面这些人生日相同的可能数为:N-1,这里N要减1,因为要减去最后一个人自身。在这种情况下,(N-1)就是取样N个人发生生日相同的全部可能数。
另一种情况是前面的人已经发生M次生日相同事件,那么,前面这些人就一定少坐了M把椅子,最后一个人要比对的椅子数就少了M把,所以最后一个人与他们出现生日相同的可能数就为:(N-1)-M。在这种情况下,我们只要在最后一个人与别人发生生日相同的可能数(N-1)-M上,再加上前面那些人已经发生的生日相同事件的次数M,就是取样N个人时发生生日相同的全部可能数:
(N-1)-M+M=(N-1)。
朋友:太奇怪了!你这个公式告诉我们,对最后一个人来讲,前面是否发生生日相同的事件、发生几次生日相同的事件,对他都是没有意义的,因为发生生日相同的事件多了,他与别人发生生日相同的概率就小了,而且两者是同一个数,永远是一加一减互相抵消的。所以,最后一个人与别人发生生日相同的可能数,不管前面是否已经存在发生生日相同事件,都是(N-1),也就是取样N个人之间发生生日相同的全部可能数,是这样吗?
商:一点不错!现在我们再来看前面我们计算概率中发生的问题,就简单了。前面我们认为N个人之间相互比对生日相同的机会是个等差级数,等差级数求和的公式为
通过上面的分析我们知道了,N个人比对生日相同的机会不是等差级数的和,而是(N-1),用(N-1)去替换那个等差级数求和的公式,我们就可以得到:
N个人生日相同的概率为:
朋友:这么简单啊!这是个线性的公式啊!
商:是的。这个公式就不会出现概率大于1 的问题,也不会在标度放大后,出现直冲云霄的不合理曲线问题,与我们的“直觉”也是相符的。
朋友:这一点我同意。因为按照“生日悖论”的结论,当取样人数N达到100时,他们之间发生生日相同事件的概率为99.99996%; N=200时,这个概率居然为0后面29个9!也就是取样200个人时,就不可能发生他们的生日都不同的情况,这显然是荒谬的!从理论上讲,即使取样365人,也可能没有两个人的生日是相同的。至于取样100人或150人,他们之间没有人生日相同的可能性是不小的,绝对不会小到几亿分之一。
商:如果我们也用前面的办法按此我的概率公式画出曲线,就可以发现这是一条直线,当人数从1均匀的变化到366时,概率也从0均匀的变到1。取样每增加一个人,生日相同的概率就增加365分之一,生日不同的概率同时减少365分之一。所以这个结论充分显示了在365个数中,每个数的权重都是一样的,取样多少与发生生日相同的概率大小是成线性比例的,也就是取样不改变原系统的熵值,这与被取样人群的生日分布是均匀的题目要求也完全一致!
与“生日悖论”的结论对照,我们很容易发现,依照我们的计算结果,不管你是否已经抽取到60个人或者100个人,后面每多抽取一个人,生日相同的概率就上升0.2739%,,而生日不同的概率就同步下降0.2739%,所以系统中被取样的人在整个标度内,对概率计算的“贡献”是等价的,这符合随机取样的熵最大系统的特征。
根据我的公式,即使取样200人,没有人生日相同也是可能的。不会像“生日悖论”的结论那样“不讲道理”——取样数大于100个人以后,再加多少人都意义不大了。如果取样超过200人,就不可能存在生日都不同的事件了。
我们的计算公式,无论你把标度扩大多少,都不会比例失真。
朋友:你得出的这个公式与“生日悖论”相比,确实有其合理性;但是,你还能用其他办法证明你的公式是正确的吗?
商:可以啊!我来证明一下。
顺着前面的思路,我们明白,N个人占据的椅子数如果小于N个,就一定发生了生日相同的事件。因此,要计算取样N个人发生生日相同事件的概率,关键就是要计算N个人应该占据的N个椅子中,发生“空椅子”的可能是多少。
根据这个思路,我做出以下推论:
第一,N个人最多占据N个椅子(N<366,N个人的生日全部不同);你同意吗?
朋友:我同意,这是显而易见的。
商:第二,N个人至少占据一个椅子(N个人的生日全部相同);也就是说,1个椅子不为空是绝对的,是概率为1 的事件。你同意吗?
朋友:我同意,这也是显而易见的。
商:第三,N个人各取哪一天生日,是完全独立的等价事件,互相没有影响。你同意吗?
朋友:当然同意啊,这更是显而易见的!
商:第四,N个人应该占据的N个椅子,每一个都有发生空椅子的可能性,这些椅子发生空椅子的可能性,也完全是等价的独立事件,互相没有影响。你同意吗?
朋友:同意,这与你说的第三条是等价的。
商:第五,由此我得出结论:每次取样N个人,发生空椅子的可能性为N个,但是根据第二条推论,必须减去1个绝对不为空的椅子(我们不关心是哪一个)。因此取样N个人,发生空椅子的可能性为:(N-1)个。你同意吗?
朋友:前面的都同意了,好像这一条不同意是不可能的……
商:第六,由于一年有365天,这N个人中,每一个人的生日可能是365天中的任何一天,因此,发生空椅子的可能也遍历这365天,所以,发生空椅子事件的样本空间为365,所以取样N个人时,发生(N-1)个空椅子的可能占总的空椅子数(365)的比率,就是取样N个人发生生日相同的概率:
这与我们前面得出的结论是一致的。
朋友:是啊!我好像被你套住了!怎么会一步一步的走到这个结论上的呢?
商:哈哈哈,不服气啊?这也是个肯定之肯定系统啊!
朋友:……好,我们暂且不重新验证你的推论是否正确,我想说的是,如果你的结论是正确的,那么你一定可以直接证明“生日悖论”的算法是错误的,也就是直接分析它的算法错在哪里,行吗?
商:当然可以啊。我们来看看“生日悖论”的概率是怎么算出来的:
他采用的是先计算取样N个人的时候,这N个人的生日都不相同的概率。为此,他这样分析:
第一个人的生日是 365选365,也就是
第二个人的生日是 365选364(要去掉被第一个人选取的生日,保证第二个人的生日与第一个人不同),也就是
第三个人的生日是 365选363,也就是
:
第n个人的生日是 365选365-(n-1),也就是
我们现在来分析一下这个取值方法:
本来每个人的生日取值都应该是365选365,为什么这里N每增加1,选取生日的范围要减少1呢?因为这个计算方式设定的前提条件是“假定这些人的生日都不相同”,也就是假定N个人占据了N个椅子,确保没有空椅子事件发生。所以按这个假设而产生的生日选取模式,必须不断减去前面被占的椅子,以确保不发生生日相同事件,因此后面的人的生日取值范围要不断缩小。也就是说,按这样的设定选取生日的办法,本身就保证了取样N个人的时候,这N个人的生日都不同,所以这种生日取值方法本身,就是取样N个人的时候,生日不同的概率!
这个概率就是
我们用1减去这个概率,就是取样N个人发生生日相同事件的概率:
朋友:啊,啊……又与你得出的公式一致了!
商:是啊,“生日悖论”出错的原因,就在于它没有意识到,这种生日取值方法本身,就是取样N个人的时候,这些人生日都不同的概率。我们用非线性的分形概念来说明一下。
朋友:我明白了!不过,这个不是概率理论的问题,是应用者的理解问题。
商:你说的不错!但是概率理论在生日问题的计算上还是暴露出问题的,我举个例子。
还是计算生日问题:我们把被取样的人群按出生日期所在的“月份”,划分成12群,然后在每个人群里随机取样4个人,共取48个人,再来计算这样取样的48个人中间,发生生日相同事件的概率。由于12个月在这里是等价的,我们只要算一个月里随机取样4个人时,发生生日相同的概率,再把这些概率全部相加(乘以12)就可以得到答案。
一个月30天,同一个月出生的4个人,
按我的公式计算,生日相同的概率为:
按“生日悖论”的公式计算:
这个概率乘以12 就是全部取样人群中发生生日相同的概率:
按我的公式计算结果:
按生日悖论的计算结果:
两者都出错了,因为概率不能大于1。
问题出在哪里呢?
我们来分析取样的方式:
由于这些人来自12个不同的月份,因此不可能发生重叠取样的问题。实际上假定我们还是在未经划分的人群里取样48个人,尽管每次取样的48 个人的分布都不一定均匀,但是根据统计学原理,由于我们设定被取样的人群的生日是均匀分布的,取样是随机的,因此无数次取样的平均值,一定是线性分布的,也就是这48个人本来就应该是均匀分布在12个月份里的。
我们的计算方式也是没有问题的,因为我们并没有在不同月份出生的人之间做无效比对;每个月取样4个人,无论你用什么公式计算,他们之间发生生日相同的概率都大于
看来我们找不到任何出错的原因,只能得出的唯一结论,就是“不能这样算”!
从非线性哲学的角度看,概率问题本质上是个空间(序)结构的分形系统问题,产生上述问题的本质就是“非线性系统的局部之和不等于整体”。用线性的概率理论来分割非线性系统后,把分割后的局部都看成是等价的部分,分别计算后再线性叠加,是一定出问题的。
朋友:是的,我们在面临实际问题时,经常会用线性分割和叠加的办法来处理问题,看来这个问题应该引起大家的注意。
商:现在我们来总结一下概率理论存在的问题:
综合概率的频率定义、古典定义、和严格定义,我们知道,概率计算的原始想法就是:尽管每次取样都会发生不同的结果,我们只要把所有可能发生的基本事件用排列组合全部列出来,再把你感兴趣的事件出现的次数全部相加后,除以所有可能出现的基本事件的总数,就得到你感兴趣的事件出现的概率。
问题是,我们凭什么认定“所有可能出现的基本事件,它们出现的几率本身是等价的?”
拿上面举过的那个只涂颜色的9个小球例子来讲,同样作为基本事件,红红红、蓝蓝蓝、棕棕棕出现的几率,与红蓝棕、红棕蓝、蓝红棕、蓝棕红、棕红蓝、棕蓝红……出现的几率并不是等价的,因为红红红本质上是几个排列的集合;……即使排除正交的因素,我们把9个小球标上1-9的数字,我们又凭什么认定经过所有的排列和组合出现的504个基本事件,每一个基本事件出现的几率是等价的?那只是人为的设定而已!
那个扔硬币的例子更清晰的告诉我们,扔两次硬币出现两次同面的概率只有25%,所以,每一次扔硬币不是独立事件,它出现两面的概率不是均等的50%,而是与前一次扔硬币的结果有关系的。如果我们坚持每一次扔硬币都是独立事件,两面出现的概率是均等的50%,那么我们就否定了连续两次出现同一面的概率计算方式是有实际意义的,因为这个计算结果告诉我们,如果看到前面那次扔硬币的结果,我们就知道后面出现同一面的概率小于50%。
真实世界是非线性的,用非线性的分形理论来看,实际上每个基本事件都是所要计算的概率的分形,它们具有内在的“自相似性”,所以用形式逻辑去线性的设定它们的等价,就像用数字量去对模拟量进行量子化(数模转换),一定会“遗失非线性部分(描述细节)”的部分。在标度不大或精度要求不高时,误差在许可的范围,当标度扩大后,这种误差一定会达到“离谱”的程度。
我们在广泛应用的微积分也存在这个问题,微分就是用线性的函数去无穷的逼近非线性函数的局部,从而达到用线性办法解决非线性问题的目的,微积分的理论是建筑在整数维三维空间理论上的。本质上微分就是一种“模数转换”,就像现代数字音频系统,用有限的数字量去转换变幻无穷的模拟量,把真实世界的模拟量量子化,并把每个同类的量子都看成等价的、把不同类的量子之间的关系线性化!但是学过模数转换的人都知道,任何精度的模数转换(时钟脉冲再小、幅度分级再多),所得到的数字量,只能是模拟量的“逼近和近似”,总有“高频损失”,所以实际上通过模数转换得到的同类量子,不管精度多高,互相之间实际上并不等价;不同类的量子之间,也不是严格的线性关系,只是在精度允许的情况下,我们人为的设定它们是等价的。
概率理论也是用基本事件作为量子,去量子化真实世界的实际概率,并人为的设定这些基本事件(量子)是等价的。所以,概率理论在精度要求不高、标度不大时,计算结果是“管用”的,但是千万不要把它看成是“绝对真理”,是可以运用在任何场合、可以适用任何标度!这种人为的认定,就是一种线性方式,建筑在这个设定基础上的理论和公式,一定是线性的,在标度和精度要求高的地方、在描述真实世界时,它的线性本质一定会暴露的!
概率的本质问题,是偶然性和必然性之间的关系问题、是微观的无序与宏观的有序之间的关系问题、是局部(取样部分)与整体的对称或相似的关系问题;这三重关系互相之间又是耦合的关系,不能线性的割裂开计算后,再线性的叠加。
我不是研究数学的专家,但是我可以告诉大家一个事实,为了进一步研究生日问题,我决定抛开对概率理论的研究,既不计算概率,也不研究样本空间,当然更不去建立公式——我仅仅观察一下,实际取样N个人以后,发生生日相同的可能性到底有多少种,也就是说,当我意识到现在的概率计算,由于以形式逻辑为基础,会对真实世界中取样对象的不同标识产生不同的计算结果这个问题后,我就想,为什么不抛开概率的理论和计算,而是把实际可能发生的情况列出来,来看看真实世界到底会出现什么样的数据呢?
于是我将 1—365 改为1—K;
考虑到生日悖论曲线的失真,是在 N大于60以后,但是要想在这个数量级取样,非把人累死不可,所以我决定一方面缩小K的值,另一方面就观察它最发散的一段——取样数N最大的时候,也就是最接近K(365)天的那一段。
于是我决定令 N=K;
显然 N=K=1 时,不必取样,一年只有一天,所有的人生日都相同。
取K=2;也就是假定一年只有两天——两个生日。
用1,2 表示两个不同的生日。
N=1,只有1个人,没有生日相同的可能。
N=2时,显然,任取两个人,只会出现两个结果:两个人生日相同,或不相同;
取K=3;也就是假定一年只有3天。用1,2,3 表示。
N=3,(取3人)
下面的分析非常重要,这个分析体现了我说的压缩了所有的排列组合,只记录每次N取确定值后,实际会发生的所有可能。
在此再声明一点:我这里不是在计算概率,也不是把它们作为样本空间,甚至还没有建立公式,我仅仅在按实际发生的情况做记录,先看看真实世界到底会出现什么样的数据!
当N取3时,真实世界只有三种情况出现:三人生日相同、两人生日相同、三人生日都不同。
尽管这里生日相同可能分别发生在一年的1号、2号、3号(这里一年只有3天),也可能分别发生在第一个人和第二个、第二个人和第三个人、第一个人和第三个人之间,但是这与生日问题的要求无关,我不研究,我根据题目要求,只列出所有可能的情况,不需要知道排列或组合的问题,我只保证任何一次取样出现的任何结果,都被包括在这三种情况中。
N=K=4;只有5种情况:
四人全同天生日;三人同;两人同两人不同;两两相同;四人都不同。
N=K=5;只有7种结果:
五人同生日;四人同生日;三人同生日;三人同生日的同时另两人也同生日;2对人同生日;两人同生日;五人生日都不同。
显然不管N=多少,每次取样,N个人生日都不同的结果只有一个;N 个人生日全同的结果也只有一个;N-1个人生日全同的结果也只有一个。
我排到了N=K=14。
当 N=K=2-14 时,依次得到如下数字:
2,3,5,7,11,15,22,30,42,56,76,102,135
它们之间看不出什么规律!
我在取这些数字时,是用字母排方阵的办法,这样比较简单,也不易出错。每当把N加一位时,只要先在左边加上一列,再加几行就行了。
根据这些数字的特点,也根据我获得这些数据的办法,我想到了两个算法——递归和迭代。我更倾向于迭代。一是因为从操作的方向来看,递归一般先要进行递推,再进行回归,而迭代是由简单向复杂发展,与这里的情况比较接近;二是从系统的变化角度看,递归在递推的过程中,要增加很多子系统,迭代在变量和参数选定后,一般不需改变,所以迭代比较符合这里游戏规则不变的情况。
但是这种字母的行列式排列不容易看出数据结构的特征,也不太直观。我决定把字母换成数字,并且换一种排列方式。
我将 N个人生日相同的数字作为起点,依次递减一人为下一个节点,先写下生日相同的人数作为主干,再逐级写上其他人数生日相同的所有可能。按这个结构,我一边检查原来用字母排列时是否有错,一边将字母转换成数字。这个工作要做得很仔细,所以我把全部精力集中在检查每组字母排列和数字的转换上。大概花了40分钟,完成了转换,我觉得有点累,眼睛也有点酸,就闭着眼睛休息,不经意中我眯着眼对这些纸一瞥,大吃一惊!我居然看到那些写好的数字像一片片形状相同大小不一的树叶!
我突然醒悟过来,马上拿起这些数据仔细观察——最后我确信,这些数据的结构, 就是分形!
叶子的叶柄是两个表示N个人和(N-1)个人生日全部相同的数字(都等于1);叶尖,是表示N个人生日全部不同的数字(也等于1);从叶柄开始往上,每一个节都不断开始分岔,N 每加1,叶脉就多一个节点,不仅这个节会产生很多新的分岔,其他节的分岔也同时变化,这些分岔看上去都非常象似,却并不完全一样。从叶柄开始,每隔
在任何一片大叶片里,都可以找到小叶片的全部结构——分毫不差!但是每当N增加1,总有一些新的结构出现,然后被后面的叶片不断复制,同时产生新的分岔!不管N如何变化,叶片的形状基本不变。在每个叶片里,都可以发现一些更小的结构在不断重复……事实上任何一片叶片的一小部分,都可以看到这种分岔的规律……这些正是分形最基本的特性——标度不变性、自相似性、无穷精细结构!
我有点呆了!本来估计这个数据结构可能是个混沌系统,不料这些数据的结构居然是分形!
我立刻想到,如果这个数据结构是分形,那么无论你如何扩大标度,它的结构和形状会保持不变,而且与K的大小没有关系,与N的起始点和大小都没有关系!——仔细一想,事实正是如此!叶片的形状完全由N的取值决定,与K没有关系,即使K=365、K=1000、K=100000,N只要小于K,取任何值时,这个叶片的结构和形状都不会变!而且N不必从1开始,从 101-200 和从 1-100,是等价的!我很快用K=365,N=23、N=61、N=101、N=201……开始写这些数据,只写了5-6个节点,我就确定这个想法完全对!因为已经很熟悉的结构立刻出现了!变化的规律也非常熟悉和稳定!
事后我把这个分形整理了一下,如果用同样面积的点去表示这些数字,这个分形的形状更像是“蛋卷冰淇淋”,那个“叶尖”(N个人生日都不相同)就像放在冰淇淋上面的一颗樱桃。
这个结论就与真实世界发生的事实完全相符了!请注意:这个数据既不是概率,也不是计算概率的公式,这个数据结构表征的,是游戏规则和取样特征,显示了游戏规则和取样特征与被取样的对象分布完全没有关系,你可以取K的任何一段或N的任何一段,数据的结构和形状都不变。但是这个结构还显示了N与K的比值决定了概率的大小,N相对K越小,生日相同的概率越小。
这个数据结构与我得出的计算公式并不矛盾,因为任意取N个人的时候,出现这个数据结构列出的各种可能性,本身出现的概率是不同的,譬如N个人和(N-1)个人生日全部相同的出现概率就很小,而N个人中只有两个人生日相同出现的概率就很大。
但是这个数据结构却否定了生日悖论的结论,因为按照生日悖论的结论,出现生日相同的概率与K没有多大关系,只与N 有关系,而且当N达到一定数量后,不管N与K的比例如何,概率就是一个定值(100%)了。
我不是数学家,对于如何应用这个数据计算我们要的概率一无所知,但是我非常高兴!不是因为这个数据结构进一步说明生日悖论是荒谬的,更重要的是,完全来源于真实世界的数据(在真实世界对N个人取样,记录所有生日相同可能的集合),居然是个分形!由于混沌和分形系统很多都是模拟量,目前还没有模拟代数,对这些模型很难分析;这个分形模型是数字的,数据结构非常简单、可逐步扩展,我相信对研究分形会有很大帮助!
有兴趣的朋友可以自己去试验,我相信你会得出与我一样的结论——非线性的概率理论,一定是分形的理论!因为分形理论实际上也是一种非线性数学(几何)的理论。只有分形,无论标度如何变化,它的精细结构(精度)是不变的!分形系统的局部和整体的关系、偶然和必然的关系,有序与无序的关系,都不是线性分割和线性叠加的关系,分形系统中局部与整体的统一、偶然和必然的统一,无序与有序的统一,是个更高层面的统一,它们不仅统一在内在的自相似性、内在的对称性、内在的一致性,还统一在结构和序上、维度上、信息上、能量上……分形系统任意小的局部,都蕴含了全部整体的信息,就像全息照片一样;分形是个连续结构的系统,在维度上是连续的,局部的分数维,可以连续的过渡到整体的整数维!而我们现在所熟悉的“线性三维空间”,实际上是人造的离散结构系统,在维度上是不连续的!
最后我要强调的是:非线性科学是覆盖线性科学的,但是非线性科学绝不排斥线性科学,线性科学是基础,在精度要求不高和常规标度内,它的线性本质(可精确复制、可逆、可叠加、易推广……等),决定了线性科学还是很好用。所以我写这篇文章绝对没有排斥概率理论的意思,我要告诉大家的,是线性理论很好用,但是它有不可避免的局限性。在面对现实问题时,我们一定要注意到这个局限性问题。而“生日悖论”的谬误,不是概率理论的问题,而是使用者线性思维模式的问题。所以,大家一定要认真学好基础知识,更应该懂得如何用好线性理论。
当然,如果看了这篇文章后,有朋友对建立非线性概率理论感兴趣就更好,我希望他们能尽快创建非线性的概率理论,为人类在概率理论上走向非线性做出贡献!