你知道什么叫做平均吗?


此前本人在坛里有个帖子,《你知道什么叫做等于吗?》,现在本帖取名《你知道什么叫做“平均”吗?》。由于“平均”离不开“加法”,所以再配个副标题叫做《你知道怎么算加法吗?》

大家又该吐槽了。加法嘛,幼儿园的孩子都知道了呀!平均不也就是做除法嘛,一个量A除以另一个量B,A/B,A÷B,A:B,这就是平均嘛,就可以叫做是A在B上的平均嘛。

你答的也对,但你这是极低水平的回答。今天告诉你这是不严谨的,不完全的,也就是说,严格来说这是错的。这样回答,你就是不知道“加法”,更不懂“平均”。

为何严格来说这是不对的?听我慢慢给你讲。错和对,都在于你这是把A和B都默认当作了纯粹的数值了,而不是将它们视为具有应用含义的变量。

平均的概念,是用来考察事物运动变化的,但我们又知道,变化有时间上的变化、空间上的变化以及交叉的综合变化之分。所以,当你在谈论“平均”一词的时候,首先要明白你说的是那种意义的平均,给出明确的定义,因为这涉及到你如何在实证当中进行数据采样。否则,你可能是用错误的数据来进行分析计算,就会出现张冠李戴、驴唇不对马嘴、关公战秦琼的逻辑混乱现象。

平均,就是把一个总量假想均布于一个分配基(空间或维度)上。所以,被分配的量,首先是一个可以求出总量的变量,也就是说只有可以加和的量才有总量,才能进一步被平均,才有平均值一说。

根据数据处理方法和分布基的设立的不同,“平均”有算术平均,几何平均,均方根平均,调和平均,加权平均等多种。之所以有这么多种平均,是因为每一种平均算法都只能反映出事物变化的某一个方面而难以概括全貌。

“平均”是统计学的术语。所以对于搞统计分析的人来说,搞清楚平均概念非常重要。统计学属于应用数学,切莫把统计变成纯数字游戏,这样就不是在搞应用数学。

最为常见的平均是求算术平均值,但若连算数平均就没法求得,则其它平均数就更无意义了。这是由于无论是哪一种平均值,都要事先做加法。很多人有所不知,做加法是有一定规则的,可不是随便什么变量值都能用来算加法滴!

所以,我们先从加法的规则讲起。

 

加法规则一:同量纲同质的量才能相加。比如长度和长度相加,面积和面积相加,重量和重量相加等。

例如1M+1M=2M,10㎡+20㎡=30㎡,1碗+1碗=2碗,1kg+3kg=4kg,1天+12小时=1.5天=36小时等等。

但是你不能把长度和重量、时间和面积这种异类数据相加。因为它们具有不同的量纲。

量纲一致原则是不言自喻的。同质的事物当然可以用一致的量纲表示,但量纲相同并不表示同质性。我们说1只+1只=2只,是默认用“只”计量的东西是完全同质的,否则就不能省略,例如1只狗+1只鸡、1kg水+2kg金等是没法直接运算的。想要运算,必须先做同质化处理,1只狗+1只鸡=2只动物,1kg水+2kg金=3kg物质。

所以既要量纲一致还要是同质的。1个人+1个人=2人,1只狗+2只狗=3只狗。但一个人加一只狗大概就只能理解为一人带着一只狗了,得不出一个算数结果来。如果你看到有广告上写着1kg+200万不用急于去展示自己的数学水平,可能是你买两百万元的别墅可以赠送你1kg金条吧;300㎡+380v是什么?可能是300㎡的别墅里配有380v的三相交流电吧,仅此而已。

当然,但现实当中确实存在不用1+1=2这种数学逻辑的异质加法,或者说这类加法运用的根本就不是数学。1个男+1个女=1对男女,也不能说这没法理解,但你注意,这种写法是不能简化为1+1=1的。前者遵守的是内容上的逻辑一致,后者则违背了数学形式逻辑,两式中“=”的意义不同。

异质加法应用的不是数学是什么?是化学。化学里就有“1+2=2”这种事情,比如1O2+2H2=2H2O。

用化学语言来看“加法”,同质加法叫做“混合”,而异质加法则是“化合”。虽然都是在“加合”,但“合”法不一样。用哲学语言讲,混合是量变,化合是质变。

我这样讲,有人会说,啊,原来化学里的数学不是我们常说的数学呀?你又结论下早了!

化学方程式固然是在做异质加法,所以化学方程式就不能只写数值而抽取分子式(分子式可以看作是一种量纲符号)。但同时,化学方程式式当中又包含了同质加减法。

化学方程式当中什么同质?——原子不灭定律!基于原子的数量运算就是同质加减法,这就是化学方程式的“配平”——等式两边的原子数相等。上面的氢氧制水方程式就是(2+2)+2=(2+1)+(2+1),就是6=6,量纲就是同质化之后的“个原子”。原子不灭也就意味着质量守恒,所以,化学方程式都是遵守质量守恒定律的,等式两边的物质质量是相等的。

化学方程式可堪称是同质加法与异质加法的完美综合。

在同质同量纲的情况下,我们不必再在每一个数量的后边写上量纲,可以偷懒地只用数字去运算了,一直等到结果出来再标注量纲于总和之后的()之中就可以了。这个方法大家都熟悉吧?

量纲一致原则让电磁物理学的公式变得非常简洁优美,这个工科尤其是物理学专业的大学生也都知道。

 

加法规则二:标量才可以相加,矢量不能算数相加。

中学生已知,变量有矢量和标量之分。矢量是既有方向又有大小的量,标量则是和矢量概念对应,指只有大小没有方向的量。当相加和的量是矢量的时候,使用的是另一套加法规则。

同方向的矢量,可以只用其模量对其大小做算数相加,也就是相当于看成是标量相加了。

在物理量当中,力、位移、速度、加速度、电流、热量传递等都是矢量。共线矢量的加法运用的是多边形法则而不是算数加法。长度、质量、时间、温度、内能、路程等物理量,只有大小,没有方向,在物理学中叫做标量。

所以2个人各用500kN的力向推车,不见得车子就受到了1000kN的前行推力,同向用力才可以算数加法求总,不同向用力,就是矢量加法,不是算数加法了。

但是,矢量不能算数加和,不等是说只要是标量就一定可以算数加和了。

 

加法规则三:只有容度性质的标量才能够相加。

变量的性质不仅有时点数(状态量)和时段数(过程量)之分,还有另一种性质分类——强度变量和容度变量。

不仅仅矢量有强度和容度之分,标量也有强度和容度之分。结合前两条加法规则综合而言就是——同质的容度性质的标量能够被加和+求总∑。

容度性质的标量如长度(面积,体积)、时间、质量、数量等。而温度,密度,压强、热(电)阻率等,虽然也是标量,但却是强度性质的标量。

强度性质的变量不能够简单地去加和之,是因为其定义和测量方法本身和量无关,加和计算之前一定要仔细辨析其结果∑的现实含义能否成立。

例如,1kg水+3kg水=4kg水,但没有1℃水+3℃水=4℃水这种加法。

例如,1L水+5L水=6L水,但是1atm的水和5atm的水加在一起并不是6atm的水。

例如,同一块均质的金属,切下来每一块不论大小,它的电阻率和热阻率都是一样的,所谓均质就是这个意思。但这种均质性是人为在某个维度上构建的,是已经人为消除了加和性,如果沿着原纬度加和起来仍然是可以的,比如把电阻沿着电流方向串联起来,就可以加和求出串联电路的总电阻。但并联电路就不能简单加和了,因为你改变了维度,不是原路返回了,电阻被放置在多个空间维度上了。

容度性质的变量之所以称之为容度性质,具有加和性,就是这里的+是将其加入到一个有容纳能力的空间里。容纳,就是加在一起的意思。

这里暗藏了两个实验条件,第一,必须是同一个有容空间;第二,“加”就是加入,不是流出,也不是穿过,也就是说默认了具有方向性的运动是同向的,从而不再考虑运动的矢量性质。

强度性质之所以不能加和,第一是因为它本身已经是消除了空间的容量性质了,已经是一个平均数了。例如密度,就是“量在空间里分布的平均密集程度”之意,已经是一个平均值了。如果是一维空间,就是线密度;还有二位空间上平均的面密度以及在三维空间里平均的体密度。无论哪一种密度概念,都不能相加。

所以,尽管空间里的容纳物是数量可加的,但已经被平均的密度性质不具有再次加和的意义。

当空间无限变小时,就是点密度的概念。点密度因为空间大小为零,零容积空间里的存在只能被看成是一个整体,如质点的概念,所以1在0上无所谓平均了。关于类似点密度这种强度性质的变化问题,另文讨论不在此赘述。

 

加法规则四:同一事物的同一特性量在不同时点上的取值不能够相加。

能在时点上取值的量当然就是时点数,即存量或状态量。也就是说,存量在不同时点上的取值是不能相加的。

由于人们对于事物存在的一个基本的认知是,“同一事物不可能同一时间出现在不同的空间”,所以,容度性质的变量的加法,一定是指同一空间在相同时点上的不同事物同质性量的累加。也就是说,被加和的是不同的有容之物上的同质性之量,而不是同一事物的强度性质在不同时点的取值。

只有对于不同的事物,才有“平均”可言。同一事物是指均质的系统,如果不均,则其每一个均质的局部都可以视为一个单独的个体空间。

所以,我们说10kg+60kg=70kg,是有潜台词在里面的,它的完整的显表达是“同一时点同质的10kg某物与同质60kg某物放在同一个公共(可能是假想的)空间里,这个空间里在这个时点上拥有这两种物的总质量是70kg”,仅此而已,而任何有意无意的简化表达都可能带来错误。

所以,平均之前的加法是针对容度性质的变量的,又是面对同一时空而言的。又由于时空不可分离,不在同一时点上,也意味着不是同一空间,所以同一事物某一性质在不同时间点上的取值量不能相加求总。

例如我们不能依据上式说,小王一岁时体重10kg,现在十五岁时体重60kg,所以小王十五岁时的总体重是70kg。

例如仓库里早上上班时有10件货现在下班时有20件货,但不能说仓库下班时有30件货。

例如水库的水位就没有“总水位”之说。例如没有把早晚几个温度值加起来求总温度的。

现实当中也的确有对强度变量进行加和平均运算的,但都是有潜台词条件的或者是对同一变量随时而变的不恰当表述。

例如温度是一个标量,但却是一个强度性质的标量,是不能相加的。

速度,既是矢量又是强度变量,所以速度不能加和,没有把同一时点不同物体的速度加起来求“总速度”之说。也没有把同一个物体的不同时点上速度值加起来的算法。

既然如此,平均速度的说法又从何而来?这涉及到复合变量的性质决定的问题。

我们前面说的四条规则是加法的规则,但是,“平均”是在做除法。容度变量和容度变量做加减乘法,结果还是一个容度性质的量,但是两个容度变量相除,就是一个在另一个上的平均,除法消除了容度特性,结果就成了一个强度变量。除法改变了量的性质。

所以,强度性质的量无法直接相加。对于强度性质变量的平均值计算,必须回到其原始的容度标量相加的起点上。

例如,某一物体直线移动的平均速度,我们先测量计算出容度标量路程的总值S,再测量计算出容度标量时间段的总值T,则在时长T内总共通过了S的路程,平均速度V=S/T。

当T→0时变成瞬时速度v=ds/dt。

由于速度是强度性质的矢量,所以不能再用速度值直接相加了。是路程在时长上的平均叫做平均速度,而不是速度的平均值叫做平均速度。

要考虑强度性质自身的取值情况,可以用最值、振幅、中值等概念,而不宜使用平均值的概念,这样会误导你的思路。

这方面还可以参考高数当中的“中值定理”来理解。但一些高数教材当中有把中值点的切线斜率称为全线段的平均斜率,建议更改为“中值点导数”,或“中值点斜率”,因为斜率是不可加和的强度变量,且也没有对应的“平均导数”的概念可以成立。

关于强度变量的取值分布,还可以采用“定积分”的思路进行理解,尤其是多重定积分的概念。在这方面不再细讲数学知识,仅举一实例帮助你理解。

植物学家发现,同一品种的水果的甜度与温度的关系很大。这里说的温度,是在同一个曲面的温度分布,垂直分布也都简化为温度的变化。但这种关系不是与温度的最高最低值的绝对值简单关联,也不是和最高最低值之差(温差)简单关联,而是与一个叫做“积温”的概念有关。

植物学家所谓的“积温”,是指测温点(植株种植地的平面坐标点)的“温度—时间曲线T(t)”下面的积分面积,理论上写成∫T(t)dt,t1→t2。糖度和积温表现出高度的正相关。所以就出现“橘生江南逾淮为枳”(《晏子春秋.杂下之十》)。现代农业广泛采用的温室大棚,主要的作用就是构建一个“积温”环境。

 

现在说回到经济学的话题上来。

经济学,尤其是近代关于价格理论的微观经济学,可谓与数学是紧密接触了,密切程度丝毫不亚于物理学和数学的高度融合。不仅仅有世界一流的数学大师转向经济学领域一展身手并斩获颇丰,也有经济学人对数学的刻苦钻研,劲头不亚于爱因斯坦放下物理专修数学。以至于现在的经济学论文几乎就是一篇篇高水平的数学论文了。现今经济学已经变成了应用数学的一个重要领域,但经济学教授们仍然在鼓动着学子们要提高数学素养水平并加以运用。

然而极其不幸的是,经济学人包括以经济为对象的应用数学家们的数学水平,其实还停留在最最最最最原始的 是纯粹数字的数论研究。把经济变量当作纯粹的数字游戏,以至于虽论断颇丰但却百无一用。不仅名家巨著几乎形同废纸,无名小卒们不断推出的定理定律也多是毫无意义。

经济学当中有海量的经济变量数据,但是在对这些变量数据进行统计采样分析计算的时候,有几个人注意到前述的运算规则?很多经济数据分析者即便是简单的加法和算术平均都稀里糊涂,又怎么可能得出什么对现实有用的结论呢?

不再逐一述说各种经济变量,只捡其中几个代表性的变量为例来矫正经济学人惯常的错误思维。

 

第一个要说的当然是“价格”。算是微观经济学的话题吧。

《西方经济学的终结》一书(中国经济出版社,2005第一版)第一次明确系统地给出了价格的真正含义——市场就是交易,价格的含义就是交易比例。这一价格概念已经逐步被读者接受和认知。

早前本人有个网帖,叫做《教你如何秒杀经济学博士学位》,就是讲“价格”概念的。有读者看过后说“啊,我是经济学博士了!”,其实,价格概念貌似简单,但还是大有学问的。

拿单笔交易来说,甲拿m量的A物同乙的Q量的B物相交换,这宗交易当中的价格P就是P=m/Q(或者写成p=Q/m,这只是一种标注习惯上的差异)。

单笔交易有一个成交时点(交易双方约定的所有权交割时点),所以m和Q都是时点数,即状态量或存量,当然这里的价格也就是一个时点价格了,即“时点价格”是一个存量概念。

但多数人尚且有所不知的是,以上这只是一个“点价格”的概念,类似于物理学当中的“点密度”和“点温度”,只是针对在一个时点上成交的单笔交易而言的。但我们平时说到的价格,往往不是点价格,往往是“面价格”——同一时间发生的多笔交易的平均价格——例如问“当前价格”往往是问整个市场现在的平均价格情况,而不是指某笔具体交易的价格,因为不同的市场局部,价格是有差别的,即价格是有一个“空间”上的变化的。

对于一个宏观的市场,在某一时点总共有(m1,Q1)、(m2,Q2)…(mi,Qi)i笔交易成交,这个整体市场关于A和B的此时的平均价格就是P~=∑mi/∑Qi。

在这里,m和Q都是可以加和的容度性质的标量,但价格是两个容度标量的比值,变成了一个强度变量,也是一种平均数,m/Q就是说平均每个单位的B可以换m/Q个单位的A(Q/m就是说平均每个单位的A可以换取Q/m个单位的B)。不用赘述,“面价格”也是一个存量概念。

而有时候,我们不仅仅是在问现在的价格,还会关注“面价格”在时间上的变化,如“今天什么价”,就是在问所指市场范围从早到晚的价格状况。这可以类比“体密度”谓之曰“体价格”了。

体价格对应于一个时段,如果是随时获取的数值——到当前时点为止的体价格,它也是一个存量概念。但如果限定时段长度,并将数值用作同比或者换比分析(在时段上的变化),那可就是一个流量(时段数,过程量)概念了。

显然,一个换几个,也就是单价,是一种量在另一种量上的平均,就是强度性质的。强度性质的量就不能直接加和+求总∑。所以,不论哪种“价格”,都不能用价格加和来求总价格。“总价格”不是经济学的术语,在商业上,总价格其实是指总收益,也就是∑mi(或者总支出∑Qi)

而计算时段平均价格则要将指定时段上的总成交量计算出来。例如,如果上述i笔交易是指定市场范围内一天之中发生的,则∑mi/∑Qi就是指定市场这一天的平均价格。因为这里的∑mi和∑Qi都是流量,所以“体价格”也就是一个流量概念。

按照我们前述的加法规则和平均概念,平均价格的概念可以存在,但不是用强度性质的价格数值直接相加求得算数平均值,即不能用(P1+P2+…+Pi)/i,而是要用P~=∑mi/∑Qi进行计算的,这两种算法是基于完全不同的思维模式,而前者是错误的。

比如,某市场关于货币A同货物B的交易,早中晚三次的价格分别为10元/件,10元/件,9元/件,也可以看作是三个市场。如果说这个市场今天三次交易的平均价格,或者说三个市场的平均是纯数字算数平均值,(10+12+8)/3=10(元/件),你可就错了。

正确的算法是用量来计算。早上成交量为10件,中午成交量为80件,下午成交量为10件,那么平均价格应该是用总成交金额÷总成交量,也就是:

P∽=(10*10+12*80+8*10)/(10+80+10)

=11.4(元/件)

这个结果的经济学含义非常准确明了,即今天一共卖出100件货物,共换回1140元货币,平均每件货换回11.4元币,即换比为11.4:1,或者说平均价格是11.4元/件。

为何加起来除以三得到的10元/件是错误的平均价格?问题就出在强度变量P是不能直接加和这一点上。

现实当中在做CPI数据调查的时候用价格调查员在市场上采取价格数据,然后上报计算平均数的做法,就是这样的错误。如果交易是足够密集频繁的,而采样的次数非常有限,尤其是在调查员的购买习惯并不具有代表性的时候,则计算结果之偏差有可能会非常之大。

由于此处的价格是平均数,是一个强度变量,本身已经消除了量的因素,所以,平均价格数据不再反映量的变化,这就是“量价无关”。当然,统计局知道这种算法是不对的,也知道用“加权”的方法去进行修正,但加权量也不是真正的实际成交量的数字,有存在巨大差异的可能。

现实的统计方法当然是考虑由于实际统计工作的困难,但经济学从理论上必须应该明白什么才是真正的“平均价格”。现今是大数据云计算时代了,采样的难易程度更不应该是经济学屈从于商业习惯的理由。如果说不让遗漏任何一次交易,是否就可以使用∑Pi/i得到准确的平均价格?当然不行!因为平均价格根本就不是这样计算的!上述举例如果是真的就只有这三笔交易呢?

当然,经济学几百年来都没有认识到市场上的价格的真正含义,受到商业俗语“商品价格”的误导而不知道“价格就是交换比”以及“价格是针对两种交易物而言的概念”而不是只针对相互交易的两种交易物之一而言的,在此基础上,搞不清什么是总体上的平均价格自然不足为奇了。

关于价格不能加和,《西方经济学的终结》当中就有明晰。本人在人大经济论坛学着专栏的第一个帖子《从工厂的订单说起》也是再说这个问题。说《德布鲁那块诺贝尔奖牌一文不值》也是依据于此。德布鲁的错误更加离谱,不仅仅是强度变量相加,而且把不同量纲的价格相加。

 

第二个要说的是“收入”。算是宏观的经济指标了。

我们已经对“总收入”“平均收入”这些说法耳熟能详了。但现在你应该明白,这样的说法是无意义的,因为它是错误的。

无意义的原因是因为,收入是一个矢量,而矢量是不能简单地做算数加法的。

收入是矢量?对!就像物理学当中的电流,热量和力一样,是有方向性的。

为何收入是有方向性的?因为这是一个私有制社会,整个经济空间被分割成了一个个私有的空间。所谓的“收入”,只是指从外向内的流动,从内向外的流量叫做“支出”。对于收入,可以类比看做是热量的运动,传入热量为正,热量传出为负。

这样说你就明白了,为何当媒体上说国民总收入增加了、说平均工资多少多少、说中国的世界级富豪有几个的时候,会有那么多人不屑和吐槽了——因为收入是有流向的,总收入再多可能与你无关,平均工资再高可能你只是拖后腿的那一个,富豪榜再扩容你可能只是看客——关你何事啊?!你和别人分处在不同的私有空间之内,意念之内把你和他人看作是一个整体而把归属各自的私有财富加和起来“共有财富”,想当然认为“总量”之中有你一份,这不是画饼充饥自欺欺人吗?

在收入问题上,真正有意义的不是“总收入”和“平均收入”,而是要看收入的分布,看基尼系数。

如果某个经济体是全民共产制,那么“总收入”来说就是有意义的。但实际上,一天到晚讲“总收入”的经济体绝大多数都是在搞经济体内的私有制。私有制下,何“总”之有?

“收入”这类概念的矢量特征,决定了“内需无效”——内需对于国民收入的增减来说是完全无效的。这就像热量在一个物体的内部的流动不会影响到这个物体的总内能一样。对于国家这个“空间”来说,只有出口收入,才是来源于外部的流入。所以,《三驾马车只套了一匹没毛的马》,内部的投资和消费,都不会带来国民收入的增减。

这一点,《西方经济学的终结》当中的第九章“货币的平衡”一节当中已经指出,以货币增加为指标的所谓的增长,唯一地来源于货币发行,因为对于全球来说,只有内没有在,人们只有用一个假想它“外生”于经济体的货币当局,源源不断地从“外部”向经济体内部注入货币,才能有来自于“外部”的所谓收入。

对于全球化的宏观经济来说,现在的问题只是两个,第一,这个处在“外部”的货币当局由谁来掌控;第二,来自“外部”的货币流入在内部的子集空间里如何分布。