自从1850年德国物理学家鲁道夫·克劳修斯首次针对热力学系统提出熵的概念以来,这个名词在控制论、概率论、数论、天体物理、生命科学等领域都有重要应用,在不同的学科中也有引申出的更为具体的定义。100年后,香农提出信息熵的概念,解决对信息的量化度量问题。不过热力学中熵表示的是“系统混乱状态”;信息论中信息熵表示的是信息量;生态学中熵表示的是生物多样性。
克劳修斯认为,一个系统不受外部干扰时,具有往内部最稳定状态发展的特性,这就是熵的早期含义。
熵是克劳修斯设计的,用来表征系统混乱程度的数学方法,其本身是人的智力活动的结果。这也是熵在不同领域的定义存在差异的原因之一。
熵的概念适用于任何一个存在的系统,无论是物理世界里的物质系统,或者虚拟世界里的信息系统。因为对于一个孤立的系统来说,追求内在的平稳是基本的设计要求。
一、认识物质系统的熵和信息系统的熵
物理学家认为人类所处的宇宙是一个封闭的孤立系统。这个系统是通过能量的流动来体现存在价值的,系统的价值是采用熵来描述的。在宇宙形成的初期,是一个熵值很低的系统,一切都在有序的运行,然后按照热力学第二定律,系统的熵值不断增加,最终归于死寂。当然这只是一个现代科学的假设,一个目前比较流行的观点;也存可能在另外假设,宇宙通过外部能量来维持低熵状态,确保系统的有序运行。
1、地球水系统的熵
在人类所观察到的物质系统里,似乎层次结构的系统是最好的低熵系统,比如人们观察到的星系的分布,生物系统等。
对于人类的生存来说,水系统是非常重要的,它完美地展示了熵的变化特征。
直观的感觉或许不能发现水的层次结构分布形式,但是可以采用逻辑图象的形式对现实中水的分布进行抽象,这样就可以获得清晰的具有层次结构的体系。在一个静态的瞬间,不同层面的水的能量是不同的。
这是一个有序的、不均匀的系统,因此其熵较小。处于最高位层的水的势能最大,但是它们的个体单元最小,其本身的价值也是最小的。按照热力学第二定律,能量总是从高位向低位传递,以便达到系统内部的平衡,所以水总是向下流,以便获得内部的平衡。
水在达到平衡的过程中,我们看到的是水不断汇集所产生的形状,小溪、小河、大江、大海等。
对于一个孤立的过程来说,水最终全部汇集在大海,而其它地方将没有水。但是一个外部能量的介入将打破这个结局,形成一个循环水系统。这个外部的能量来自太阳,它把大海里的水蒸发,然后通过高空搬运到符合规则的地方。
这个过程的主要特征如下:
(1)为水系统提供原始资源。这个过程是通过耗费太阳能获得的。这是最原始的水,处于水体系结构的末端,个体价值得到最最大化的发挥,分布的区域最广,受益的对象最多。
(2)遵循热力学第二定律,从高位流向低位。水开始集中,形成了整体价值,个体价值的影响减小,分布区域开始变小,收益对象开始减少。
(3)汇集到大海,过程结束,归于死寂。整体价值最大,但是个体价值最小。陆地上的对象将无法获得收益。
(4)开始新一轮的循环。太阳把水蒸发,增加水的能量,运送到不同的地方。
2、信息系统的熵
信息目前有很多种不同的定义,和云计算一样,人们是根据自己的观察角度和需要来定义的。由于云计算产品的处理对象是信息,因此中国电子学会云计算专家委员会委员赵文银也对信息作了定义:
信息是智能对象在其所创建的虚拟世界里用来表征“实体”存在的一种形式。比如在以计算机为载体的虚拟世界里,人们采用一组0、1代码来表征一个具体对象的存在。
人们通常有一个习惯性的判断标准,信息应该是完整描述物理世界存在事物的。然而事实并非如此,在一个确定的虚拟世界里,信息是独立存在的,它不是物理世界里的物质或者能量。虚拟世界里的信息只所以和物理世界里的物质存在关联关系,完全是由人们设计的规则决定的。
信息熵是香农1948年提出来的,他把热力学的熵概念引入到信息论,因此又被称为香农熵。信息熵被用来衡量一个随机变量出现的期望值。它代表了在被接收之前,信号传输过程中损失的信息量。一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,信息熵就越高。信息熵也可以说是系统有序化程度的一个度量。
3、云计算时代如何理解熵
每一次的技术革命都会或多或少地修改人们对宇宙的认识观点,这是因为作为知识传递下来的科学理论并不一定是真理,其可能的缺陷来自于创立者自身的局限。
对于一个设计的、合理稳定的控制系统来说,内部的自动运行机制是非常重要的。按照现代科学的概念,人们通常把一个完整的自动运行过程称为“一个生命周期”。这是一个很简单的规则:在一个封闭的系统里,个体的能量总是从高位向低位流动。这个规则的设计理论是这样假设的,能量是个体对象所承受压力状态的量化描述,能量大,则压力大。一个稳定的个体,其承载的压力是较小的,释放压力是任何存在事物的本能行为。
物理学家克劳修斯采用熵来描述这个现象,熵在希腊语里意为“内向”,亦即“一个系统不受外部干扰时往内部最稳定状态发展的特性”。目前这个概念已经应用到了更多的领域,比如信息领域,社会领域等。佛家的禅修也符合熵的特征,当大脑的思维形成一个和外界隔离的封闭系统时,压力就会自然释放,从而形成一个稳定安详的系统。
目前在不同领域里,熵的定义也是存在差别的,这是由观察者的观察角度不同引起的。事实上,作为一个基本规律,在其它领域里所使用的熵的定义可以和热力学中的熵一样,只是对能量的理解做些改变就可以了。
化学及热力学中所指的熵,是一种测量在动力学方面不能做功的能量总数,也就是当总体的熵增加,其作功能力就下降。熵的量度是能量退化的指标。
比如在一个封闭的信息系统里,处于高位的信息在向低位运动的过程中,会消耗能量,这样就会导致总体的熵增加,作功能力下降。
比如地球上的水系统,处于高位的水在向下流的过程中,会消耗能量,从而增加系统总体熵,减少作功能力。
又比如在人类社会的物质系统里,煤炭、石油、核物质携带的能量被消耗后,系统总体熵在增加,总体作功能力在下降。
熵是一个人们用来描述系统在一个生命周期里的内部状态函数。能否开始一个新的生命周期,是由系统外的能量决定的。地球水系统的生命周期是由太阳的能量决定的。或许可以做出这样的假设:在一个有生命力的系统里,个体所携带的能量差异是维持系统运行的原动力。人往高处走,水往低处流,就是对熵的直观描述。
二、从熵的角度设计云计算的技术方法
尽管人们目前并不知道云计算革命带来的具体改变是什么,但是知道云计算一定会再一次改变人类发展的进程,使人类的生存环境发生质的改变,帮助人们解决目前面临的各种重大危机。
1、云计算的定义和使命
云计算目前没有统一的明确定义,人们从不同的角度,参照自己认同的技术、产品、利益,给出不同的定义。
中国电子学会云计算专家委员会委员赵文银认为,云计算是以应用为目的,通过互联网将大量必要的硬件和软件按照一定的组织形式连接起来,并随应用需求的变化动态调整组织形式所创建的一个内耗最小、功效最大的虚拟资源服务集合。
云计算的使命就是重建以计算机、互联网为载体的虚拟世界,使其更加接近物理世界,并和物理世界紧密关联,成为人们生活的一部分。
所以人们构造的虚拟世界必定和物理世界具有基本相同的规则,比如构成元素相同,都是采用两种状态,虚拟世界采用0、1,物理世界采用阴、阳(或者开弦、闭弦);同样采用熵规则来形成生命周期;采用相同的基本数学法则等。
2、云计算产品系统和熵
作为物理学的概念,尽管信息专家已经开始采用信息熵来分析信息,但是对于软件技术人员来说,熵似乎还是一个比较陌生的名词。即便是google、ibm、微软这样的国际IT巨头,在其产品系统的设计过程中,似乎并没有把熵作为其中的一个设计要求。由于系统内部不具备自运行的生命周期,或者说自运行的生命周期很短,所以系统的运行是完全依靠外部能量维持的,因此消耗了大量的能源。
云计算需要解决的其中一个重要问题,就是降低IT系统的能耗。而产品结构的改变是降低能耗的主要途径之一。
一种层次分布的信息系统是一个有序的、能量不均匀的低熵系统,这种系统将会根据自身的能量差沿合适的路径自动流动,然后在低位形成一个无序、均匀的高熵系统。
如果把物理世界也看成是一个计算系统,那么物理世界里存在的系统也可以看成是云计算产品系统。很难想象人类社会是一个无序、均匀分布的系统,如果没有负熵的作用,是否可以正常的运行。观察人类发展的历史,实际上是在通过负熵的作用,逐步建立一个有序、层次分布的低熵系统的过程。
计算机的出现,使人们有了准确、详细了解自身所处环境的工具,而云计算将帮助人们构建一个和现实世界接近的复杂系统,并通过观察系统内信息的变化来了解人们的行为活动在物理世界里所造成的影响。
三、从熵的角度分析几个典型的互联网产品
IT工程师很少从熵的角度来设计一个系统。事实上其它领域的工程师在设计创建一个新系统的时候,似乎也没有考虑熵的因素。造成这种想象的可能原因如下:
(1)目前人们并不担心能源问题,他们相信在他们关心的时间内,可以为这些产品提供足够的外部能源。比如汽车厂商,他们相信现在的石油可以保证他们生产的产品正常销售。
(2)在自私的资本市场体制下,人们只需要关心产品带来的财富,而不需要关心对社会造成的负面危害。比如苹果公司只关心产品可以赚多少钱,不会考虑会造成人类生存系统熵增加的后果(不断更换产品,大量的生产垃圾等)。
(3)人们对熵的认识还比较肤浅,可能并没有意识到熵的真正意义。尽管物理学家提出了一个人们目前普遍接受的假设模型,认为宇宙是一个孤立的系统,初始宇宙是一个低熵系统,然后开始向高熵系统转移,最后归于死寂。但是也可以做出另外的假设,宇宙不是孤立的系统,可以通过外部能量重新开始一个熵的循环。比如在地球生物系统里,如果没有太阳提供能量,当来自植物的能量完成一次循环后,生物系统将归于死寂,但是由于太阳提供了外部能量,所以生物系统可以不断地循环下去。
作为持续运行的软件产品,尽管是工程师设计的信息处理系统,熵同样可以作为判断该系统是否合理的标准。如果一个系统的运行完全依赖外部能量,那么这个系统所消耗的外部能量是最大的,如果一个系统可以通过内部能量差异来进行自动运行,而外部能量只是用来启动一个内部循环初始状态,那么所消耗的外部能量会减少很多。内部循环的过程越长,所消耗的外部能量就会越少,这个系统就越优秀。
所以在云计算时代,人们可以从能耗的数量来判断一个信息管理系统的优秀程度。
1、Google搜索
人们高度关注并研究google,并不完全是因为他拥有大量的财富,而是因为他掌握了全球最多的信息。google通过对信息的处理不仅获得了物质财富,同时也可以达到影响控制其他人的目的,带来信息恐慌。比如谷歌街景地图把一个敏感事件暴露在公众面前。
Google的技术创新能力以及企业文化活力增强了其在云计算时代的竞争能力,使其有可能成为云计算时代的信息霸主。不过要实现这个目标,google需要考虑产品的能耗问题。因为到了未来的云计算时代,在没有外部能量补充的情况下,地球系统内部的有效能量在不断减少,人类需要采用新的科学技术阻止熵增加的趋势,以便保证生存环境的活力。
目前的google产品系统是一个无序、均匀分布的高熵系统,因此系统的运行基本上是靠外部提供的能量来完成的,比如搜索一个村里的土豆信息,以及搜索村的上级区域里的土豆信息,其过程是孤立的,每次搜索都需要外部能量的驱动。
据网上消息称,google在2010年一共消耗23亿千瓦时的电力,约等于21万个美国家庭一年的用电量。而这种能耗每年都在增加。
2、IBM智慧城市
拥有大量专利技术的IBM将是云计算时代的主要竞争者之一。智慧城市作为其实现智慧地球这个云计算战略的主要产品,充分体现了IBM的全球领导者的水平。
然而目前的智慧城市系统存在的缺陷使得IBM无法实现其智慧地球的战略目标。其主要原因如下:
(1)智慧城市是孤立的系统,无法形成全球信息生态系统。比如中国的一些城市都在建设智慧城市,通过信息系统来管理和解决现实系统中的问题,提高办事效率。但是这些城市系统是孤立的,每个系统都是在独立的外部能量驱动下运行的。
(2)每个具体系统的信息分布是无序、均匀的,处于高熵状态。比如医疗系统,人、药品、医院、医疗机构等信息的分布是均匀的,因此无法依靠内部的能量差异进行流动,每次处理都需要在外部能量的驱动下完成。
3、淘宝网(http://taobao.com)
中国庞大的市场需求为云计算发展提供了应用土壤,也因此给中国的云计算企业提供了机会。不过对于中国的本土企业(不受国外资本控制的企业)来说,在赚了很多钱的同时,需要正视一个残酷的事实:云计算最终的竞争一定是核心技术的竞争。如果不能掌握具有自主知识产权的云计算核心技术,无论现在有多辉煌,终究会变成明日黄花。
淘宝网是马云创造的一个传奇。淘宝的成功来自马云对市场环境各种因素的理解,比如中华文化,中国人的心态,地方政府的需求,舆论的需求等等。
网上资料显示,淘宝网目前的店铺数量超过了600万个。这些店铺无序、均匀地分布在一个空间内,是一个高熵系统。由于淘宝网只有一个公共信息展示平台(门户入口网页),所以绝大多数的店铺处于与世隔绝状态,只有极少数店铺可以在展示页面上获得推荐。一个店铺的活跃程度是依靠外部提供能量的多少来决定的。能量指店主的付出,比如做广告、和其它网站交换链接、向用户推荐、不断更换好商品等。
4、亿盟258网(http://em258.com)
亿盟258网是北京乾坤化物公司开发的云计算网站系统。作为中国云计算技术与产业联盟发起成员单位之一,乾坤化物公司目前掌握了几百项云计算核心技术,2007年申请了12项原始基础发明专利,其中两项在2012年获得了授权。一些核心技术方法涉及到基础科学理论方法,比如自然数的非线性处理方法,将修正皮亚诺关于自然数的5条公理系统,皮亚诺描述的自然数只是非线性方法的0阶表现形式;又比如IP地址树方法将可以创建一个包含IPv4和IPv6地址在内的无限IP资源系统,从而帮助人们解决因为空间压力增加而产生的网络系统崩溃的危机。
亿盟258网是采用层次结构的地理位置服务技术构造的一个有序、不均匀的低熵信息生态系统。按照现有的行政区划管理方式,原始信息分布在最高位。以中国为例,地理位置树的分布为中国-->省-->地区-->县-->乡镇(街道办)-->村(居委会)。其中,中国为根部,处于结构的最低位,势能最低,村处于树的最高位,势能最高。
按照熵的规则,对于一个孤立的系统,如果没有外部能量的驱动,处于高位的信息将在势能的驱动下,自动向低位流动。因此在亿盟258网站系统里,将通过6级能量差形成一个生命周期。
当信息汇集到最低位,即中国层面的网站时,系统就变成了一个高熵系统,和目前的淘宝网系统一样,需要耗费大量的能量来推动系统的运行。但是由于在不同层面的行政区域上有不同的信息汇集,因此用户可以在不同的层面获得所需要的信息。如同地球水系统一样,尽管人们无法直接从大海里获得需要的水,但是可以从不同层面的储水系统里获得需要的水,比如水井、水塘、小溪、小河、大江、大海等。
四、熵将成为云计算产品系统生存活力的重要标志
一则来自腾讯科技2012年5月1日消息:据美国《福布斯》网站发表特约撰稿人埃里克-杰克逊(Eric Jackson)的文章称,由于互联网领域新老企业之间存在本质差异,因此当新技术趋势出现时,老企业大多无法适应。这不仅可以得到理论支持,同样有前车之鉴。因此,谷歌和Facebook很有可能在未来5年到8年内彻底消失。
这种观点其实在几年前云计算刚开始的时候就出现了,只是人们并不认为谷歌也有可能在未来的几年内消失。事实上正如文章里所说的,当革命性的技术出现时,传统的企业如果没有掌握新技术,就会被淘汰。这符合组织生态学家提出的“过时责任”(liability of obsolescence)的理念:即随着时间的推移,组织内在的产品战略越来越难以适应他们所处的环境。这很可能成为对当今全球科技业千变万化局势的一种合理解释。
熵是衡量一个信息产品生存能力的重要标志。在相同的外部条件下,低熵系统比高熵系统拥有更长的生存时间。
熵本质上是一个强制的规则,在一个封闭的系统里,其每个成员有平等占有系统资源的权利,最终达到平衡均匀,平衡意味着死寂。一些科学家推测人类所在的宇宙是一个孤立的系统,尽管目前是一个有序、不均匀分布的系统,但是由于没有外部能量的推动,宇宙将会按照熵的规则走向死寂。当然这只是其中的一个假设,不一定就是事实,因此也不必杞人忧天。
所以,在云计算时代,目前的这些国际IT巨头被淘汰的可能性同样很大,对于中国的中小微型企业来说,如果能够掌握真正的云计算核心技术,充分利用中国的市场环境优势,成为全球IT巨头的机会是很大的。