由于云计算、物联网、智慧地球等概念的火热,人们开始关注大数据处理了。美国海洋和大气局尝试利用大数据业务协助进行对气候、环境、天气的研究和商业性探索,美国宇航局利用大数据业务进行航天和其他领域的探索。制药企业和能源企业则借助大数据业务进行更多实实在在的研发,例如药品实验和地球物理分析。
象IBM、EMC、ORACLE、GOOGLE、INTEL这样的国际巨头,无疑是大数据处理技术的领跑者,但是这并不意味着他们就可以获得大数据处理技术竞争的胜利,因为大数据处理技术和传统数据处理技术有本质的不同。
而在第四届中国云计算大会上,大数据处理也成为专家学者关注的话题。那么中国能否在云计算竞争中,获得大数据处理技术的国际话语权?
1、大数据只是小数据的集合,其核心在于组织管理方式的选择
事实上并不存在所谓的大数据。大数据本质上是大量小数据的集合。地球气象数据不过是全球不同地理位置气象站采集数据的总称。
目前所面临的大数据难题,是由所选择的技术路线决定的。尽管人们知道计算机的本质目的是处理数据,但是由于文化的影响,在目前的计算机理论里,计算机工程师只是按照所观察到的信息的表象来建立数据模型。在这样的模型里,数据均匀分布在一个容器里,然后针对这个模型来设计数据处理方法。而虚拟世界里的数据处理是通过计算机所提供的外部能量(计算能力)来完成的,所以当数据量达到一定程度时,受物理世界自然规律的约束,计算机将无法提供完成一个数据处理过程所需要的能量。
作为人类智力活动的产物,数据处理方法是存在不同选择的,这些方法不受物理世界自然规律的约束,只是设计者的选择。目前人们所使用的数据处理方法来自于国际巨头公司的软件工程师,人的思维差异导致了IBM、EMC、ORACLE、GOOGLE、INTEL的数据处理方法的差异,不过这些不同的方法基本上都获得了专利保护,成为市场竞争的取胜武器。
大数据处理是人们在云计算时代面临的一个必须解决的难题。哲学上有一句话,量变到质变,就是说当数据量达到一定程度时,就会发生质的改变。这意味着目前的这些被国外公司完全控制的数据处理技术将不能解决大数据处理难题,必须寻找新的处理方法。
这个特征也给中国的本土中小微企业提供了机会。
2、云计算技术构建的是低熵数据管理系统
国际巨头目前所提供的数据管理系统是高熵系统,这种方法并不符合物理世界本身的规律。尽管全球气象变化是由全球不同地区的气象变化引起的,但是这不意味着这个变化是由不同地区的参数同时发生作用的,事实上这是一个复杂的层次变化的过程,类似水波纹形式传递变化数据,在不同的区域形成不同的参数,最终一层获得的参数来自它的上一层,这个参数并不是最原始的变化数据。
因为自然界是一个执行熵规则的系统,所以当负熵介入后,系统会按照内部稳定平衡原则重新组织,以便达到高熵系统。蝴蝶效应就是这个过程的具体表现。
由于思维模式和技术的原因,目前人们设计的数据管理系统是一个无序、均匀的高熵系统。以全球气象系统为例,当数据量不大的时候,可以通过外部能量来推动系统运行,从而获得一个计算结果,但是当数据达到一定量级的时候,由于人们无法提供足够的外部能量,所以系统将无法正常运行。这个外部能量可以通过有效计算量来体现。
所以云计算创建的是低熵数据管理系统,数据量的增加不会导致外部能量的增加,从而保证系统在任何时候都能正常运行。
3、大数据处理技术属于梯级数据处理技术
信息是智能对象在其所创建的虚拟世界里用来表征“实体”存在的一种形式。人类采用符号来作为虚拟世界里存在事物的“形”,并按照设计的规则运行,从而实现不同独立个体之间沟通交流的目的。这种符号就是语言。符号会以视觉、声音或者触觉方式来传递。
中国最古老的符号可能是伏羲先天八卦,乾、兑、离、震、巽、坎、艮、坤,分别代表天、泽、火、雷、风、水、山、地。伏羲通过这些符号建立了和自然界存在事物的关系,所以人们在交流的时候,就可以采用这些符号来传递自然界的事物图象了。
人们真正关心的是和物理世界对应的信息,这种信息反映了真实存在的事物。处理信息的目的就是寻找事物在较大范围内产生的影响,比如某个村的菜农种了1万斤白菜,信息处理的目的就是寻找全国范围内白菜价格的影响。事实上,该菜农所产生的直接影响仅限制在这个村里,而对乡镇的影响来自所管辖全部村的整体影响,并非来自该菜农个体的影响。同样,乡镇的影响扩散到县,按照这种层扩散方式,最终达到全国,如果没有外部阻力,这种影响将会扩散到全球。
这个例子表明,有效、合理的信息处理方法是采用梯级方式完成的。在一个采用层次结构地理位置服务技术创建的果业数据处理云计算系统里(http://sngy.cn.em258.com),数据处理方法就包含了梯级处理思想。
4、中国获得大数据处理技术话语权的机会有多大?
从技术的传承性来看,中国获得大数据处理技术话语权的机会小于1%,因为中国没有掌握任何传统的数据处理核心技术;但是从革命性技术的质变飞跃特征来看,中国获得话语权的机会大于51%,因为中华古代文化思想可以帮助中国的科技人员尽快掌握云计算核心技术和关键技术。
中国能否在未来3-5年内真正获得大数据处理技术的部分话语权,或许需要考虑以下几个方面的因素:
(1)从原始基础发明专利技术入手,控制大数据处理技术的源头。
数据处理技术本质上是人的智力活动的结果,专利技术和方法是人设计的数学规则。计算机是在数学规则约束下的逻辑运行载体。对于一个逻辑运行载体来说,必定存在一个起始入口,而起始入口的数学规则就是原始基础发明方法,后续的应用发明方法必定受原始基础发明方法的约束。比如目前的计算机采用二进制规则以及图灵机模式规则,后续的任何方法都受这两个基础方法的约束。
如果申请的原始基础发明方法被专利审查人员驳回,那么就基本上失去了在这一领域的话语权。因为国内的企业必须要和国外企业争夺基于该基础方法之上的应用发明专利,由于传统技术力量和资金的巨大差异,国内企业基本上没有能力和国外企业竞争。即便是华为这样有钱的企业,也无法和国际巨头抗争。
(2)从心灵深处放弃对国外技术的迷信,敢于创新。
由于中国在信息技术领域基本上没有话语权,所以形成了对国外技术的强烈依赖心理。在中华文化以及政策体制等因素的影响下,中国似乎在IT领域里失去了创新的激情,为了获得个人或者局部团体的利益,基本上成为了国外技术的应用场所和测试基地。这种现状决定了真正的核心技术和关键技术不会在中国出现。
云计算竞争实际上是国家集团之间的竞争,技术话语权决定了国家话语权。这是因为云计算将实现万物相连的“智慧地球”,这个目标符合社会发展规律,是任何国家都无法阻挡的历史潮流。
所以在云计算竞争中,中国必须要掌握核心技术和关键技术。而要实现这个目标,就要有独立的创新思想和敢于牺牲自我利益的勇气,同时还要打破目前的建立在西方国家技术之上的学霸体系环境。由于中国的科研机构的经费大多数来源于政府部门,而学霸体系是保护他们利益的主要手段,从人性的角度来看,这个体系是不能依靠内部的能量来打破的,而且打破这个体系的外部能量也是不存在的。也就是说,在相当长的一段时间内,中国的科研是在国外技术火车头的带动下运动的,因此无论其如何努力,似乎超越火车头的机会是不存在的。
所以按照现实主义的观点,企业,尤其是国内本土的中小微企业,才是获得云计算核心技术和关键技术的主要力量。因为这些企业认为云计算提供了一个重新分配利益的重要机会,为了摆脱目前的困境,他们敢于冒风险,寻找脱离国外技术控制的新方法,获得和国际巨头平等对话的权利。
(3)政府要真正提供开放公平的环境,包容在探索过程中出现的社会问题。
云计算的技术探索过程是一个风险很大的过程,会带来很多意想不到的社会问题。这是由云计算的全球垄断特征决定的。在几年前,西方专家就提出了未来全球“五朵云”的观点,得到了很多人的认同。这种舆论引导对中国的中小微企业推广云计算产品是很不利的,人们会在不了解产品和技术的时候就会加以否认,工商有关执法人员会坚定地说,微软、IBM、Google还没有做出来,你们怎么可能做出来?然后为企业制造具有中国特色的麻烦。
按照IT企业的历史发展规律,目前这些知名的企业或许在云计算时代被淘汰。比如美国《福布斯》网站发表特约撰稿人埃里克-杰克逊的文章称,由于互联网领域新老企业之间存在本质差异,因此当新技术趋势出现时,老企业大多无法适应。这不仅可以得到理论支持,同样有前车之鉴。因此,谷歌和Facebook很有可能在未来5年到8年内彻底消失。
所以对于地方政府部门来说,需要提供一个真正开放公平的环境,使中小微企业有发展的土壤。这并不影响政府部门的政策向大企业倾斜,只需要包容中小微企业在发展探索过程中出现的社会问题就可以了。敢于研究云计算核心技术和关键技术的中小微企业,其自身的生存能力是很强的,在探索的过程中如果出现了问题,对于地方政府部门来说,可以不雪中送炭,帮助他们解决问题,但是最好不要雪上加霜,毁灭他们获得云计算国际话语权的希望。