有多少数据可以相信


如果要对未来商业趋势作一个判断,有个词已经在全球政商学界达成了共识,那就是:大数据时代。哈佛大学社会学教授加里·金对此总结:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”与互联网经济一样,这绝不仅仅是信息技术领域的革命,更是在全球范围启动透明政府、加速企业创新、引领社会变革的利器。现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。而“大数据战略”,则是当下领航全球的先机。
对于大数据,其前提是真实、透明和开放。但对于中国,目前无论在哪个领域的数据真实性,就如问某一贪官‘你有多少情人’,很难有准确的答案。从空气监测、GDP统计等等,公共部门统计数据正在丧失公信。常能看到的是,对于CPI、房价等统计数据失真或数据说谎,官方或一些舆论总能给出许多理由,比如统计口径、统计途径、样本差异、加权平均等客观条件或计算技术等。最近刚刚公布的中国基尼系数,由于低于民间数据遭到质疑。事实上,由统计数据引发的“被上座”、“被就业”、“被平均”由来已久,为何科学计算的统计数据与民众直观感受的差别越来越大?我们总是“被和谐”、“被幸福”。
数据说谎或数据“故事”也曾让我们有过深刻的反思。1958年,《天津日报》报道天津市的东郊区新立村水稻试验田,亩产12万斤,并称在田间的稻谷上可以坐人,让群众参观。在那个“人有多大胆,地有多大产”的时代。头脑发热,浮夸风盛行。违背生活常识和简单逻辑的荒唐事情时有发生。看似这个时代离我们已经很远,但跟大跃进频放卫星相比,很多数据“故事”并没有本质的区别,只是让世人看上去更合理。
在信息化时代,谎话难圆,数据容易被人还原或找到佐证。如201212月份出口数据就遭到外资金融机构普通质疑。瑞银认为中国的出口数据与港口和贸易伙伴的进口数据不相吻合,而高盛和瑞穗则用援引制造业PMI的海外订单数据来佐证出口数据的偏离。
在公共部门统计数据缺乏逻辑推论的同时,目前在国内盛行的伪调查、伪报告狂潮也在逐渐消磨中国商业赖以生存的公信根基。中国概念股在国际资本市场被做空,看似是因为会计准则不相融,其根本就是很多中国的海外上市公司的数据操纵或数据作假。由于数据供应机构和企业对数据的作局,让消费者和股民所遭受的欺骗却历历在目。如果市场数据如此脆弱不堪,不仅影响到企业本身的决策,更为深远的影响是断送商业的根基。
好似说谎成了我们的文化。
鉴别泛滥的谎言,已成为国人必备的生存技能。为什么爱说谎?缘于文化基因?体制环境?生存需要?历史学家吴思曾说:一个说谎的、收益很高、成本很低的历史制度,注定会出现大规模的说谎。他们生产谎言,我们伪装相信。
但问题是,我们需要的是一个诚信而真实的世界。