未来怎么防范恒大式曝雷重演
关于发展我国大数据产业的政策建议
蒲少平
内容提要:
金融风险的根源是信息不对称,防范金融风险的最好办法是增加信息对称性,帮助信息弱势方获取信息。建设全国统一的高质量低成本大规模广覆盖方便好用的大型投资数据库,发展大数据风险评估技术,是彻底消除信息不对称防范金融风险的治本之道。应采取“证监会牵头+特许经营+上市公司填报+错误举报奖励”模式,建立大型上市公司数据库,这是彻底根治上市公司虚假信息的唯一正确办法。
关键词:风险 数据库 精准
一. 大型投资数据库是国家的基础设施
二. 注册制亟需高质量上市公司数据库
三. 大数据—精准化—高效率
一.大型投资数据库是国家的基础设施
数据作为要素,它有不同于其它要素的特点:
1.质量极难判断,也就是其真实性极难判断
2.可以几乎无成本复制
3.主要用于分析判断决策
4.经人手处理的数据,量大到一定程度就难免出错
所以,大型投资数据库中如果有了错误的数据,就很容易日积月累,扩散到整个网络,到一定程度将导致决策失误。大型投资数据库主要包括:宏观数据库,行业数据库,企业数据库,市场数据库。
什么是基础设施?它有如下特性:
1.先行性和基础性
基础设施所提供的公共服务是所有的商品与服务的生产所必不可少的,若缺少这些公共服务,其他商品与服务(主要指直接生产经营活动)便难以生产或提供。
2.不可贸易性
绝大部分基础设施所提供的服务几乎是不能通过贸易进口的。
3.整体不可分性
通常情况下,基础设施只有达到一定规模时才能提供服务或有效的提供服务。
4.准公共物品性
有一部分的基础设施提供的服务具有相对的非竞争性和非排他性,类似于公共物品。非竞争性是指:物品的生产成本不会随着物品消费的增加而增加,即边际成本为零。非排他性是指:当某人使用基础设施所提供的服务时,不可能禁止他人使用;或要在花费很高的成本后才能禁止,对这样的服务,实际上任何人都不可能将另外的人排除在外即存在免费搭车。
大型投资数据库就是满足这四大特性的基础设施.
凡是需要资金投入,但又应免费提供给社会的产品,都应由政府来经营.如消防,安全。投资数据库,也是应该免费给社会公众使用的,因为只有这样才会有最多的人使用,从而提高整个社会的决策水平。缺少真实,全面,及时,方便的投资数据库,致使各市场主体做出错误决策,正是我们这个时代面临的难题之一.市场经济是分散决策,当各市场主体得不到高质量的数据,分散的决策就会失误累积,导致市场机制失灵,甚至酿成危机.让各市场主体能免费方便得到丰富数据,从而提高其自主决策水平.这样可大大提高经济的市场化水平,减少政府对经济的干预,优化资源配置. 现在投资类数据生产分布在很多单位,如各中央部门,各地方政府,各行业协会,各做数据库的企业,等等,各自为战,互不衔接,质差价高,错误积累,重复建设,效率低下.应由国家数据局统管起来,建立标准统一各方参与的数据库,就可大大提高投资数据库的生产和使用效率.计算机技术的飞速发展,特别是超级计算机,大数据和云计算技术,已使得我们可以开始考虑建立全国统一的投资数据库的问题.
现在是大数据时代.电脑和互联网产生了几乎无穷多数据.同时虚假数据满天飞.任何一个企业都难以经营好投资数据库.农产品质量一看便知.工业产品质量用几次便知.数据库质量问题要很长时间才可发现.要想做高质量不出错的投资数据库,必然研发成本高,如果由企业来做,必然最后由用户承担成本,导致多数人用不起,实际上限制了数据的传播使用..若是由企业来做数据,也许企业倒闭后才发现其产品质量问题,无从追索其责任,而其对社会的危害已造成.而政府可看成一家永不倒闭的企业,任何时候都可追究其责任。数据库一旦研发出来,可以无成本复制.即生产成本低,可以免费向社会公众提供.政府做投资数据库,则可以用财政收入支付成本,再免费提供给社会.同一数据产品可以同时多人使用,可以反复使用,使用的人越多,使用的历史越长,越容易发现问题,发现问题后可以修复,产品质量可以不断提高.要想有最多的人使用,必须免费.而企业不可能长期生产免费产品.政府做数据还一个好处就是可以更有效地防止利用大数据做恶。所以,投资数据库适合政府来做,不适合企业做.
大数据分析技术现在美国发展很快,据说本拉登藏身地就是用大数据技术发现的( 见Palantir Technologies公司)。中国人多企业多数据多,本来是有发展大数据技术的好基础,可惜现在很多数据都分散在各级政府和民间机构沉睡,而少数民营公司做数据整合则力不从心。中国应该发挥集中力量办大事的制度优势,下大力气建立大型投资数据库。
目前,我国政府做的投资数据库是什么质量呢?央行,财政部和国家统计局有国内三个最大的宏观经济数据库,用户体验很差。而且,我在央行,财政部和国家统计局的数据中都发现过错误。举例如下:
(一)央行
1.2014年9月的金融机构人民币信贷收支表(按部门分类):资金来源总计比汇总数据少10570亿元。
2.1999年12月-2000年3月的金融机构人民币信贷收支表:资金运用总计每个月都比汇总数据多1千5百多亿元。
3.2006年1月-2006年2月,存款性公司概览中单位定期存款比存款性公司资产负债表中的单位定期存款多70亿元,而其他月份是相等的。
4.2006年1-2月,央行货币发行数小于其他存款性公司库存现金+流通中货币,差几百亿,而其他月份是相等的。5.2013年8月金融机构本外币信贷收支表,资金来源总计与汇总数据相差851亿元。6.存款类金融机构本外币信贷收支表,2015年11月,资金来源总计与汇总数据相差24390亿元。2015年4月,资金运用总计与汇总数据相差24071亿元。
7.存款类金融机构人民币信贷收支表,2015年4月,资金来源总计与汇总数据相差17090亿元。2015年4月,资金运用总计与汇总数据相差2267亿元。
8.中资全国性四家大型银行人民币信贷收支表.2015年3月,资金运用总计与汇总数据相差16863亿元。2013年10月,资金来源总计与汇总数据相差2910亿元。2013年6月,资金运用总计与汇总数据相差3652亿元。2011年3月,资金来源总计与汇总数据相差3451亿元。
9.中资全国性大型银行人民币信贷收支表.2014年8月,资金运用总计与汇总数据相差10498亿元。2013年1月,资金来源总计与汇总数据相差410亿元。
10.中资全国性中小型银行人民币信贷收支表.2010年11月,资金来源总计与汇总数据相差17014亿元。
11.其他商业银行人民币信贷收支表。2008年12月,资金来源总计与汇总数据相差2669亿元。2009年10月,资金来源总计与汇总数据相差4023亿元。2008年9月,资金来源总计与汇总数据相差2798亿元。2007年4月,资金来源总计与汇总数据相差1945亿元。2007年5月,资金来源总计与汇总数据相差2023亿元。2007年5月,资金运用总计与汇总数据相差318亿元。2007年10月,资金来源总计与汇总数据相差2302亿元。
12.金融机构外汇信贷收支表。2010年10月,资金来源总计与汇总数据相差337亿元。
13.货币发行(在货币当局资产负债表)=流通中货币M0(在存款性公司概览)+库存现金(在其他存款性公司资产负债表),但2016年1-2月不满足此公式,误差分别是301和144亿元。
14.货币概览。2001年8,10,12月误差分别为2680,2784,3016亿元。
15.存款性公司概览。2015年7月,误差5656亿元。
上述误差再加上一些其他小误差,累计已超过15万亿元。
(二)财政部:在历年全国财政决算报表中用国家-(中央+地方)公式可发现误差,累计1349亿元。
2010-2017年全国财政决算报表累计误差 |
(亿元) |
粮油储备 |
316 |
工艺品及其他制造业 |
158 |
农村最低生活保障 |
144 |
其他农业支出 |
123 |
城市居民最低生活保障 |
116 |
最低生活保障 |
76 |
其他制造业支出 |
74 |
国家粮油差价补贴 |
73 |
乡村债务化解 |
44 |
其他城市生活救助 |
32 |
其他生活救助 |
31 |
20 |
|
一般行政管理事务 |
17 |
气象服务 |
15 |
电力市场建设 |
13 |
其他工业和信息产业监管支出 |
12 |
其他农村金融发展支出 |
10 |
其他国土海洋气象等支出(项) |
10 |
新闻出版 |
9 |
其他粮油事务支出 |
9 |
农业资源保护 |
9 |
地质转产项目财政贴息 |
8 |
财政对基本医疗保险基金的补助 |
7 |
财政对城镇居民基本医疗保险基金的补助 |
7 |
金融部门其他监管支出 |
6 |
高等职业教育 |
5 |
其他水利支出 |
5 |
合计 |
1349 |
(三)国家统计局
1. 国家统计局披露了全国政府消费数据,也披露了各省政府消费数据,若拿全国政府消费数据减各省政府消费数据之和,得到的差应该是中央政府消费数据。但是,2004-2014年,这个差都是负数。
2. 国家统计局称,2011年,规模以上工业企业起点标准由原来的年主营业务收入500万元提高到2000万元,纳入统计的企业单位数当年下降了30%。然而离奇的是,统计口径缩小后的总资产,主营业务收入等财务数据当年全都是大幅增长的(相对统计口径缩小前的财务数据)。
3. 地方财政收入,国家统计局和财政部的数据也不一致。如2016年,财政收入总额差2310亿元,税收差2769亿元,国内增值税差7384亿元,非税收入差479亿元,专项收入差467亿元,行政事业性收费差203亿元。其他收入差879亿元,国有资源有偿使用收入差735亿元。
4. 中央财政收入,国家统计局和财政部的数据也不一致。如2016年,财政收入总额差3380亿元,税收差2773亿元,国内增值税差4106亿元,非税收入差587亿元,专项收入差52亿元,行政事业性收费差23亿元。
5. 国家统计局自己的数据也自相矛盾,中央和地方的数据之和,减国家的数据,差额应该等于零,但是:国家资源税,2012-2017年每年都有差额几十亿元,共计250亿元;证券交易印花税,2008-2015年,每年都有差额,共计194亿元。
6. 国家统计局人口数据,2017年,在分省的统计中,北京的年末常住人口是2171万,其中城镇1878万,农村293万:但在分城市的统计中,北京的年末总人口又成了1359万。是分省统计的口径大?那为什么同年重庆,在分省统计中人口是3075万,在分城市的统计中又是3390万?
7. 据国家统计局数据,2017年新疆年末总人口增长是各省最快的,为1.96%,但乌鲁木齐的人口又是各省会下降最快的,下降了17%。 拉萨的职工平均工资2015年增长了58%,2017年仅次于北京上海,可拉萨的居民储蓄2015年又下降39%.
8. 国家统计局披露的国家财政性教育经费,和财政部全国财政支出决算表披露的教育支出,相差几千亿元,如2016年相差3千多亿元。
这些例子并不能说明这些政府部门做不好投资数据库,恰恰相反,我认为政府完全有能力做好投资数据库,只要有足够重视和投入。
二.注册制亟需高质量上市公司数据库
到底应该怎么根治证券市场虚假信息?我认为上市公司数据库是战略制高点,拿下这个制高点,全盘皆活。
上市公司是全国企业的精华,上市公司数据库也是满足上述四大特性的基础设施,它是大型投资数据库的核心,政府给予适当的投资和干预,优先保证它的质量和正常运行,很有必要。
国务院《关于进一步提高上市公司质量的意见》要求:督促上市公司、股东及相关信息披露义务人真实、准确、完整、及时、公平披露信息。
可是,即便上市公司真实、准确、完整、及时、公平披露信息,但到达投资者手中的信息也未必是真实、准确、完整、及时、公平的。现在上市公司披露的信息文件太多,实际上投资者根本没时间看,且数据分散在各文件中,难以利用,只有集中到数据库才好分析。现在投资者得到上市公司数据的主要渠道链是:1.上市公司发表招股书年报等文件。2.数据公司(比如东方财富)根据这些文件做成数据库。3.投资者从上述数据库下载需要的数据建立自己的数据库。上面每个环节都可能出错,尤其是第二环节。而且,数据公司一般不承诺其数据的真实全面及时。比如,东方财富网站就有这样的免责声明:“东方财富网不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实。”实际上,我就在东方财富的数据库(choice)中发现过大量错误。
由于没有高质量的数据库可用,目前证券分析和投资决策是一项高难度低效率的工作。
上市公司的不诚信和投资者的不理性,严重地阻碍了中国证券市场的发展。怎么才能从根本上克服上市公司的不诚信和投资者的不理性,促进中国证券市场较快较好地发展呢?我认为,关键是要建立真实全面及时方便好用的大型上市公司数据库。现在市面上的上市公司数据库,总的说来是质量差价格高错误多不好用。有人说建立这样的高质量数据库投入太多,难度太大。我认为,看怎么做。如果还是现在由各数据公司各自为战的做法,重复建设,当然是投入多,难度大,还质量差。每家数据公司都没有能力独自建立一个高质量低成本大规模广复盖方便好用的上市公司数据库。其实,中国只需要一个上市公司数据库,如同只需要一个国家电网一样。如果是证监会牵头协调,由上市公司,数据公司,证券公司,基金公司合作呢?产生一个高质量低成本的数据库就不难。可以这样分工:数据公司负责搭建数据库结构和优化设计软件功能,让数据库方便好用;上市公司负责填报数据,如同在证券报公布年报一样,对错误数据要承担法律责任;证券公司基金公司负责使用数据,发表分析报告和投资建议,并在使用中查错纠错。这样就可避免那么多重复劳动和重复投资,成本自然就降下来了,大家也就都用得起了。用的人越多,发现上市公司假账也就越容易。分析师用在收集整理信息上的工作量就可大大减少,现在分析师几周的工作量,将来也许一天就能完成,工作效率成倍提高。各机构分析师更是大有用武之地,等于给证监会增加数百倍编外人员。在这样天罗地网式的严密的监管下,上市公司自然就不敢做假账了,信息质量自然就提高了,注册制也就容易实行了,建立在数据分析基础上的投资者就变得理性了,投资者的利益也就得到保护了。同时上市公司都把精力放在经营管理上,资金向好公司聚集,证券市场必将孕育伟大的公司。
再想开一点,我认为还可以尝试把这个数据库做成开放性的,任何人都可以往这个数据库填数据,比如企业的员工,竞争对手,合作伙伴,产品用户,大股东,会计师事务所,工商税务人员等,甚至包括上市公司大门对面的闲居退休老头,每个人把他得到的上市公司真实信息拿来与大家共享。只要是实名制就不怕出乱子。
这是一举多得的好事。关键是得证监会牵头。
高质量的上市公司数据库建成后,不但可彻底根治证券市场虚假信息难题,同时还为国家的诚信建设起到一个强烈的示范引领作用。一旦整个社会虚假信息减少,将大大减少交易成本,提高经济运行效率。中国应该尽早拿下这个战略制高点。
目前市场上有多家民企在做上市公司数据库,如万得,东方财富,同花顺,天相,益盟,还有天眼查,企查查,财新等等。如果不采取上述合作的办法建上市公司数据库,而是继续现在做法多家公司竞争,各建一个数据库,那未来最好的结局就是赢家通吃,这个赢家必定是数据质量最好但也是成本最高价格最高的那家,也是大多数投资者用不起的那家。这样就不可能形成我前面说的天罗地网式的监管,做假账的上市公司仍会抱侥幸心理违规。
众所周知,中国金融业效率低下。银行和保险效率低,原因之一是因为他们不敢把手里沉淀的资金拿去投资股票。所以,银行只好靠扩大存贷利差来挤压实业的利润,保险只好靠降低赔付率来亏歉客户。这原因背后的原因就是因虚假信息太多而导致的股票市场效率太低。如果建成高水平低成本大规模广覆盖的上市公司数据库,就可基本上根治虚假信息,大大提高证券业和股票市场的效率。我当年揭露银广夏假账花了几个月时间,90%时间是用来收集整理核对信息。若有这样好的数据库,就可能只需要几天。当揭露上市公司假账变得容易,再加上严厉处罚,上市公司的假账就会大大减少。投资效率就会大大提高。所以,我认为,上市公司数据库是一个战略制高点,是牵一发动全身的基础设施,一旦建成,全盘皆活。
上市公司数据库实行“证监会牵头+特许经营+上市公司填报数据+错误举报奖励”模式,将助力证券市场发生四大深刻变革:一。上市公司信息披露方式变革,由文件披露为主变为数据库披露为主。二。监管方式变革,由政府监管变为政府主导下的投资者监管。投资者天生就是虚假信息的死敌,只要条件许可又得到奖励,他们就会积极寻找发现揭露上市公司的虚假信息,由此形成天罗地网式的监管,令造假者无处藏身。三。各数据公司变竞争为合作。目前各数据公司是竞争状态,重复投资,用户分散,想提高质量又怕增加成本,不如合作做一个数据库。四。证券市场的效率由低变高。有了高质量上市公司数据库,投资者收集整理核对信息的时间会大大减少,工作效率大大提高,由此带动整个市场的效率大大提高。
从欧美实践来看,实行注册制的同时或者说实行注册制的前提和基础,就是实行共同诉讼制度。如果说注册制赋予了企业家不需要任何资质就可以随便发行股票募集资金的权利,那么共同诉讼制度则赋予了股民要求不法企业家赔偿损失的权利。上述这两个方面加起来才是股市注册制的完整含义。否则,单独实行注册制,这就为不法企业家随便坑骗投资者,提供了可能,风险巨大。高质量上市公司数据库可以为清除上市公司中的垃圾公司提供极大方便,特别是在发现高水平做假账的上市公司方面,我们亟需高质量低成本大规模广覆盖的上市公司数据库。现在已开始实行全面注册制,高质量上市公司数据库更是迫切需要。
现在, 由于上市公司披露信息繁多且可信度低,证券研究难度极大,导致投资者普遍把证券市场当赌场,胆大者不惜采取各种违规手段,也迫使政府不得不从严监管,据说现在连投资公司都不能在证券公司开户了。这种窒息市场活力的做法很值得怀疑。当年巴菲特起步时不就是把亲朋好友的资金做了个投资公司在证券公司开户买股票吗?而现在,在中国,几个朋友集资搞个投资公司投资股票居然就违法了,甚至连一个优秀的投资者替别人操作股票也违法,这不荒唐吗?
这不得不令我们反思:到底应该怎么防范金融风险?
三.大数据—精准化—高效率
治理国家,制定政策,要在安全稳定和创新之间求平衡。一般说来,自由有利于创新,过度自由又可能危及安全稳定。不创新,将永远受制于人,不安全稳定,更不可能发展。究竟是应该为创新而放松监管,还是为安全稳定加强监管?怎么在利用大数据提高效率的同时防止利用大数据做恶?这是一个精准监管难题。解决此难题,仍需要大数据。
中国的扶贫工作为什么搞得卓有成效?一条重要经验就是滴灌式的精准扶贫。这条经验应该推广到各领域,让各项工作都精准化而不是一刀切。金融监管更应该因企业施策。而大型数据库就是实现监管精准化的基础设施。
第十四个五年规划和二〇三五年远景目标提出:“建设国家数据统一共享开放平台”。
强烈建议:建设国家数据统一共享开放平台速度要加快,早建成早受益。这对于提高企业的大数据风险评估技术水平,发展精准金融,在国际上占领金融制高点,至关重要。有精准金融牌照的企业应和其它一般金融企业分开监管,在规模和速度上尺度更宽松。不发展大数据风险评估技术,就很难改变我国金融效率低,银行利润占上市公司利润44%的局面,所谓金融为实体经济服务就难以落到实处。不管是蚂蚁们的精准贷款,还是政府的金融精准监管,都需要依赖大数据实现精准化。
目前只有各省建的数据开放平台,存在以下问题:1.数据不集中,大量空文件小文件充斥其中,迫使用户花大量时间下载数据。2.标准不统一,各搞一套。这给汇总统计分析增加难度,而大数据分析就是要把来自各方面的数据集中到一起分析。3.使用程序烦琐,每上一省的数据开放平台都要注册登录审核等等,考验使用者的耐心。4.对使用者电脑技术要求高,出现大量普通人看不懂的专业术语,严重阻碍数据普及。5.关键数据打马赛克,搞不懂披露这样的数据目的是什么?
建议组建中国数据股份有限公司,建设数据集中化标准统一化保密分级化用户平民化的国家数据开放平台。 同时,对各省的数据开放平台采取用户打分的办法,体现优劣,促进竞争,提高服务意识。
贵州大数据收费做法质疑。数据产品收费,对大企业有利;数据产品免费,对小微企业有利.凡是对小微企业有利的事,都有助于提高民族的整体创新能力.(1).数据免费目的是提高全社会的决策水平,此举给经济发展和税收带来的经济效益远远超过卖数据赚的钱。理论上每个在市场经济中独立做决策的人都需要数据,而数据收费会导致大多数人用不起数据,尤其是小微企业和个体户用不起数据。(2)可以考虑收数据税的办法,即事后收税,而不是事前收费。数据税应只对用过数据的大中型企业的利润收税,起征点可设置高些。(3)如果卖数据真能赚钱,可能会有多个省份群起效仿(实际上现在已有多个省市在效仿),造成数据的分散。分散的数据容易互相矛盾。而数据应该集中而不是分散,才更有利于使用和管理。(4)数据中的错误是很难发现的,只有用的人多才有利于发现并减少数据中的错误。免费才会有最多的使用者。(5)目前数据分散在各地区各部门,集中到一起看似困难。但复制一份集中起来几乎没有成本。只要全社会形成共识,中央政府大力推动,就能集中。(6)一旦分散在各地的数据库做大规模,再要统一成一个数据库,就难了。(7)数据库免费和图书馆免费是一个道理,都是传递信息,为什么上图书馆免费,用数据库要花钱?何况数据可以无成本复制。
那么建设大型数据库的经费应该从哪来呢?一是政府财政拨款,二是企业捐助,三是数据税。现在政府国企愿意修桥铺路,建机场,甚至愿意搞房地产,却不愿投资大数据库,这是没道理的。政府国企应该成为大数据库的最大最主要投资者。政府投资大数据库的资金还有一条路,就是国企腾笼换鸟,把房地产卖掉,把一般制造业卖掉,减持金融和能源航空等,筹集资金建设国家数据统一共享开放平台。企业愿意捐助学校和博物馆体育馆,却不愿捐助大数据库,也是没道理的。国人的价值观念需要更新,应鼓励企业捐款于大数据库。对大中型企业可考虑采取事前免费事后收税的办法,对小微企业和个人则应完全免费。
最近又有公司曝雷了,这回它叫恒大。证券市场一直不乏这类新闻。如果有了大型数据库,也许几年前就发现恒大的假账了,它搞出几万亿元的窟隆才自我暴露,正说明证券监管的低效率;如果有了大型数据库,p2p的疯狂也许早就被发现被制止了;几千家p2p出事跑路,正说明金融监管的低效率;如果有了大型数据库,那些贪官也许早就被发现了;贪了几百亿才被发现,正说明肃贪工作的低效率;如果有了大型数据库,天津大爆炸也许就能避免,因为异常事总是会在数据中体现;炸出了大坑,正说明安防工作的低效率;如果有了大型数据库,政府就不需要简单地规定这个不许那个不许,而是可以精准地监管,管得恰到好处。
至于大型数据库建成后的安全保密问题,可采取用户分级办法解决。
现在沉睡在各处的数据,就像百年前沉睡在地下的石油,一旦开发将给未来的经济插上起飞的翅膀。
大数据有见微知著的本事,海量的信息意味精准的工作,提高效率请从大数据开始!
建设大型数据库,请从证券业开始,从上市公司开始!
蒲少平,原中国证券市场研究设计中心分析师,已退休。毕业于国防科技大学数学系研究生班,曾在北京中国证券市场研究设计中心从事证券分析多年,公开揭露过银广夏等多家公司假账。研究股市30年,独创一套大数据选股技术。10年资产翻了10倍。