百度这个企业真是挺神奇的,居然连统计数据这种枯燥乏味的东西也不轻易放过!
长久以来,查阅统计数据,只能依靠翻阅统计年鉴或相关资料图书,或者咨询相关人士,或者上网查找相关资料,但无论是图书馆还是统计网站,都没有真正把全国的各类统计数据资源整合起来,查找起来十分不便。从这个意义上讲,百度统计数据的诞生,不仅是一件大好事,而且是具有里程碑意义的重大事件。它与网友见面的第一阶段内容,已经涵盖了从建国至今60多年逾2亿9千万个统计数据,全面、权威,而且免费。这是难能可贵的。
我尝试着对多个指标进行了检索,发现该系统的确包容了不少统计指标,至少各地统计年鉴中拥有的资料已经都在其中了。不过,在使用时我也发现,该系统存在编造采集时间,与原始数据出处不匹配的情况。比如,《常州市1996年科技进步监测指标得分和在江苏省内位置统计》一表,标明1996年12月31日采集,却摘编自《常州统计年鉴1998》。1998年的资料,1996年怎么可能采集到呢?再比如,《江苏省2000年各城市.县主要经济指标统计(一)》一表,标明2000年12月31日采集,却摘编自《无锡统计年鉴2001》,稍有统计常识的人都知道,统计年鉴最早也只能在下一年度的五、六月份出版。当年年底是无论如何不可能采集到统计年鉴数据的。《江苏省2002年各城市.县主要经济指标统计》也是同样的问题,标明2002年12月31日采集,却摘编自《无锡统计年鉴2003》。大概编辑以为当年的年鉴都是年底出版的吧。
另外一个比较致命的问题是,这些统计数据,全部以表格方式而不是图片方式存贮并供检索查阅的。那么,它们在上网前,有没有经过认真负责的校对,数据的质量是否有保证,就很让人生疑。毕竟,所有的资料都不是出自百度,百度也不可能拥有那么多专业的统计人员。所以,对这种统计数据搜索的实用性,还有待进一步观察。按我个人的意见,比较好的处理方式是,将各种公开出版的统计年鉴扫描成图像文件,然后精心地编辑关键词,使用户搜索到的是原版数据。这样,用户使用起来就更放心了。
长久以来,查阅统计数据,只能依靠翻阅统计年鉴或相关资料图书,或者咨询相关人士,或者上网查找相关资料,但无论是图书馆还是统计网站,都没有真正把全国的各类统计数据资源整合起来,查找起来十分不便。从这个意义上讲,百度统计数据的诞生,不仅是一件大好事,而且是具有里程碑意义的重大事件。它与网友见面的第一阶段内容,已经涵盖了从建国至今60多年逾2亿9千万个统计数据,全面、权威,而且免费。这是难能可贵的。
我尝试着对多个指标进行了检索,发现该系统的确包容了不少统计指标,至少各地统计年鉴中拥有的资料已经都在其中了。不过,在使用时我也发现,该系统存在编造采集时间,与原始数据出处不匹配的情况。比如,《常州市1996年科技进步监测指标得分和在江苏省内位置统计》一表,标明1996年12月31日采集,却摘编自《常州统计年鉴1998》。1998年的资料,1996年怎么可能采集到呢?再比如,《江苏省2000年各城市.县主要经济指标统计(一)》一表,标明2000年12月31日采集,却摘编自《无锡统计年鉴2001》,稍有统计常识的人都知道,统计年鉴最早也只能在下一年度的五、六月份出版。当年年底是无论如何不可能采集到统计年鉴数据的。《江苏省2002年各城市.县主要经济指标统计》也是同样的问题,标明2002年12月31日采集,却摘编自《无锡统计年鉴2003》。大概编辑以为当年的年鉴都是年底出版的吧。
另外一个比较致命的问题是,这些统计数据,全部以表格方式而不是图片方式存贮并供检索查阅的。那么,它们在上网前,有没有经过认真负责的校对,数据的质量是否有保证,就很让人生疑。毕竟,所有的资料都不是出自百度,百度也不可能拥有那么多专业的统计人员。所以,对这种统计数据搜索的实用性,还有待进一步观察。按我个人的意见,比较好的处理方式是,将各种公开出版的统计年鉴扫描成图像文件,然后精心地编辑关键词,使用户搜索到的是原版数据。这样,用户使用起来就更放心了。