大数据对官方统计的影响
茹艳娜
随着社会生产力的不断发展,特别是进入IT时代以来,人类积累了海量的数据。互联网上一天的数据告诉我们,;发出的邮件有2940亿封之多;200万篇博客文章在网上发布,相当于《时代》杂志刊发770年的总量……更重要的是,数据已经不仅仅是数据本身了,已变成了一种业务。毋庸置疑,大数据时代已经来临。面对日新月异的形势,作为生产和管理数据的政府统计部门,面对大数据带来的新形势和新变化,更是机遇和挑战并存,动力与压力同在。而近几年来,中国政府统计系统积极推进以一套表为核心的统计“四大工程”,极大地提升了政府统计工作的信息化水平,也为大数据的应用奠定了相对较好的基础。我们要高度重视大数据对政府统计工作正在带来和将要带来的各种影响,充分认识推进大数据应用的必要性和紧迫性,加强顶层设计,分专业分步骤实施,以推动统计生产方式的变革和统计生产力水平的提升。
一、“大数据”对统计的冲击
(一)对统计理念的冲击
“大数据”改变了人们对数据的需求层次。过去,人类的认知能力有限,受数据获取技术的制约,想要获取大范围的情况比较困难,只能感知身边的个体数据乃至群体(中观)数据,人们对世界的认识不够全面客观。另一方面,统计数据反映的是总体趋势,往往无法对应到具体的个体情况。但“大数据”时代的来临使人类第一次有机会和条件在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据。在此基础上形成的数据可以更加偏向个体情况,更加符合个体的感知,产生宏观数据无法实现的价值。
(二)对统计生产流程的冲击
(1)制度设计多样化
传统的统计设计是根据统计研究的目的和研究对象的特点,设定统计指标、统计报表以及调查、汇总方法等制度,通过调查、访问将生产行为转化为可以量化的数据。“大数据”下的制度设计面对的是已经存在的或通过一定手段可以获取的大量数据,需要解决数据从哪里来的问题。弄清楚已经存在的相关数据是通过什么方式产生的,从哪些领域产生的,会对研究目的产生哪些影响,进而确定采用什么样的数据来反映统计目标。此外,“大数据”客观上为传统的统计提供了更多的方法,并且可在一定程度上免除调查过程中的人为因素干扰。
(2)数据采集智能化
传统统计是通过结构化的报表和统一的计量方式将被调查对象的行为转化为可用的数据,这其中需要被调查者的参与,统计数据的质量难以控制,并且矫正这些调查误差的成本很高。但在大数据时代,数据来源于信息技术记录下的原始数据,这些数据的参与仅仅依赖于测量方法(如
GPS定位测量、超市收银管理系统),而不需要调查对象长期、认真的配合。同时互联网、云计算等技术将大大提高数据采集的智能化水平,这种智能化的数据采集方式是传统统计调查难以相比的。
(3)数据分析专业化
传统的统计分析是根据统计制度设计的要求以及对研究对象的认知,对采集上来的结构化统计数据进行计算分析,重点描述过去的这段时间发生的变化,对未来的发展情况进行统计意义上的预测。“大数据”背景下的数据分析,面临的是大量存储于各处的非结构化或半结构化数据环境,要将这些无法识别和运算的信息转化为结构化的数据,还需洞察出语义、态度、情感、社会关系、效果等传统统计难以解决的问题。即使针对结构化的海量数据,所要
大数据对官方统计的影响 来自淘豆网m.daumloan.com转载请标明出处.