大数据时代统计学面临机遇与挑战
摘要:作为与数据紧密相关的统计学学科,在大数据的时代背景下,当今数据的获取和规模发生了根本的变化,统计学面临着新的机遇和挑战,需要在方法论上有所突破,研究统计学在大数据时代的发展趋势有着十分重要的时代意义。
关键词:大数据;统计学;样本;机遇;挑战
21世纪爆发的信息技术革命,改变了社会发展过程中的方方面面。在云技术、物联网技术等高科技信息技术的大规模革新背景下,网络数据增长速率十分惊人,海量庞大的数据标志着大数据时代的来临。作为与数据紧密相关的统计学学科,在大数据的时代背景下,将会面临一系列的机遇和挑战,研究统计学在大数据时代的发展趋势有着十分重要的时代意义。
统计学是一门传统的学科,发展至今已经有几千年历史,无论是学科理论领域内还是生产实践过程中,统计学的发展已经十分成熟,存在着许多成熟的研究成果。统计学的不断发展为人类的社会生产带来了极大的影响,随着大数据时代数据呈现海量、分散式的分布状态,其对统计学的影响也是较为明显的。一方面,大数据时代数据之“大”已经超出人们的想象,数据之“全”让人们对于事情的认知更加全面,大数据的多样性、大体量改变了数据样本与总体之间的关系,另一方面,大数据的数据多样性的特点改变了传统统计对数据统计分析的主观诉求,过去人们通过统计分析更偏向于追求“为什么”,而现在的统计分析更趋同与追求“是什么”。这一系列的影响对于统计学的进一步发展提出了新的发展挑战:
样本统计属于统计学的核心内容,统计学通过样本统计对客观事物数量特点、数量关系等展开研究。在大数据背景下,样本与总体之间的局部与整体之间的关联性将会进一步地降低,造成样本即是总体的变化趋势,因而会造成大样本的标准化的变更。数据来源的多样化进一步的提升了样本数量,继而提升了统计精确度,促进了统计学学科的高精尖的发展。但随着样本数量越来越多,而从网络环境中采集到的数据多半属于非结构化的数据,但传统统计学要求结构化数据,利用传统的关系数据库难以对非结构数据进行有效的转换,难以挖掘大数据大样本数据中的潜在信息。大数据时代统计样本的选取工作难度不断提升,传统统计学缺乏非结构数据的建设,难以发挥出大数据时代,大数据库有效转换非结构与结构数据的优势,也为统计学的进一步发展提出了新的挑战。
随着信息计算机技术的快速发展,基于计算机运算环境的统计学软件应运而生,统计学软件的使用有效提升了统计学中对数据分析和处理的效率和精准率,统计模型也进一步的简化了统计的实际操作,更有利于一般性的统计工作的实践操作。大数据背景下,现阶段发展较为成熟的统计学软件如SPSS、DPS等,尚不能够实现大数据高速传输、存储功能,软件功能还需要一定的开发和升级。与此同时,数据在大数据时代下属于一项资本,其被开发的水平还略显不足,绝大多数被互联网、搜索引擎以及电子商务等相关
IT公司、统计机构所掌握。
在大数据时代,统计学的统计效率得到了更好的体现。一方面,大数据的多样化、及时性特征能够有效弥补传统统计中数据的滞后
大数据时代统计学面临机遇与挑战 来自淘豆网m.daumloan.com转载请标明出处.