: .
大数据对科学哲学的新挑战
大数据对科学哲学的新挑战
2016-05-11 09:30:44 作者:7天论文网 【大 中 小】 浏览:8次 评论:0条
所谓大数据(Big Data),从字面意思而言就是指规模特别巨大的数据集,以至于用常规手段难于处理,必须使用专门的数据挖掘技术。由此看来,大数据最基本的构成是数据,其本质的问题仍是数据的问题。所谓数据,从狭义来说就是有根据的数字,也就是表示计量的数字以及为数字提供的语境;而大数据时代所说的数据是广义的数据,它包括一切能被计算机处理的二进制编码信息。大数据是一场新的数据技术革命,它对工作、生活、学习以及思维方式等诸多方面都将产生全方位的影响[1]。就像历史上的每一次重大技术革命都会给科学研究范式带来重大变革甚至导致科学革命一样,大数据技术革命也可能给未来的科学研究带来革命性的技术手段,并对传统科学哲学诸多基本问题带来新挑战[2]。
一、大数据与科学研究的新对象大数据给科学研究带来的最大变化是科学研究对象的变化,从直接的自然世界或精神世界变成了间接的数据世界。在前科学时期,人们主要是在劳动、生活实践中直接观察星空、大地以及自然界的万事万物,因此其对象是直接的自然现象。古代科学和近代科学虽然已经有了科学观测与实验工具,而且由亚里士多德发展出演绎法以及培根发展出归纳法两种科学研究的方法工具,可以实现从现象到理论的经验提炼,以及从旧理论到新理论的逻辑推演。但是,从科学对象来说,无论是古代科学还是近现代科学,其研究对象都仍然是直接面对自然现象。从直接观察自然现象到实验室的受控实验,科学观测的手段虽有进步,人与自然对象的距离有所变化,但科学研究的对象没有变化,都是直接面对自然现象,都停留在波普尔所说的世界1 里。而我们的人文社会科学则采取对人类及其社会现象进行观察、分析,研究对象是波普尔所说的世界2,即精神世界[3]。
20 世纪中后期,随着计算机科学技术的发展,科学对象发生过一次重大变化,即虚拟世界的出现。以往的科学在面对复杂对象之时,往往都从结构的视角将复杂对象简化、还原为简单要素,但在此过程中容易造成信息失真,因此难以反映对象的真实与客观。于是,利用计算机的强大功能,我们从功能模拟的路径,用仿真模型来模拟难以存储和保存,而在大数据时代,存储技术发生革命,特别是云存储技术让我们可以便捷地存储海量数据,存储成本特别低廉。第三,数据传输方式发生了质变:以往的数据传输不便,最快无非是通过纸质媒体在不同的地方传输。正因如此,许多数据往往被使用一次后就沉淀下来,成为“死”数据。随着网络技术特别是移动网络技术的发展,数据的传输基本上以光速传递,因此完全做到了即时、在线。第四,数据的处理方式发生了质变:
以往对数字的计算最快速的方式无非是中国的算盘,对非数字型信息只能人工阅读、浏览。随着计算机技术的发展,特别是最新的云计算等数据挖掘技术的兴起,无论是结构化数据还是非结构化数据,都可以通过云计算等技术进行快速处理,因此可以从海量数据中便捷地挖掘出有价值的信息[4]。
数据在科学研究中一直具有举足轻重的作用,但小数据时代与大数据时代的数据在数据性质上却有重大区别。以往,在数据采集之前就有了各种计划和安排,先有了理论预设再设法采集数据。根据观察渗透理论,人工观测或受控实验得来的数据不但数量少,而且最关键的是缺乏客观性,主、客体之间缺乏必要的观测距离。而大数据时代,由于人工不再参与其中,由智能系统自动生成的数据没有了理论预设的影响。也就是说,这些数据最初采集的时候并没有使用目的,仅仅作为“数据垃圾”或者叫作“数据尘埃”保留了下来,后来由于某种需要从数据垃圾中发现了其新用途,于是数据垃圾变废为宝。这样,大数据时代的数据与主体拉开了观测距离,因此更具有客观性。由各种数据汇聚而成的大数据构成了一个客观世界,这个世界是客观物质世界和主观精神世界之外的数据世界。按照波普尔“三个世界”的划分标准,这个客观数据世界应该属于世界3[3]。作为世界3 的数据世界是物自体的映射世界,它将物质世界和精神世界统一为一个客观的数据世界,全面反映了事物或精神的本质属性。
大数据时代的数据是自动生成的数据世界,科学研究者可以不再直接与自然或社会研究对象打交道,直接通过挖掘数据就可以从事科学研究活动。例如,高能物理研究者不一定需要自己从事粒子实验工作,只要挖掘由对撞机生成的大数据就可以开展高能物理研究工作,由此,传统的高能物理研究变成了数据挖掘工作。天文学研究也发生了类似的变革,射电望远镜被智能化之后能够自动采集、生成数据,天文学家只要挖掘数据就
大数据对科学哲学的新挑战 来自淘豆网m.daumloan.com转载请标明出处.