下载此文档

生物信息小论文要点.doc


文档分类:论文 | 页数:约10页 举报非法文档有奖
1/10
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/10 下载此文档
文档列表 文档介绍
生物信息之大数据处理摘要: 计算机技术的进步使得人们发现很多生物学问题可以使用计算机迅速有效的解决。于是, 大量计算机科学家/ 数学家/ 统计学家涌入生物学这片处女地, 使用算法和统计学解决各种各样的生物学问题。而大数据的到来,正给这片处女地带来了新的机遇。这篇论文要讲的,就是生物信息与大数据处理之间的关系和处理之道。主题词: 大数据,生物信息,数据库,数据挖掘,基因测序,蛋白质组学。一. 生物信息与大数据之间的紧密联系生物信息学是在生命科学的研究中, 以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是 21 世纪自然科学的核心领域之一。目前的生物信息学基本上只是分子生物学与信息技术( 尤其是因特网技术) 的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据, 其研究工具是计算机, 研究方法包括对生物学数据的搜索( 收集和筛选)、处理( 编辑、整理、管理和显示) 及利用( 计算、模拟)。生物信息学作为一门新的学科领域, 它是把基因组 DNA 序列信息分析作为源头, 在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测, 然后依据特定蛋白质的功能进行必要的药物设计。基因组信息学, 蛋白质空间结构模拟以及药物设计构成了生物信息学的 3 个重要组成部分。从生物信息学研究的具体内容上看, 生物信息学应包括这 3 个主要部分:⑴新算法和统计学方法研究;⑵各类数据的分析和解释;⑶研制有效利用和管理数据新工具。生物信息的发展伴随着计算机计算能力提高和生物学数据的积累。当然还有数学理论和算法在生物学数据的应用。目前主要的是在数据处理,数据挖掘和预测。比如基因组组装, 基因预测和蛋白结构预测。计算机技术的进步使得人们发现很多生物学问题可以使用计算机迅速有效的解决。一个例子就是人们七十年代开始使用数据库存储已知的 DNA/ 蛋白质序列, 随之而来的问题是如何快速搜索这些序列, 而后人们又想知道如何理解 DNA/ 蛋白质的序列, 再往后人们想图形化的看到这些序列, 再往后。。。就这样, 大量计算机科学家/ 数学家/ 统计学家涌入生物学这片处女地,使用算法和统计学解决各种各样的生物学问题。生物技术的进步带来基因组学/ 蛋白组学/ 各种组学的出现, 使得海量的数据积累变得非常迅速, 而不得不使用计算机和统计学来处理。人类基因租的测序之所以是里程碑式的事件, 并不光是因为我们测出了人基因组。基因组的出现同时也标志了生物学大数据时代的黎明到来。人类基因组有 3G ,测一百倍覆盖率就是 300G 的序列数据。二代的测序技术让我们生成数据的能力指数级放大。到现在,一个研究生一礼拜生成和处理数百 G 的数据是司空见惯的事。这样规模的数据,没有生物信息学的工具和高性能计算机是不能处理的。就根据以上推论,生物信息与大数据处理密不可分。二. 大数据的分析从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析, 只有通过分析才能获取很多智能的, 深入的, 有价值的信息。那么越来越多的应用涉及到大数据, 而这些大数据的属性, 包括数量, 速度, 多样性等等都是呈现了大数据不断增长的复杂性, 所以大数据的分析方法在大数据领域就显得尤为重要, 可以说是决定最终信息是否有价值的决定性因素。基于如此的认识,大数

生物信息小论文要点 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息