下载此文档

蛋白—蛋白打分函数.pdf


文档分类:办公文档 | 页数:约45页 举报非法文档有奖
1/45
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/45 下载此文档
文档列表 文档介绍
分类号:O459 密级:
UDC:539 学校代码:11065
硕士学位论文
蛋白-蛋白打分函数
毕景军
指 导 教 师 阎世英 教授
学科专业名称 物理学
论文答辩日期 2016 年 5 月 23 日
摘 要
蛋白质作为生物功能的主要实现者,在生命活动中扮演着重要的角色。蛋白质的
三维结构是发挥生物功能的基础。我们通过蛋白质的三维结构可以清楚的了解到很多
生物学中的现象,例如基因的复制、翻译、转录、突变和遗传密码的分析与破译。我
们还可以知道细胞免疫反应、中间代谢、周期调控和信号传导等。目前能准确测得蛋
白质三维结构的主要是一些实验方法,例如 X-射线衍射和核磁共振等一些物理实验方
法,但由于蛋白质的不稳定性以及实验测量的高成本性,通过实验的方法去确定每个
蛋白质的结构是不切合实际的,因此通过建模预测的方法来预测蛋白质的结构变成了
生物信息学的一个热门的方向。
对于蛋白质结构的预测主要通过蛋白-蛋白对接软件来完成。蛋白-蛋白对接主要
分为两步:构象的生成和打分排序。首先为了寻找蛋白-蛋白复合物中配体-受体可能
的结合模式,通常让配体蛋白与受体蛋白尽可能的接触从而产生足够多的构象。在这
些足够多的构象中,尽量包含近天然结构。之后再通过打分函数对这些足够多的构象
进行打分排序,从这些构象中挑选出最有可能接近蛋白-蛋白复合物的天然结构的构象。
本文通过基于知识的方法,结合机器学习的方法。从已有的蛋白-蛋白复合物结构
数据库中根据已知的蛋白-蛋白复合物结构,提取相关信息,结合 SVM (support vector
machine)训练得到分类模型。利用该模型可对蛋白-蛋白对接过程中生成的构象进行打
分排序,从中挑选出最有可能接近蛋白-蛋白复合物天然结构的构象。我们通过利用大
量的 PPI 结构信息,使用机器学习方法构建 PPI 结合构象的预测模型,希望对提高打
分函数在构象识别方面有一定的帮助。
关键词:PyRosetta; SVM; 距离
Abstract
As the main implementation of biological function, protein plays an important role in
the life activities. Three-dimensional structure of protein is the basis of its function. Through
the three-dimensional structure of the protein, we can learn a lot of biological phenomena,
such as gene transcription, translation, replication, and the analysis of the genetic code and
decode, at the same time we can also understand the cellular immune response, intermediary
metabolism, cycle regulation and signal transduction, etc. The most accurate structural
characterization of proteins is provided by X-ray crystallography and NMR spectroscopy
and other physical experiment method, but consider protein instability and high-cost of the
experiment, through experimental method to get the protein's structure is not realistic, so the
method by modeling prediction to predict protein stru

蛋白—蛋白打分函数 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数45
  • 收藏数0 收藏
  • 顶次数0
  • 上传人陈潇睡不醒
  • 文件大小3 MB
  • 时间2021-10-30
最近更新