系统分析集胞藻 PCC6803 未知蛋白功能
Systematic functional characterization of
hypothetical proteins in Synechocystis sp.
PCC6803
学科专业:制药工程
研究生:邵明洋
指导教师:乔建军副教授
企业导师:张志军副研究员
天津大学化工学院
二零一二年六月
独创性声明
本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的
研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表
或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证
书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中
作了明确的说明并表示了谢意。
学位论文作者签名:
签字日期:
年
月
日
学位论文版权使用授权书
本学位论文作者完全了解
天津大学有关保留、使用学位论文的规定。
特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检
索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校
向国家有关部门或机构送交论文的复印件和磁盘。
(保密的学位论文在解密后适用本授权说明)
学位论文作者签名:
导师签名:
签字日期:
年
月
日
签字日期:
年
月
日
摘要
未知蛋白(Hypothetical proteins)是指缺少功能注释信息的蛋白,它们的存在
不仅是基因组注释的一个难题,更是整个生物学上的一个难题。一般刚测序得到
的原核生物基因组中,有将近 30%的蛋白被注释为未知蛋白或者保守未知蛋白。
对于光合细菌的模式菌株——集胞藻 PCC6803 来说,整个基因组中有 1466 个开
放阅读框被注释为未知基因或者保守未知基因,占整个基因组基因的
46%(1466/3179)。鉴于未知蛋白占据了相当一部分基因组的比例,因此在功能未
知的蛋白中很有可能具有对生命过程意义重大的蛋白没有被鉴定出来。本文的目
的一方面是要确定集胞藻中哪些蛋白是真实存在的,而哪些可能是被过度注释的
假蛋白;另一方面对已被实验确定存在的未知蛋白提供功能注释。为了完成这一
目的,我们采取了生物信息学的计算方法和蛋白质组学、基因敲除的实验方法相
结合的分析手段去探索集胞藻未知蛋白的功能。
为了分析集胞藻蛋白的真实性,我们利用蛋白长度分布模型和密码子偏性的
分析方法,计算已知功能的蛋白和未知功能的蛋白在长度分布和密码子使用上的
不同。利用 iTRAQ 标记定量蛋白质组技术结合 LC–MS/MS 对四种不同生长环境
下的集胞藻蛋白进行检测。共鉴定出 807 个未知功能的蛋白, 其他 659 个蛋白
在所选刺激环境中都未被检测出来。
为了推断已被检测到的未知蛋白的功能,我们首先使用了生物信息学的分析
方法,结合 BLAST 和结构域等基于同源性的分析以及基因上下文分析、操纵子
分析、蛋白质互作预测分析等基于非同源性的方法探索未知蛋白的功能。此外我
们还应用了已知的转录组学数据构建基因共表达网络,来进一步推断未知蛋白的
功能。应用这些方法我们预测了 210 个未知蛋白的功能,功能范围涉及能量代谢、
电子传递、信号传递、突变修复和膜运输等重要功能。
蛋白质功能的初步验证是通过基因敲除和表型变化分析的方法完成的。已完
成 sll0044、sll1418、sll1130 和 sll1638 基因敲除,获得了突变株⊿sll0044、⊿
sll1418、⊿sll1130 和⊿sll1638,已在分子水平上鉴定出⊿sll0044 确为基因 sll0044
缺失的突变株,其分子功能正在鉴定中。本研究提供了集胞藻的最新注释信息,
并且说明了在未知蛋白功能预测上高通量的实验数据,如蛋白质组学数据是对生
物信息学分析的一个很好的补充。
关键词:集胞藻 PCC6803 生物信息学未知蛋白功能预测蛋白质组基因敲
除
ABSTRACT
Hypothetical proteins whose functions are still unknown pose a challenge not just
to genome annotation but also to better understanding of general biology anisms.
Nearly 30% of sequenced bacterial genomes annotated as hypothetical and conserved
hypothetic
6803未知蛋白功能 来自淘豆网m.daumloan.com转载请标明出处.