《生物信息学》课程论文题目: 应用生物信息学方法对未知序列 R-2 的性质和结构分析综述院(系) 专业生物科学年级姓名学号 2013 年7月9日第一章生物信息学简介及实验研究内容 生物信息学定义生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是 21 世纪自然科学的核心领域之一。其研究重点主要体现在基因组学和蛋白质组学两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。 实验研究内容现有一段编码未知蛋白的 cDN A序列,利用生物信息学数据库和相关软件进行处理分析,内容包括其可能表达蛋白质的理化性质,所属蛋白质家族类型,蛋白质二级结构,亲疏水性及结构域的初步分析。第二章序列分析的主要方法流程 找出开放阅读框和蛋白质序列应用 DNAStar 的 Editseq 查找 R-2 未知序列的开放阅读框( ORF ) 的位置、编码氨基酸个数。下图为基本操作流程: 原始序列 Goodies-plete plete DNA ORF Search-findORF Goodies-translate DNA 氨基酸序列 理化性质的分析 ProtParam 在线分析 R-2 未知序列翻译的蛋白的分子量及等电点。网址 ls/ 。应用 在线,分析 N 端信号肽的切点位置, 并判断是否为分泌蛋白。网址为/services/SignalP/ 。 蛋白质家族及同源序列首先应用 NCBI 的 ORF finder 确定所属的蛋白质家族类型. 应用 NCBI Blast 在线查找 R-2 未知序列翻译的蛋白的同源序列。并选择感兴趣的若干序列用于同源比对。 蛋白质二级结构预测及分析应用 DNASta r的 protea n 子软件包预测 R-2 未知序列翻译的蛋白的结构包括: α螺旋、β折叠、无规卷曲及转角。应用 expasy 的 protscale 预测 R-2 未知序列翻译的蛋白的亲水区及疏水区分布。网址为 http://web./tmp/ 使用 ExPaSy 的 SMART 服务器分析 R-2 未知序列翻译的蛋白质的结构功能域。网址为 -/ 第三章结果分析 原始序列、开放阅读框及蛋白质序列 原始序列( R-2 序列) aagcttggatcgagactagtgcactgattgaatgcatttcggagtatgg gtggcg ggc aaacgttacaacagataatttcatagctacatacatta aaaactga aaggggcacagaacgtaactttcatcgt atggta tgaacgtagttgacgctaggatttatttcactaatagcttcttaggatgtacaattcaaaatgttcaggtgaacgcg tttatcgtcgatagtgactcagtcgtct gcagttaatttaactgggtatgcgatcgctattgagggtaagttta ttgagttcactaacaattcagacaagcgtaatcgatgatttcggattatc gaatcaggttgcgcgcttcaggacagactgaaatttttagtcagtcgatgaacactttgacaga tggtacaggttctcggagcgcgc gaaaattgattattagacatttgtgggtcataatgtcttt atctttatatgttagattagtatagcgacgggtgatgacggcaatcaactcaagagttgaggagtatctcaacgtgctgact atatactttgcgataatttcatcagtggactgtcgaaattcgaacgaggtacgcttcgcgctggattgaagggag agtaacaggcgggtcgtgtggtcacaaaaaatgat 开放阅读框对原始序列,通过 DNAstar 查找开放阅读框,并翻译成蛋白质。该基因 cDNA 全长 1578bp ,其中开放阅读框为 1281bp ,位置是从 21-1301 ,共编码 426 个氨基酸。找到开放阅读框如下: tttgatactt ggcatgcgtacatgctgcaaaagaattg tcggttttcaagaacagtgtctga agacaacttggggttctgaaggctt aacgtagttggaaacgtgtcacagagaa gataaaatcatttt
生物信息论文 来自淘豆网m.daumloan.com转载请标明出处.