摘要真正意义上的平台独立性察语言独立性。。实验表明,,结合隐马尔可夫模型中的前向算法,改进基予马尔可夫理论的启动子预测方模型建立的系统能更有效的识别数据集中的三罩巾序列。同时在启动子技术作为~种中间层去处理生物信息数据。将算法够挖掘出基因表达谱数据中具有生物学意义的关联规则,能够更好的是一种面向服务的体系结构,其突出优点是实现了的解决方案,开发了一个生物信息挖掘的原型系统,封装了基于基因表达谱数据的关联规则挖掘模块稀启动子识剐模块,并将算法作为服务公开发布。法大大提高了运行效率,运行时间由原来的小时交成了秒。法。单纯使用马尔可夫模型平均分类正确度为.%,改进后平均分类正确度为.%。改进的马尔可夫模型的预测结果显示,以此预测算法的基础上,研究了结合支持向量机和非线性方法的据特征提取。利用生物信息学中生物功能基团和结构基圈之间的长程相关进行进~步研究,这种方法更符合生物学特性。部分封装在中,对外只提供用户调用算法接口,可以集成更多功能,具有可扩展性。基于生物信息挖掘方法能识别启动子序列。为生物和医药技术企业与研究人员提供交流信息的窗口,提供简便快捷的服务平台。关键词关联搜则挖掘,马尔科夫模型,启动孑识别,甘
知识水坝***@pologoogle为您整理
,,鶶琣甌.....甌.%..%.羽№.—猺.
知识水坝***@pologoogle为您整理
簃琖瑃琺,Ⅱ
作者签名:矗龇导师签名粒日期硅竺二辍辉律作者签名:堂日期:壁堡二年』月卫日原创性声明关于学位论文使用授权说明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。权保留学位论文,允许学位论文被查阅和借阅;学校可以公布学位论作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包本人了解中南大学有关保留、使用学位论文的规定,即:学校有文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文;学校可根据国家或湖南省有关部门规定送交学位论文。
第一章绪论课题应用背景人类基因工程的完成彻底改变了生物学领域。数据挖掘技术融入生物信息学中,对基因序列分析,药物发明,基因突变以及疾病诊断等起到一定的帮助作用。针对挖掘出的生物信息,寻找数据集中的变化,并试图找出对某项评估可能产生影响的任何相关因素。研究热点还主要集中在偷鞍字实男蛄蟹治觯表达谱分析等领域。有人说,基于序列的生物学时代已经到来,尽管对“序列生物学”这一提法可能有所争议,但是今日像潮水般涌现的序列信息却是无可争辩的事实。自从年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约多种生物的全基因组测序工作,人基因组约碱基对的测序工作也接近完成。在人类基因组计划进行过程中所积累起来的技术和经验,使得其它生物基因组的测序工作可以完成得更快捷。可以预计,今后蛄惺莸脑龀そǜ>H恕I镅莸幕鄄⒉唤鼋霰硐衷贒序列方面,与其同步的还有蛋白质的一级结构,即氨基酸序列的增长。这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。与正在以指数方式增长的生物学数据相比,人类相关知识的增长致缘赜妹磕攴⒈淼纳铩⒁窖论文数来代表词只郝R环矫媸蔷蘖康氖荩涣硪环矫媸俏颐窃谝窖А⒁物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。这就构成了一个极大的矛盾,这个矛盾就催生了一门新兴的交叉科学,这就是生物信息学。美国人类基因组计划实施五年后的总结报告中,对生物信息学作了以下定义:生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义【俊I镄畔⒀д庖幻实某鱿仅仅是几年前的事情,但是计算生物学这一名词的出现要早的多。鉴于这两门学科之间并没有或难以界定严格的分界线,在这里统称为生物信息学。世纪年代末,人类基因组计划琀钠动推动了生物信息学的产生和蓬勃发展。人类基因组计划的直接结果是获得了大量不连续的数据。这些数据的收集、存储,并进行分析、解释,从中获取有用的硕士学位论文
的平台,即部署在不同的平台鏤教ǎ赪国内外研究现状所以各种不同类型的程序都可以通过这种标准的协议进行互操作,达到最高的可系纳锸萁型诰颉U庑┫低衬芨萦没淙氲牟檠G螅岷隙喔不同生物数据库中的数据,找到基因之间某
基于WEB+SERVICES生物信息挖掘算法设计与实现(可复制论文) 来自淘豆网m.daumloan.com转载请标明出处.