导读:本文包含了生物序列相似性比对论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:序列,相似性,生物,算法,比对,拓扑,矩阵。
生物序列相似性比对论文文献综述
佟晓梅[1](2009)在《结构矩阵在生物序列相似性比较中的应用》一文中研究指出根据DNA初级序列的特性,把DNA初级序列转换成数字序列,即离散的时间序列:A,T,G,C用1,2,3,4表示。蛋白质与DNA和RNA一样,也是线性大分子。它是字符集N={A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, Y}上的字符串。蛋白质序列的比较不仅仅是字符串本身的比较,还要考虑他们的化学结构和化学性质。我们根据20种氨基酸的化学性质以及蛋白质二级结构的相关性质把它们分成四类:亲水,极性,带电荷X=HPC={D, N, S, H, T, C};疏水,非极性Z=HA={Y, F, V, I, W, M, L};非极性且体积小B=AS={G, P};其它J=O={R, K, E, A, Q}。同理,根据蛋白质初级序列的特征,把蛋白质初级序列转换成数字序列,即离散的时间序列:X,Z,B,J用1,2,3,4表示。基于此,本文利用矩阵表示DNA初级序列和蛋白质初级序列的结构,提出结构矩阵,以结构矩阵为基础建立DNA和蛋白质初级序列的相似性比较模型,并且对DNA和蛋白质初级序列进行了相似性研究,发现相似性评估的合理的价值。此外,矩阵的变换增强模型的适应性。(本文来源于《大连交通大学》期刊2009-12-16)
白凤兰,廖波,王天明[2](2006)在《拓扑指数在生物序列相似性比较中的应用》一文中研究指出在生物序列的二维图形表示的基础上,利用Balaban指数和信息分布指数比较生物序列的相似性,我们以包括人类等9种不同物种的DNA序列和yar029w等6种蛋白质为例来说明该方法的使用.(本文来源于《生物数学学报》期刊2006年04期)
陈伟[3](2006)在《生物信息学中的序列相似性比对算法》一文中研究指出序列相似性比对是生物信息学中基本的信息处理方法,它对于发现生物序列中的功能、结构和进化的信息具有非常重要的意义。主要思想就是运用某种特定的数学模型或算法,找出两个或多个序列之间的最大匹配碱基或残基数,比对的结果反映了算法在多大程度上反映了序列之间的相似性关系以及它们的生物学特征。因此,生物信息学中分析的序列相似性比对的简单有效算法一直是生物学家关心的问题,序列比对也是计算生物学中解决象序列装配,进化树重构及基因组分析等众多问题的第一步。进行序列相似性比对的算法很多,而这些算法大多数都是基于动态规划算法,只是在其基础上进行了不同程度的改进而已。根据同时比对的序列数目的不同,将序列相似性比对算法分成双序列相似性比对算法和多序列相似性比对算法。 本文在第二章前叁节详细地介绍了这些基于动态规划算法的序列相似性比对算法。所有这些算法有个共同的特点:算法是字符串比较算法,序列的比较是字符上的比较,它们的差异性体现在彼此间存在不同的子序列或子结构,而相似性体现在它们有共同的子序列或子结构,因此我们很自然的会想到寻找生物序列的最长公共子序列,这就是所谓的LCS问题。近两年国内外一些学者给出了DNA序列的图形表示,用几何的方法比较生物序列,这些理论已经基本成熟。我们在第四节介绍了DNA序列图形表示的相关理论并给出了一种基于二维图形表示的寻找生物序列和生物结构的最长公共子序列的算法,该算法简单并可视化。很适合用于生物序列的比较和分析。在第叁章给出了用于寻找mRNA序列和蛋白序列的最优局部对比和全局对比的对比算法。(本文来源于《中国海洋大学》期刊2006-04-10)
涂俐兰[4](2004)在《基于快速沃尔什变换的生物序列相似性比对》一文中研究指出生物信息学是一门交叉学科,它包含了生物信息的处理、存储、分发、分析和解释在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物意义。本论文大致可以分为两大部分:生物序列相似性比对和序列拼接。生物序列的相似性比对是生物信息处理中最重要的数据处理任务之一,而序列拼接是全基因组测序中的一个极其重要的环节。论文首先简单介绍了生物序列相似性比对及其算法,特别的讨论了最早提出的,也是最基本的生物序列相似性比对算法———动态规划算法,它是1970年由Needleman 和 Wunsch提出的。在这些算法的启发下,本文提出了基于快速沃尔什变换的分子子序列识别方法。这种方法不仅极大地降低了CPU时间而且其准确度可以达到100%。由于分子子序列识别应用的局限性,在此基础上论文进而提出了基于快速沃尔什变换的两两相似性比对方法。这种方法可以对任意两条序列进行相似性比对。由计算模拟可知,此方法耗费的时间与序列长度成近似线性关系,并且其空间复杂度也明显降低。接着,论文简单综述了序列拼接及其算法,并对Phrap和Euler两种典型算法进行了分析和比较。通过分析序列拼接中存在的问题可知重复序列对序列拼接的准确度有极大的影响。针对这种情况,论文利用前述的分子子序列识别方法提出了一种新的重复序列屏蔽方法。它能快速给出重复序列的位置信息,并加以识别。所以,根据计算模拟分析和实现表明此方法的时间复杂度得到了极大的降低,其精确度可达100%。(本文来源于《华中科技大学》期刊2004-04-01)
李昭[5](2002)在《生物序列相似性比较算法的研究》一文中研究指出生物信息学是用计算机来处理和研究生物信息的一门新兴学科,其中,序列相似性比较是生物信息处理中最基本的一个问题。如何获得结果更准确,时间空间效率更高的序列相似性比较算法是生物信息学研究工作者的一个重要的课题。生物序列相似性比较算法在生物信息学中占有重要的地位。论文首先讨论了最早提出的,也是最基本的生物序列相似性比较算法——两序列全局相似性比较动态规划算法;然后,通过对生物序列的演化模型进行讨论,推导出生物序列演化关系计算和序列相似性比较计算的一致性;最后我们根据叁条线索叙述序列相似性比较算法领域从七十年代到现在的发展过程以及最新的研究成果。接着论文讨论了动态规划序列相似性比较算法的各种优化研究。在实际应用中,动态规划算法的空间复杂度是限制问题规模的瓶颈。论文提出一种新的序列联配算法FastAlignment(FA),FA算法的时间复杂度和空间复杂度介于基本动态规划算法和Hirschberg算法之间,通过对算法参数k的调节,可以在不同存储条件下以最小时间开销解决序列联配问题。论文也讨论了动态规划算法的可并行性,研究了两种在SMP计算机上实现的动态规划并行方法,分析了在SMP机群系统中,如何通过分割数据的方法实现机群系统上算法的并行优化。基于动态规划的序列联配算法需要一种非交叉的属性,而子序列发生重排和倒置的序列相似性比较正好具有交叉属性。论文具体讨论了序列重排和倒置问题,提出了一种序列相似性比较的新算法,该算法克服了动态规划算法的非交叉属性。论文中分析了新算法的时间和空间需求,提出了对新算法进行并行优化的方法。论文的最后讨论了两个与序列相似性比较算法相关的工具程序——PHRAP程序和BLAST程序,其中PHRAP程序用于对DNA测序过程中产生的子序列片断进行拼接,BLAST程序用于在生物序列数据库中进行序列相似性检索。我们给出了这两个程序进行并行化的一些方法以及实现。(本文来源于《中国科学院研究生院(计算技术研究所)》期刊2002-04-01)
生物序列相似性比对论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在生物序列的二维图形表示的基础上,利用Balaban指数和信息分布指数比较生物序列的相似性,我们以包括人类等9种不同物种的DNA序列和yar029w等6种蛋白质为例来说明该方法的使用.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
生物序列相似性比对论文参考文献
[1].佟晓梅.结构矩阵在生物序列相似性比较中的应用[D].大连交通大学.2009
[2].白凤兰,廖波,王天明.拓扑指数在生物序列相似性比较中的应用[J].生物数学学报.2006
[3].陈伟.生物信息学中的序列相似性比对算法[D].中国海洋大学.2006
[4].涂俐兰.基于快速沃尔什变换的生物序列相似性比对[D].华中科技大学.2004
[5].李昭.生物序列相似性比较算法的研究[D].中国科学院研究生院(计算技术研究所).2002