基于有序Graphlet相似性度量的近天然蛋白质结构选取

基于有序Graphlet相似性度量的近天然蛋白质结构选取

论文摘要

随着人类和其他几个物种基因组计划的完成,基因图谱也正式绘制出来,生命科学进入后基因组时代。人们亟待了解那些数以亿计的基因序列所对应的功能是什么。由遗传学中心法则可以知道,蛋白质是由基因指导合成,而蛋白质既是构成生命体的主要成分,也是生命活动的主要执行者,因此我们可以通过研究蛋白质的功能来研究对应的基因功能。因为蛋白质的功能主要由其三级结构决定,所以蛋白质三级结构的研究对于理解基因组数据至关重要。然而,目前只有小部分蛋白质的三级结构是已知的。因此,如何有效预测蛋白质三级结构成为计算结构生物学中一个非常重要且具有挑战性的问题。目前常用的蛋白质三维结构预测方法是从头预测(Ab initio)法。使用从头预测方法,可以预测出大量称为预测集的候选蛋白质结构,但是从预测得到的预测集中选择良好的近天然蛋白质结构是一个难题。在这项工作中,我们设计了一种基于Contact Map Overlap(CMO)和Graphlet子图节点度的相似性从预测集中选择近原生蛋白结构的新方法。通过将graphlet扩展到有序图,并使用引入动态空位罚分的动态规划算法来选择最佳的匹配序列,通过定义GRscore来评价两个蛋白质三维结构之间的相似性。最后,使用集成聚类方法在预测集中选择近天然蛋白质结构,在这里的近天然蛋白质结构指的是聚类簇的中心结构。实验表明,与I-TASSER中使用的SPICKER方法相比,本课题中所提出的方法选择得到的近天然蛋白质结构与天然蛋白质结构之间具有更好的相似性,也就是说二者之间通过计算得到的相似性分数值更高。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 绪论
  •   1.1 研究背景
  •   1.2 生物信息学及其发展现状
  •   1.3 生物信息学的挑战
  •   1.4 生物信息学的应用
  •     1.4.1 测序与序列比对
  •     1.4.2 蛋白质结构比对与预测
  •   1.5 本课题主要研究工作
  • 第二章 蛋白质结构预测
  •   2.1 蛋白质结构
  •     2.1.1 蛋白质一级结构
  •     2.1.2 蛋白质二级结构
  •     2.1.3 蛋白质三级结构
  •     2.1.4 蛋白质四级结构
  •   2.2 蛋白质结构预测方法
  •     2.2.1 同源建模(Homology modeling)方法
  •     2.2.2 穿线或折叠识别(Threading or fold recognition)方法
  •     2.2.3 从头预测(Ab initio)方法
  •   2.3 蛋白质结构预测技术评估大赛(CASP)
  •   2.4 选取近天然蛋白质结构的方法
  •     2.4.1 SPICKER聚类方法
  •     2.4.2 K-均值(K-means)和K-中心点(K-medoids)
  •     2.4.3 集成聚类
  • 第三章 蛋白质结构比对
  •   3.1 蛋白质结构的观察角度
  •   3.2 主要蛋白质结构比对方法分类
  •     3.2.1 基于序列相关和序列无关
  •     3.2.2 基于局部相似性与全局相似性
  •     3.2.3 基于结构叠合和叠合无关
  •   3.3 蛋白质结构相似性度量方法
  •     3.3.1 均方根偏差(RMSD)
  •     3.3.2 全局距离计算方法(GDT)
  •     3.3.3 模板建模得分(TM-score)
  •     3.3.4 接触面积差(CAD)和局部距离差(IDDT)计算
  •   3.4 动态规划与主要的蛋白质结构比对方法
  •     3.4.1 动态规划算法简介
  •     3.4.2 结构比对算法CE
  •     3.4.3 结构比对算法FATCAT
  •     3.4.4 结构比对算法TM-align
  •     3.4.5 结构比对算法GR-align
  • score的蛋白质结构选取'>第四章 基于GRscore的蛋白质结构选取
  •   4.1 Contact Map Overlap(CMO)的定义
  •   4.2 Graphlets和 Graphlet节点度的定义
  • score的定义'>  4.3 蛋白质相似性分数GRscore的定义
  •     4.3.1 基于有序Graphlet的节点相似性度量
  •     4.3.2 结构比对算法
  • score定义'>    4.3.3 GRscore定义
  •   4.4 距离矩阵的产生
  •   4.5 使用集成聚类选取近天然蛋白质结构
  • 第五章 实验结果与分析
  •   5.1 实验数据集
  •   5.2 参数选择
  •   5.3 关于CASP-10 数据集实验结果
  •   5.4 关于CASP-11 数据集实验结果
  •   5.5 实验结果分析
  • 第六章 总结与展望
  •   6.1 总结
  •   6.2 展望
  • 参考文献
  • 在学期间的研究成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 韩旭

    导师: 路永钢

    关键词: 动态规划,空位罚分,近天然蛋白质结构,蛋白质结构预测

    来源: 兰州大学

    年度: 2019

    分类: 基础科学

    专业: 生物学,生物学

    单位: 兰州大学

    分类号: Q51;Q811.4

    总页数: 51

    文件大小: 1632K

    下载量: 46

    相关论文文献

    • [1].天然蛋白质牙膏创新与包装设计传播环保新理念[J]. 沿海企业与科技 2017(03)
    • [2].天然蛋白质材料在离子液体中的溶解与再生[J]. 丝绸 2008(05)
    • [3].美研人员发现有望缓解化疗导致疼痛的新方法[J]. 世界最新医学信息文摘 2018(81)
    • [4].无细胞体系非天然蛋白质合成研究进展[J]. 生物工程学报 2018(09)
    • [5].乳铁蛋白的研究进展[J]. 食品与药品 2008(01)
    • [6].化学问答[J]. 中学生数理化(高二版) 2009(05)
    • [7].“科技夹子·上海”科技创新项目[J]. 中国高新区 2014(10)
    • [8].科学家合成抗癌分子[J]. 致富天地 2013(08)
    • [9].海外文摘[J]. 猪业科学 2015(07)
    • [10].海底,人类未来的“粮仓”[J]. 下一代 2008(06)
    • [11].蛋白质功能化新策略:嵌入非天然氨基酸[J]. 化学进展 2012(04)
    • [12].全新微蛋白结构设计出炉[J]. 辽宁化工 2017(05)
    • [13].全新微蛋白结构设计出炉[J]. 中国食品学报 2017(05)
    • [14].人工酶与定向进化的前沿与挑战[J]. 科技导报 2020(08)
    • [15].国际视角[J]. 科技传播 2018(11)
    • [16].破解治疗困局 关爱“罕见”人生[J]. 青春期健康 2019(16)
    • [17].生命起源于化学实验[J]. 中学化学教学参考 2012(08)
    • [18].广西财经学院邓海莲设计作品选[J]. 包装工程 2014(02)
    • [19].欧洲药品管理局生物类似物指南(欧洲药品管理局2005年10月30日生效版本)概述[J]. 中国新药杂志 2013(09)
    • [20].溶菌酶在畜牧业中的应用[J]. 当代畜禽养殖业 2008(05)
    • [21].赏析氨基酸和蛋白质构造的经典题[J]. 数理化学习(高三版) 2013(12)
    • [22].鞣酸改性制备天然蛋白质复合膜条件优化[J]. 天然产物研究与开发 2009(04)
    • [23].不同分子量丝素肽的开发[J]. 蚕桑通报 2017(04)
    • [24].非细胞因子来源的天然蛋白质作为人类疫苗佐剂的研究进展[J]. 现代免疫学 2016(03)
    • [25].新型调味基料在休闲食品中的应用[J]. 中国食品添加剂 2008(S1)
    • [26].不罕见的罕见病[J]. 21世纪商业评论 2019(06)
    • [27].新型调味基料在休闲食品中的应用[J]. 现代食品科技 2008(03)
    • [28].科学家找到毒杀癌细胞的利器[J]. 安徽医学 2010(01)
    • [29].全新设计蛋白质的折叠机制[J]. 物理化学学报 2012(10)
    • [30].康壮素调节辣椒生长药效示范试验[J]. 山东省农业管理干部学院学报 2012(05)

    标签:;  ;  ;  ;  

    基于有序Graphlet相似性度量的近天然蛋白质结构选取
    下载Doc文档

    猜你喜欢