人类乙酰化蛋白质的统计分析及预测研究

人类乙酰化蛋白质的统计分析及预测研究

论文摘要

迄今为止,已经鉴定出了450多种独特的蛋白质修饰,包括磷酸化、乙酰化、泛素化和小泛素化,它们是具有许多生物学功能的细胞蛋白质的调节机制,并且在许多原核和真核蛋白质的功能调节中发挥作用。在这些PTMs中,乙酰化是一种动态且高度保守的翻译后修饰,在调节多种细胞过程中起着关键的作用。由于乙酰化在某些相关的生物学过程中的重要作用,它成为最重要的可逆蛋白翻译后修饰之一。异常的乙酰化蛋白质与许多病理疾病有关,如癌症,神经性疾病和代谢性疾病,所以进一步了解乙酰化蛋白质对以后的分析乙酰化机理和相关的实验验证,药物开发提供指导性意义。蛋白质的功能常有标注KW,GO,Smart,Pfam,InterPro,PRINT,PROSITE,SUPFAM分析得出,乙酰化蛋白质在正负样本中差距较大,正样本的功能标注信息含有蛋白质的数量远远大于负样本,且KW,GO信息量远远大于其他Smart,Pfam,InterPro,PRINT,PROSITE,SUPFAM的信息量。人类蛋白质6832条蛋白质中,正样本有3404条,负样本有3428条,正负样本基本持平。关键词中乙酰化关键词在正样本中有3392条。在GO信息统计分析中发现乙酰化在细胞核和细胞质过程中起着关键作用,且在GO数据库三大类中,正样本细胞组分含有蛋白数量远远大于其余生物学过程和分子功能。Smart,Pfam,InterPro,PRINT,PROSITE,SUPFAM的信息量在整个正负样本中含有蛋白质条数非常少,对整个分析结果占有次要作用。乙酰化是翻译后修饰的一种,通常与乙酸发生反应,将乙酰基引入有机化合物中,为了深入了解乙酰化的机理,需要在生物系统中正确识别乙酰化蛋白质。尽管使用了质谱法进行的高通量实验研究已经确定了许多乙酰化位点,但大多数乙酰化位点仍然未被发现,为了降低实验成本,提高乙酰化位点的有效性和效率,介绍了基于信息技术的计算方法。本研究功能域注释(FDA)和亚细胞定位信息为基础,通过灰色系统模型和KNN评分,从序列保存信息中提取特征,建立了一种预测乙酰化蛋白新的计算方法。结合Relief特征选择算法的详细特征分析和应用,给出了三个数据集5次交叉验证的结果。所获得的精度均令人满意,作为平均性能,精度为77.10%,马修斯相关系数为0.5457%,AUC值为0.8389,这些工作对相关的实验验证有一定的指导作用,为研究乙酰化的机理提供了有益的见解,并对进一步研究其他PTM过程提供了有力的帮助。本文通过对人类乙酰化蛋白质功能标注信息的统计分析和融合乙酰化蛋白的特征,功能域注释鉴定乙酰化蛋白可以提高乙酰化实验的效率,对基础研究和药物开发的实验人员提供参考和帮助。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  •   1.1 生物信息学研究背景
  •   1.2 蛋白质翻译后修饰的研究背景
  •   1.3 研究的目的与意义
  •   1.4 本文研究的目的和主要研究内容
  •   1.5 论文章节安排
  • 2 序列特征提取方法和预测算法
  •   2.1 引言
  •   2.2 特征提取算法
  •     2.2.1 伪氨基酸组成(PseAAC)
  •     2.2.2 位置特异打分矩阵(PSSM)
  •     2.2.3 耦合信息
  •     2.2.4 位置权重氨基酸组成(PWAA)
  •     2.2.5 分组权重编码(EBGW)
  •     2.2.6 化学物理性质
  •   2.3 分类预测方法
  •     2.3.1 支持向量机(SVM)
  •     2.3.2 随机森林算法(Random Fores)
  •     2.3.3 K最近邻得分
  •     2.3.4 极限学习机(ELM)
  •     2.3.5 深度学习
  •     2.3.6 神经网路
  •   2.4 预测结果评估标准
  • 3 人类乙酰化蛋白质功能标注统计分析
  •   3.1 引言
  •   3.2 人类乙酰化蛋白质统计研究
  •   3.3 GO信息的统计分析
  •     3.3.1 GO乙酰化修饰统计分析
  •     3.3.2 GO正负样本GO信息统计分析
  •     3.3.3 GO数据库三大类GO信息统计分析
  •   3.4 InterPro统计分析
  •   3.5 PFAM统计分析
  •   3.6 PRINTS统计分析
  •   3.7 PROSITE统计分析
  •   3.8 SMART统计分析
  •   3.9 SUPFAM统计分析
  •   3.10 本章小结
  • 4 融合乙酰化蛋白PseACC和功能域注释鉴定乙酰化蛋白
  •   4.1 引言
  •   4.2 实验材料与方法
  •   4.3 特征提取
  •     4.3.1 将提取特征并入一般的伪氨基酸成分中
  •     4.3.2 基于FDA和亚细胞定位(SL)的KNN评分蛋白样品预测
  •   4.4 运行工具和评估
  •     4.4.1 算法
  •     4.4.2 指标和测试方法
  •   4.5 结果与讨论
  •     4.5.1 研究KNN的性能评分对FDA的影响
  •     4.5.2 提出模型性能预测
  •   4.6 本章小结
  • 5 总结与展望
  •   5.1 本文总结
  •   5.2 本研究存在的问题
  •   5.3 本研究下一步研究的方向
  • 致谢
  • 参考文献
  • 攻读硕士学位期间参与的项目和发表的论文
  • 文章来源

    类型: 硕士论文

    作者: 郑泉树

    导师: 邱望仁

    关键词: 翻译后修饰,乙酰化,机器学习,伪氨基酸,功能域注释

    来源: 景德镇陶瓷大学

    年度: 2019

    分类: 基础科学

    专业: 生物学

    单位: 景德镇陶瓷大学

    分类号: Q51

    DOI: 10.27191/d.cnki.gjdtc.2019.000107

    总页数: 72

    文件大小: 6583K

    下载量: 33

    相关论文文献

    • [1].转换统计语言培养学生统计分析能力研究[J]. 教育现代化 2019(93)
    • [2].统计分析方法在基层经济统计工作中的应用分析[J]. 中国乡镇企业会计 2020(03)
    • [3].关于统计分析中应用方法研究[J]. 财会学习 2019(30)
    • [4].医院统计分析要抓好五方面工作[J]. 中国医院统计 2017(02)
    • [5].社会统计分析的构成与方法[J]. 产业与科技论坛 2018(13)
    • [6].统计分析-投稿指南[J]. 实用中医内科杂志 2016(09)
    • [7].关于我国社会消费品零售总额的统计分析[J]. 商业故事 2018(22)
    • [8].社会统计分析课程教学的调查与思考[J]. 黑河教育 2012(06)
    • [9].新疆金融业的现状及发展趋势的统计分析与预测[J]. 中国民商 2018(02)
    • [10].企业统计人员如何写好统计分析[J]. 环球市场信息导报 2016(47)
    • [11].基于ArcGis Engine的地理国情综合统计分析之生态环境指数分析研究[J]. 城市地理 2017(04)
    • [12].承德市冰上竞技体育发展现状统计分析[J]. 明日风尚 2017(15)
    • [13].细化深化统计分析研究[J]. 青海统计 2009(07)
    • [14].统计分析在现代医院信息化管理中的应用效果评估[J]. 全科口腔医学电子杂志 2019(01)
    • [15].工科院校图书借阅统计分析——以湖北汽车工业学院为例[J]. 企业科技与发展 2019(02)
    • [16].大数据时代的统计分析[J]. 科技创新导报 2018(01)
    • [17].试论统计分析方法在事业单位财务分析中的应用[J]. 时代金融 2016(15)
    • [18].因素分析法在施工统计分析中的应用[J]. 价值工程 2014(33)
    • [19].如何运用平均指标进行统计分析[J]. 今日财富 2018(22)
    • [20].如何加强企业的统计分析水平[J]. 环球市场信息导报 2017(41)
    • [21].最不喜欢的人[J]. 第二课堂(初中) 2010(09)
    • [22].浅谈市场调查统计分析中SPSS软件应用[J]. 大视野 2008(07)
    • [23].浅谈统计分析在物资管理中的重要性[J]. 中国物流与采购 2014(12)
    • [24].写好统计分析的几点体会[J]. 中国统计 2012(02)
    • [25].谈写好统计分析的几个要点[J]. 统计与咨询 2012(03)
    • [26].加强供热统计分析 为科学决策服务[J]. 兵团工运 2012(09)
    • [27].浅谈统计分析与报告在企业管理中的应用[J]. 山西经济管理干部学院学报 2011(03)
    • [28].浅议开展医院统计分析遇到的问题及其应对措施[J]. 企业导报 2011(21)
    • [29].构建新的统计分析体系,为企业保驾护航[J]. 现代物业(中旬刊) 2010(04)
    • [30].以“准”与“实”做好河南省中医基本现状调查统计分析[J]. 光明中医 2010(10)

    标签:;  ;  ;  ;  ;  

    人类乙酰化蛋白质的统计分析及预测研究
    下载Doc文档

    猜你喜欢