信息论方法预测信号肽

刘亮^[1]2004年在《信息论方法预测信号肽》文中研究说明本论文的主要目的在于介绍蛋白质信号肽的特征和性质,并在此基础上利用数学方法对信号肽和信号肽的剪切位点进行讨论和预测。文章中介绍了国际上公认为比较便捷而且准确率比较高的几种方法,并在此基础上提出信息论方法在蛋白质信号肽方面的应用。本论文使用的数据库是瑞典CBS(Center for Biological Sequence Analysis)的Nielsen等根据SWISS-PORT version 29构建的二次数据库,所有的数据库都进行了同源性消减:此数据库中将包含1383个非同源信号肽序列和519个成熟蛋白序列。在此基础上,对N端信号肽进行了统计学分析,以充分说明真核生物以及原核生物(包括革兰氏阳性菌和革兰氏阴性菌)的信号肽特征,并验证(-1,-3)原则的准确性和普适性。在利用信息论方法讨论蛋白质信号肽的性质和特征的时候,首先利用自信息量概念,对数据库中的信号肽和成熟蛋白质进行处理,计算得出两者的自信息量值进行比较,发现成熟蛋白平均的信息量随窗口变化波动不大,而且整体高于信号肽的信息量;信号肽的平均信息量整体较低,且随窗口的变化有剧烈地波动,这也暗示着我们可以利用这种思路对信号肽的剪切位点进行预测。然后,利用信息熵的概念,将信号肽的每一个位置看作一个单独的信源,计算出各个位置的熵值,发现对真核生物来说,其信息熵在-1和-3位只有两个明显的谷,表明相对与邻近位置,-1及-3更具特征,而-12~-8位置又对应一个极值区,这说明h区相对于c区和n区更具特征。对于革兰式阴性菌及革兰式阳性菌来说,它们在-1位置与-3位置的特征性更强,这说明,在此数据库下,原核生物比真核生物更符合(-3,-1)规则。而在h区则没有明显的谷,也说明原核生物信号肽h区特征较小。最后,引入简单信息矩阵的概念,并用来预测和检验蛋白质信号肽剪切位点。对于它检验,真核生物、革兰氏阳性菌和革兰氏阴性菌的预测准确性分别达到60.1%,69.2%,81.2%。简单信息矩阵对原核生物的预测能力要好于权重矩阵方法,但对真核生物的预测能力却略逊于权重矩阵方法。

刘惠^[2]2007年在《蛋白质序列数据的分类预测研究》文中研究表明序列数据是数据挖掘问题中一类特殊数据,广泛存在于社会生活各个领域,如何从这些复杂海量序列数据库中挖掘蕴含其中的有用信息是数据挖掘的新研究课题,具有重要理论意义和实际价值。本论文以蛋白质序列数据为例进行序列数据分类研究,亦为生物信息学中课题。论文围绕蛋白质序列数据的分类预测这一主题,在综合众多序列数据分析算法的基础上,将序列特征分析归纳为两类主要方法,基于特征提取的方法和基于相似性模型的方法,由此将研究路线分为两条。一方面基于特征提取方法,分别针对膜蛋白及信号肽序列,根据序列各自特性提取相应特征进行分类。另一方面,基于相似性模型,提出基于全序列比对的相似度以预测信号肽,进而嵌入核空间提高预测稳定性,达到提取序列明确属性向量的目的,至此实现两条技术路线的统一。论文还进一步通过线性降维实现冗余及不相关维数约简及可视化。总的来说,本论文集中于蛋白质序列的分类预测研究,着重于以下几个创新点:(1)针对不同序列有区别有目的地提取序列特征生成属性向量,从而训练分类器并提供对新样本的预测。其中对于序列长度相对较长的膜蛋白序列,首先进行数值化编码生成时间序列,将其作为各样本以不同时间间隔抽样的离散信号,从而基于数字信号处理理论进行序列分析,避免了以往算法忽略序列次序信息的缺点。分析发现借助信号低频的幅度及相位信息,可以有效提取序列特征并可减少噪声带来的影响。实验结果表明这种基于频域的特征提取方法可以有效提取膜蛋白序列特征,以利于分类预测。(2)在对序列长度相对小的信号肽序列预测时,采用滑动窗截断的方式将不等长序列转换为固定长度的序列片断,经过互信息分析发现其内部各位点间存在复杂的耦合作用,针对已有算法盲目定义这种耦合作用的情况,提出基于多决策树方式提取规则,并借助其识别信号肽及其断裂点。经实验证明这种处理方式在信号肽预测问题中可有效提高序列片断及信号肽剪切点的预测率。(3)以相似性作为分类预测的基石,定义基于全序列比对的相似度预测信号肽,避免了采用滑动窗所带来的不平衡样本等诸多问题。通过分析此相似度的数学特性,详细证明其为一种度量。另外将其应用于信号肽预测中,在预测率及稳健性方面获得了良好效果,结果表明此相似度确实可以表征样本之间的相似关系,并为预测分类提供了良好的信息表示方式。提出的算法已经通过internet在网上提供相应使用服务,为扩大算法的使用范围提供了快速有效的途径。(4)探讨非正定核的处理方法,在分析基于全序列比对的相似度与欧氏距离偏差基础上,提出基于全序列比对的非正定核算法,并应用于信号肽分类预测中;另一方面,在保证预测率的前提下,实现提取序列样本特征向量的目的,将问题重新化归于基于特征的模式识别问题。实验结果表明算法确实可以有效提取蛋白质序列特征,方便信号肽预测工作。(5)针对线性降维中的“小样本问题”,充分利用类内离散度矩阵的空空间的特性,提出新的降维方法,且有效处理了小特征值导致的不稳定问题。信号肽预测工作中,在已经得到高维属性向量前提下,约简大量冗余和不相关属性,提高处理效率并实现了可视化的要求,取得了理想的效果。

靳利霞^[3]2002年在《蛋白质结构预测方法研究》文中指出蛋白质结构和功能预测是后基因组时代的重要研究内容，它不仅需要生物学者为之奋斗，同时为数学、计算机科学、信息科学、物理学、系统科学和管理科学等学科提出了挑战。围绕这一主题，本文进行了一些研究和讨论。主要研究成果如下： 1．利用氨基酸序列预测蛋白质结构可以归结为一个复杂系统的全局优化问题，建立一个合理的预测模型是关键性的第一步。预测模型的目标函数通常采用基于物理理论的经验势能函数或基于统计理论的平均势能函数。深入研究了这两类势能函数的特点，系统分析了一个具有综合特点的联合残基势能函数，建立了四个预测模型，目标函数分别包含不同的能量项，可以分析比较它们对预测结果的影响。 2．计算时间是蛋白质结构预测中的主要问题，在常规的最优构象搜索过程中，采用经典优化算法的能量极小化过程需耗用95％以上的计算时间。针对蛋白质结构预测模型中目标函数多变量、多极值的特点和现有算法的不足，提出了一种改进的连续函数模拟退火算法。该算法比现有算法具有更好的收敛性，可以有效地解决3000个变量的连续函数全局优化问题。该算法被应用于脑啡肽和牛胰岛素B／D链的结构的预测，得到了合理的结果；避免了局部能量极小化过程，节省了构象搜索过程的计算时间。用一种简洁的方法分析了算法的收敛性。 3．现有的蛋白质结构类预测方法大多没有考虑氨基酸残基的排列顺序，从而使预测质量受到限制。本文结合子序列分布和FDOD函数，给出了一种新的蛋白质结构类预测方法，和现有的预测方法相比，它考虑了氨基酸残基的排列顺序，从而显着提高了预测精度，与张春霆院士的最新结果相比，两类检验的总预测精度分别提高了3.3％和5.3％。同时它不需要引入其它物化参数，且计算简单快速，作为一种新的多序列比较工具还可以用于其它问题的研究。建立了一个序列冗余性低于30％的数据集，利用该数据集验证了本文方法对于非同源蛋白质的敏感性，并分析比较了子序列长度对预测精度的影响。 4．支持向量机(SVM)是近年来迅速发展的一种机器学习方法，它在蛋白质亚细胞定位预测中得到了成功的应用，预测能力明显优于其它预测方法。基于FDOD函数和氨基酸组成，本文构造了一种新的蛋白质亚细胞定位预测方法，预测结果与支持向量机等方法预测结果进行了比较，对于真核生物蛋白质总预测精度比支持向量机方法得到的结果高2.6％，对于原核生物蛋白质预测结果基本一致。重点分析了预测结果和细胞结构分类的关系，构造了层次预测博士学位论文：蛋白质结构预测方法研究方法，这不仅能够帮助我们进一步了解氨基酸组成与蛋白质定位的关系，而且能够根据对蛋白质不同层次的了解更灵活地进行预测。5．总结了不同氨基酸序列的特征描述方法，以FDOD函数作为判别函数，比较了其中几种描述方法对蛋白质结构类和亚细胞定位预测结果的影响。在蛋白质结构类预测中，考虑氨基酸残基不同的物化性质可以作为氨基酸组成的补充，提高预测精度：然而，残基在序列中的顺序可以更好地描述序列与结构类之间的关系，尤其是抓…和。＋g类蛋白质对残基顺序更敏感。在蛋白质的亚细胞定位预测中，氨基酸组成仍然是最重要的特征，蛋白质的亚细胞位置与序列同源性的关系没有结构与序列同源性的关系强。另外氨基酸指数在亚细胞定位预测中可以作为氨基酸组成的补充，提高预测精度。

刘源振^[4]2009年在《深海细菌Shewanella piezotolerans WP3细胞色素c相关基因的克隆表达和功能鉴定》文中指出深海是一个特殊的生态环境,这里永久高压、低温、黑暗、高盐和寡营养。生活在这些环境下的极端微生物必然有特殊的生理代谢途径来适应极端环境。对深海微生物的研究不仅有助于了解生命的起源,而且可以了解各种极端微生物的生活特性,为深海微生物资源的开发利用奠定基础。2003年本实验室在西太平洋暖池区1914米的沉积物中分离到一株具有异化金属还原能力的耐压低温细菌,菌种鉴定为希瓦氏属新种,命名为Shewanella piezotolerans WP3(以下简称WP3)。WP3全基因组测序已经完成,并对其环境适应性机制做了功能基因组学分析。WP3拥有众多的基因和基因簇来帮助它适应极端环境。特别的是,WP3中包含55个编码细胞色素c的开放读码框(ORFs),是目前已测序Shewanella属菌株中最多的。通过对WP3细胞色素c基因序列进行BLAST比对分析,推测在异化金属还原过程中,WP3可能存在两套电子传递系统,即mtrCAB基因簇和mtrFED基因簇。当WP3分别以延胡索酸和二氧化锰为唯一电子受体生长时,通过提取细胞总RNA并将mRNA反转录成cDNA,然后以cDNA为模板进行实时荧光定量PCR(RT-PCR),确定了细胞色素c相关基因转录水平的差异。结果表明,在二氧化锰还原过程下,mtrFED基因簇转录水平显着上调。这说明mtrFED基因簇可能在异化金属还原过程中起着重要作用。由于WP3的mtrFED基因敲除突变株未观察到二氧化锰还原能力的显着下降,推测mtrFED基因簇在异化金属还原过程中可能只是起着辅助作用。为证实mtrFED基因簇在电子传递中的作用,首先借助生物信息学工具,对mtrFED基因簇的表达产物即细胞色素c蛋白进行了预测,包括它们的理化性质,跨膜区段,信号序列和功能结构域等;随后设计引物,对细胞色素c相关基因在体外进行了克隆表达,并在大肠杆菌中成功表达了具有氧化-还原活性的细胞色素c。同时,本论文发展了一种基于删除信号肽的策略来过量表达这些膜蛋白,并采用Qiagen公司的Ni-NTA柱式纯化方法将其纯化。随后,已得到纯化的蛋白被用来制备抗体,通过免疫印迹杂交的方法,以期对目的蛋白在细胞内的表达水平和在细胞膜上的位置进行确定,为阐明WP3异化金属还原机制奠定基础。

王小叶^[5]2014年在《Sorangium cellulosum So0157-2中木聚糖酶的定位研究》文中研究说明纤维堆囊菌能够利用自然界中丰富的纤维素、半纤维素资源,在结晶性纤维素(滤纸)的无机盐平板上能够接触生长,木聚糖作为半纤维素的主要组成成分,也可以作为纤维堆囊菌的唯一碳源。通过已测序的基因组的分析发现,So0157-2具有完整的木聚糖降解酶系,包括内切木聚糖酶、木糖苷酶、酯酶、以及侧链水解酶,其中,至少有22个来自不同家族的内切木聚糖酶,散布在基因组中,对其模块结构的分析显示,这些木聚糖酶表现出新颖的性质,与纤维小体策略以及游离酶策略中的模块结构均不相同,尤其是含有较多的脂蛋白,推测纤维堆囊菌以一种细胞结合型非游离酶组分方式降解木聚糖,而对这些木聚糖酶的定位,是确定这种降解方式的基础。利用不同碳源的叁种培养基(M26、G-CNST、X-CNST)培养So0157-2,进行组分分离,初步得到了胞外游离组分、膜组分、细胞内可溶组分,酶活检测显示,这叁种组分中均具有木聚糖酶酶活,并且,膜组分的木聚糖酶活性占总木聚糖酶酶活的50%以上,在So0157-2利用木聚糖过程中起着得要我们选择从胞外蛋白入手,试图通过活性电泳的方法,在胞外鉴定到木聚糖酶,尝试了直接浓缩法、双向酶谱法、最终选择硫酸铵沉淀加活性电泳的方法,在叁种培养基的胞外鉴定到4个目的蛋白,其中叁个内切木聚糖酶,以及一个底物结合域。在M26培养基的胞内组分中,鉴定到2个内切木聚糖酶。其中木聚糖酶7384被多次被鉴定到,这个来自GH10家族的酶在木聚糖的降解中发挥了至关重要的作用。由于脂蛋白在酶系中所占很高比例,我们选择其中的Xyn11B进行研究,预测该酶具有典型的脂蛋白信号肽特征,根据文献报道推测其定位在内膜或者外膜上,由于在本源菌中众多的免疫交叉干扰,我们将其在大肠杆菌中进行异源表达,构建了全长蛋白的表达菌株BL21-pET-22b-Xyn11B,以及去掉信号肽后剩余序列的表达菌株BL21-pET-22b-Xyn11B-dlp,通过酶活以及Western blot检测到蛋白成功表达,为后续研究蛋白定位提供基础。纤维堆囊菌So0157-2中含丰富的木聚糖降解酶系,从蛋白水平对其在细胞中的分布进行定位,将有助于了解其在So0157-2利用木聚糖中的作用、甚至在其生长和发育中的生理作用,探讨So0157-2可能的木聚糖降解方式,解释其对自然界中纤维素、半纤维素高效降解的原因。

潘翔^[6]2013年在《毛白杨4CL基因启动子及APX的结构与功能研究》文中提出毛白杨(populus tomentosa Carr.)是我国北方地区广泛种植的本土树种,具有分布广、速生、丰产、材质优良及抗逆性强等特点,被广泛用于造纸等行业。毛白杨木质索和类黄酮的合成调节以及抗氧化系统的精确控制方面的研究比较薄弱。4-香豆酸：辅酶A连接酶(4-coumarate:Coenzyme A ligase,4CL)位于苯丙烷类衍生物合成途径的分支点上,在植物中通常出基因家族编码。本论文以毛白杨作为植物材料,克隆分离了4个4CL基因家族成员启动子区,构建了GUS表达载体,并在转基因烟草中分析了4个启动子的组织特异性表达模式。在运用生物信息学软件对启动子中包含的顺式调控元件进行预测的基础上,采用5′缺失分析与EMSA结合的方法鉴定了Pto4CL2启动子重要调控域和关键顺式作用元件。抗坏血酸过氧化氢酶(ascorbate peroxidase, APX)是植物体内重要的H2O2清除系统——抗坏血酸-谷胱甘肽(AsA-GSH)循环的关键酶。本文对毛白杨PtoAPX多个同工酶进行重组蛋白表达和分离纯化,并对其进行了酶活性测定和动力学分析；预测PtoAPX同工酶家族成员蛋白抗原表位,设计并合成抗原多肽制备多克隆抗体,结合胶体金免疫电镜技术研究其细胞器定位,并在转基因烟草中表达PtoAPX-GFP融合蛋白,结合激光共聚焦显微技术确认其亚细胞定位；构建PtoAPX基因正义双元表达载体转化烟草,检测转基因植株抗盐能力。基于上述研究,得到如下主要结果：1.首次克隆得到4个4CL家族成员基因启动子,生物信息学分析预测启动子区潜在的顺式调控元件发现,4个启动子中共包含了26种组织特异性表达元件和逆境响应顺式调控元件。2.分别构建了4个启动子与GUS报告基因串联的植物表达载体并转化烟草。GUS活性分析表明,4个启动子驱动GUS的表达部位和表达模式有差异,其中Pto4CL4p和Pto4CL5p调控的表达模式比较接近。Pto4CL2p和Pto4CL3p驱动的组织特异性表达同时具有发育阶段特异性3.通过比较Pto4CL2全长启动子与5′缺失动子-GUS融合载体转基因烟草的GUS活性,鉴定了调控该启动子表达的关键区域。结果发现-317～-292区域与表皮和花瓣的表达相关,而删除-266～-252区域则导致组织特异性表达的丧失和GUS活性的急剧下降。4.凝胶阻滞实验检测发现Pto4CL2启动子中位于-264～-255区域的富含腺嘌呤和胞嘧啶的AC元件在其复杂的特异性表达模式的调控中起到关键作用。位于-252～-239区域中的脱落酸应答元件(ABRE)在该启动子的丛础表达中起正调控作用。这是首次在高等植物中研究Ⅱ类4CL的启动子调控元件5.原核表达并纯化了PtoAPX2、PtoAPX6和PtoAPX7重组蛋白,酶动力学分析发现：叁者对H2O2的Km。值较接近但PtoAPX6和PtoAPX7的Vmax值都在PtoAPX2的10倍以上,说明PtoAPX6和PtoAPX7对H2O2的清除效率明显高于PtoAPX2。 PtoAPX7对AsA的Km值和Vmax值都是叁者中最高的,说明其适于迅速利用较高浓度的AsA。PtoAPX6和PtoAPX7都是在20℃和弱碱性环境中具有最高活性,但PtoAPX6能在较宽的酸碱性环境中保持高活性。6.利用特异性抗原多肽免疫兔子,获得了分别与4个PtoAPX司工酶特异性结合的多克隆抗体,免疫电镜检测到PtoAPX6定位于杨树叶绿体,PtoAPX7定位于杨树线粒体。PtoAPX6和PtoAPX7与GFP融合蛋白在转基因烟草中的定位与免疫电镜结果一致。PtoAPX7是木本植物中发现的首个线粒体定位的APX7. PtoAPX7正义转基因烟草与野生型烟草抗盐性比较显示,在盐胁迫条件下PtoAPX7转基因烟草体内水分的丧失量、H2O2水平、MDA含量均显着低于野生型烟草。说明PtoAPX7在转基因烟草中的过量表达能够有效提高植株的抗盐性。本研究对Ⅱ类4CL启动子结构的分析初步揭示了其调控组织特异性表达的机理,为毛白杨次生代谢物质合成途径调控机制的研究提供了理论依据。PtoAPX酶学性质、亚细胞定位和提高植物抗盐性的研究为木本植物抗氧化系统的精确调控研究奠定了基础。

刘佳林^[7]2016年在《重组融合蛋白在E.coli中可溶性表达及抗原活性研究》文中指出本文在前期工作基础上,针对一种由口蹄疫病毒衣壳蛋白B表位和T表位组成的表位肽在大肠杆菌(E.coli)中以包涵体形式表达的问题。采用铁蛋白和热休克蛋白65(HSP65)及其变构体作为分子伴侣,与表位肽相融合,观察融合蛋白在E.coli中的表达形式,确定能可溶性表达的重组融合蛋白,在此过程中,对重组融合蛋白的抗原活性进行研究。本文的研究结果对重组蛋白在E.coli可溶性表达的设计思路有一定参考价值。

严秀文^[8]2011年在《牛虻唾液腺免疫抑制肽Immunoregulin HA及大熊猫抗菌肽PC的结构与功能研究》文中研究说明吸血节肢动物在长期的进化下,产生了十分有效的抵抗寄主免疫的吸血机制。在其唾液腺中能分泌大量的有助于吸血的活性物质,如：血小板聚集抑制因子,抗凝物质,溶栓物质,血管舒张肽,免疫调节肽以及抗菌物质等。这些物质对于我们了解寄生生物与寄主之间协同进化的过程有十分重要的意义,也为药物开发提供了新思路。拟黑腹瘤虻(Hybomitra atriperoides),属昆虫纲(Insecta)双翅目(Diptera)虻科(Tabanidae)瘤虻属(Hybomitra Enderlein)。主要分布于甘肃。我们从拟黑腹瘤虻的唾液腺提取物中分离纯化出具有免疫调节活性的多肽Immunoregulin HA。经测序后发现它是由30个氨基酸残基组成的多肽,序列为GGVTGVTEFEPVDVSGEDYDSDEMDEDGRA.我们成功构建了拟黑腹瘤虻唾液腺的cDNA文库,获得2.3×105个独立克隆,从中成功的克隆得到了多肽Immunoregulin HA的cDNA编码序列。我们对多肽Immunoregulin HA的cDNA序列及多肽的结构和功能进行了分析,发现多肽Immunoregulin HA与姚虻唾液腺中的免疫抑制蛋白Tabimmunregulins以及NCBI数据库中其他免疫调节蛋白在核酸及蛋白水平上高度同源。研究发现该多肽能显着提高由LPS诱导的小鼠脾细胞白介素10(IL-10)的分泌并显着抑制IFN-y和单核细胞趋化蛋白MCP-1的分泌。白介素10(IL-10)能抑制T细胞分化及细胞因子释放,免疫抑制多肽Immunoregulin HA可能通过诱导白介素10(IL-10)的上调来抑制IFN-y和单核细胞趋化蛋白MCP-1的分泌,从而抵抗寄主对姚虻的免疫排斥,使得吸血行为顺利进行。该实验为我们深入的了解寄生生物与寄主间的协同进化的分子机制提供了研究依据。由于生物技术和计算机技术的不断发展,全基因测序变为可能。全基因测序的意义在于：能在第一时间发现新基因,对其功能进行分析与预测；分析各个基因的进化史,并对目的基因有效改造,造福于民；了解基因组结构以及基因功能,研究分子疾病的产生原因与机制,发展个性化医疗等。随着大熊猫(Ailuropoda melanoleuca)全基因测序的完成,我们从GenBank数据库中发现了大熊猫的cathelicidin编码序列,我们把大熊猫cathelicidin编码序列编码的成熟肽称为PC (panda cathelicidin),对它的序列进行了分析和比较,并对其功能进行了研究。Cathelicidins是最初从哺乳动物体内发现的具有多功能的抗菌肽家族,在先天免疫中起着重要作用。Cathelicidins的N-端是保守的信号肽区和cathelin区,C-端是大小不一(12-100个氨基酸残基)的阳离子抗菌肽区。Cathelicidins具有广谱的抗微生物活性,不仅对革兰氏阳性细菌、革兰氏阴性细菌、真菌以及病毒具有非常强的活性,而且对许多临床耐药微生物同样具有作用。除此之外,cathelicidins具有许多其它生物学活性,如对多种免疫细胞具有趋化作用、诱导肥大细胞脱粒和组织胺释放、调节巨噬细胞转录、促进伤口愈合、诱导血管发生、诱导变异细胞系细胞凋亡、淋巴细胞活化等。我们对PC的结构进行了分析,二级结构预测结果为a-螺旋和p-折迭,这两种结构对抗茵活性是必要的。我们对其可能具有的活性进行了研究。结果表明PC具有广谱的抗微生物活性,对革兰氏阳性细菌、革兰氏阴性细菌和真菌均有活性,其中包括大量临床分离耐药菌株。PC具有明显的凝集素活性,肿瘤细胞毒性,促血小板聚集的活性,而抗氧化活性,溶血活性,正常细胞毒性,阴道滴虫的毒性,蛋白酶抑制剂活性,肥大细胞脱颗粒活性均不明显。裸鼠肿瘤模型实验结果表明,PC没有明显毒副作用,在低剂量下具有明显的抑制肿瘤的作用。由于PC所具有的广谱抗菌、肿瘤细胞毒性以及极低的溶血活性,使之成为极佳的药物候选分子。

郑君^[9]2013年在《光敏色素调控的一个RING型锌指蛋白基因的表达和功能初探》文中进行了进一步梳理锌指蛋白是真核生物中最丰富的蛋白之一。锌指蛋白的锌指结合基序在结构和功能上范围很广泛，从DNA/RNA结合到蛋白-蛋白相互作用以及膜的相互联系。RING（Really interesting new gene）指基序被鉴定为一个新的锌指区。一个小的富含Cys/His的基序（C3HC/HC3）-RING锌指基序，根据哪个氨基酸（Cys或His）占据基序的第五号位置可以分为两个不同的种类：RING-HC和RING-H2。RING-HC本身含有40-60个氨基酸残基，其保守序列为Cys-X2-Cys-X(9–39)-Cys-X(1–3)-His--X(2–3)-Cys-X-Cys-X-Cys-X-Cys,其中X代表任意氨基酸。 RING-H2基序与RING-HC的不同在于第4个半胱氨酸残基变为组氨酸残基。另外部分RING型锌指蛋白在其N端具有两个跨膜结构，而在其C端则具有保守的含有约41个氨基酸的RING区域。本研究主要是初步探讨了水稻中光敏色素介导的一个RING型锌指蛋白基因（OsASRP, ABASensitivity RING zinc Protein）的表达模式和功能。利用荧光定量PCR在分子水平上对该基因的表达模式进行了探讨，并且构建了植物表达载体，获得了过量表达转基因植株，在生理水平上对其功能进行了初步分析。主要结果如下：1OsASRP定位于细胞质利用原生质体瞬时表达实验对该基因编码的蛋白质进行了亚细胞定位分析，实验结果显示GFP蛋白在细胞质与细胞核中均有绿色荧光，而OsASRP-GFP融合蛋白只在细胞质中存在，据此推测OsASRP基因编码的蛋白质定位于细胞质中。2OsASRP的表达受phyB介导的红光和phyA介导的远红光的抑制比较黑暗、红光和远红光条件下生长八天的WT、phyB和phyAphyB幼苗中OsASRP的转录水平。实验结果显示OsASRP表达受到phyB介导的红光信号的抑制。而远红光条件下， phyA对OsASRP表达也起到一定的抑制作用。3OsASRP在叶片中的表达量高利用荧光定量PCR分析比较了OsASRP在不同的组织器官中的转录水平。所取组织器官为根、茎、叶、旗叶、1cm穗、8cm穗及萌发两天的胚，实验结果显示OsASRP在以上组织器官中均有表达，其在叶和旗叶中表达量较高，这表明OsASRP基因的表达具有组织特异性。4外源ABA、PEG及NaCl诱导OsASRP的表达用外源ABA、PEG及NaCl处理生长到叁叶一心期的水稻幼苗，在不同的时间点取其地上部分，提取RNA，然后进行荧光定量PCR。实验结果显示外源ABA能够诱导OsASRP基因的表达，NaCl与PEG瞬时诱导OsASRP基因的表达。5OsASRP基因负调控水稻的光形态建成比较野生型和OsASRP转基因水稻在持续红光和远红光条件下的表型，过量表达转基因植株的第一叶长和第二叶鞘长均显着高于野生型植株，受光抑制程度较低。此外红光和远红光脉冲实验显示过量表达转基因水稻的胚芽鞘受光抑制程度明显低于WT，说明过表达转基因植株对红光和远红光的敏感性降低，即OsASRP基因负调控红光和远红光调控的光形态建成。6OsASRP过量表达转基因植株对ABA敏感性增强并且对干旱和盐的耐受性提高在含有不同浓度（0、0.5、1、2μM）ABA的培养基中生长7天后，外源ABA对过表达转基因水稻幼苗生长的抑制效果明显高于野生型。据此推测OsASRP过量表达转基因水稻对外源ABA更敏感。对过量表达转基因水稻和WT进行干旱和盐胁迫处理，结果显示过量表达转基因水稻对干旱和盐的耐受性显着提高，推测OsASRP基因可能参与水稻对干旱和盐胁迫的耐性反应。7OsASRP参与ABA的代谢过程利用荧光定量PCR我们分析了ABA合成途径上的基因NCED1、NCED3、NCED5和ABA降解途径上的基因ABAOX1、ABAOX3在野生型和过表达转基因水稻中的表达水平。实验结果显示，外源ABA处理1小时后，过量表达株系中ABA合成途径上基因NCED1、NCED3的表达量显着高于WT中，NCED5则没有显着变化；而转基因株系中ABA降解途径上的相关基因ABAOX1和ABAOX3的表达量要低于WT植株。随着处理时间的增加，所有基因的表达量趋于稳定。这个结果表明OsASRP基因能够调控水稻ABA反应。综上所述，本研究成功克隆了OsASRP基因，并对其表达模式和功能进行了初步探讨。生物信息学和亚细胞定位结果表明该基因编码的蛋白质定位于细胞质并且具有两个跨膜结构域。OsASRP的表达受phyB介导的红光信号phyA介导的远红光信号的抑制并且受到诱导，且其在叶片中的表达量高，外源ABA、PEG及NaCl诱导OsASRP基因的表达；OsASRP基因参与水稻光形态建成并且对起到负调控作用；OsASRP基因过量表达转基因植株对ABA敏感性增强并且对干旱和盐的耐受性提高；OsASRP基因参与ABA的代谢调控。

宋江宁^[10]2005年在《蛋白质二硫键结构特征与序列关系的生物信息学研究》文中研究说明二硫键是由蛋白质的两个半胱氨酸之间配对形成的一种共价键,可以存在于同一条蛋白质多肽链内,也可以存在于不同的多肽链之间。对于许多蛋白质而言,二硫键是它们最终折迭产物的永久特征。二硫键的形成是蛋白质折迭过程中的重要步骤,其形成动力学影响蛋白质折迭的速率和途径,它的错误配对是影响蛋白质多肽链正确折迭的重要原因。二硫键的存在对于维持蛋白质空间结构稳定性,保持其生理活性具有至关重要的意义。研究形成二硫键的蛋白质序列与结构特征,找出与二硫键形成有关联的某些结构信息,对于蛋白质工程和人工药物分子设计都有着积极而重要的意义。本论文以蛋白质二硫键作为研究对象,利用生物信息学这一新兴前沿交叉学科的研究方法和工具,综合运用数学,物理学,生物学和计算机科学知识,通过构建高精度高可靠性的蛋白质二硫键空间结构数据库和大肠杆菌蛋白质二硫键与对应基因序列关联数据库两类数据库,从二硫键蛋白质的基因序列、氨基酸序列和叁维空间结构等叁种水平上对蛋白质二硫键形成的结构特征和序列之间的关系进行较为系统和深入的研究。研究的主要内容如下:(1)高质量蛋白质二硫键空间结构数据库的构建是进行蛋白质二硫键统计计算分析的基础。按照分辨率小于0.25nm,且序列同一性(sequence identity)小于30%的原则从PISCESCulled PDB数据库中选取高精度高可靠性的蛋白质空间结构数据,在此基础上,挑选含有SSBOND记录的PDB结构数据,通过严格的结构数据文件形式错误检验、序列自洽性检验、SSBOND记录准确性检验以及SBOND成键记录校正,删除其中包含的错误和可疑数据,成功建立一个高质量的蛋白质二硫键空间结构数据库。研究蛋白质折迭与蛋白质编码序列关系问题离不开高质量蛋白质结构及其对应基因序列数据。通过查询SWISS-PROT数据库中E. coli的蛋白质,得到不同数据库中的蛋白质结构与基因序列的交叉索引表,在此基础上,删除大量冗余及不可靠数据,最后得到一个高精度大肠杆菌蛋白质结构与对应基因序列数据集-EcoPDB,这是研究蛋白质空间结构数据与核酸序列数据之间对应关系的基础数据库。(2)研究蛋白质二硫键的形成特征和序列结构特征,对于进一步研究蛋白质二硫键的形成、与氨基酸序列之间的关系,预测半胱氨酸的二硫键形成状态以及蛋白质二硫键辅助折迭动力学具有重要作用。CYS的氧化还原状态表现出一种明显的协同性现象:蛋白质序列中若有二硫键形成,那么此序列中的所有CYS或者大部分CYS倾向于采取氧化状态;二硫键在蛋白质序列中的分布很不均匀,大部分二硫键都是在序列距离小于70个氨基酸的地方形成的,存在着二硫键形成的强烈偏好序列距离,如序列距离为11,6,16,5,13个氨基酸处;相对而言,二硫键更倾向于在氨基酸序列的前半段出现,这在蛋白质翻译过程中对于保证新生肽链顺利延伸合成和减少误折迭发生有着积极意义。比较氧化态CYS和还原态CYS周围的氨基酸分布情况,发现两者周围氨基酸分布有着比较明显的差异:前者周围

参考文献：

[1]. 信息论方法预测信号肽[D]. 刘亮. 天津大学. 2004

[2]. 蛋白质序列数据的分类预测研究[D]. 刘惠. 上海交通大学. 2007

[3]. 蛋白质结构预测方法研究[D]. 靳利霞. 大连理工大学. 2002

[4]. 深海细菌Shewanella piezotolerans WP3细胞色素c相关基因的克隆表达和功能鉴定[D]. 刘源振. 哈尔滨工业大学. 2009

[5]. Sorangium cellulosum So0157-2中木聚糖酶的定位研究[D]. 王小叶. 山东大学. 2014

[6]. 毛白杨4CL基因启动子及APX的结构与功能研究[D]. 潘翔. 北京林业大学. 2013

[7]. 重组融合蛋白在E.coli中可溶性表达及抗原活性研究[D]. 刘佳林. 吉林大学. 2016

[8]. 牛虻唾液腺免疫抑制肽Immunoregulin HA及大熊猫抗菌肽PC的结构与功能研究[D]. 严秀文. 南京农业大学. 2011

[9]. 光敏色素调控的一个RING型锌指蛋白基因的表达和功能初探[D]. 郑君. 山东师范大学. 2013

[10]. 蛋白质二硫键结构特征与序列关系的生物信息学研究[D]. 宋江宁. 江南大学. 2005

标签：生物学论文; 信号肽论文; 二硫键论文; 蛋白质结构论文; 氨基酸残基论文; 多肽合成论文; 基因合成论文; 蛋白质合成论文; 序列模式论文; 基因结构论文; 蛋白质论文; 启动子论文; 基因工程论文;

信息论方法预测信号肽

参考文献：

猜你喜欢