【5.1】蛋白质跨膜结构域预测

一  跨膜蛋白的定义

由双层脂类组成的生物膜结构是细胞的基本构成单元,然而,生物膜的大部分功能是由镶嵌在生物膜中的蛋白质来完成的,膜蛋白决定了生物膜的功能特性,因此,不同类型的生物膜,其蛋白构成比例有很大的差别,以质量来算,从25%到75%不等。另一个角度来说,生物体内的蛋白质中,20-30%都属于膜蛋白,因此膜蛋白在细胞的功能中占据重要地位是显而易见的。由于膜蛋白很难得到大量外源表达,纯化、结晶也非常困难,所以得到结晶X线衍射明确其结构的膜蛋白至今仍然很少,目前对于膜蛋白的结构研究,仍然处于起步阶 段。

膜蛋白包括:

  • integral membrane protein
  • peripheral membrane protein

在integral膜蛋白中,与细胞膜的结合也有几种不同的方式,其中主要方式是肽段直接跨过细胞膜,即transmembrane protein(跨膜蛋白),另外还有通过脂肪基与细胞膜发生共价结合,蛋白本身可以在细胞内侧,也可以在细胞膜外侧。跨膜蛋白一般以疏水的alpha- helix与膜脂肪发生非共价结合,在细胞中常执行信号传导或转运通道功能,因此是研究最集中的一类蛋白质。这里介绍的是膜蛋白二级结构中alpha- helix的预测和跨膜结构生化分析相关方法学。

跨膜(TM)蛋白跨过整个脂膜,通常被分为两类α-helical TM (AHTM) 和TM β-barrel (TMB) proteins。AHTM定位在细菌细胞膜的内膜和真核生物的细胞膜上。它们的跨膜区域有极性的环链接而成的α螺旋。对TMB蛋白的了解还不多,它们的跨膜域为反向平行的桶装β链通道[9]。

通过实验的方法(X-ray和NMR等)来决定TM蛋白的结构,相比较于球状蛋白,解析的TM蛋白3D结构非常有限。因此,人们开发了很多的方法用来预测蛋白质的跨膜结构域。这些方法中的大部分都只根据序列来识别跨膜结构。表五列举了常用的在线跨膜结构域预测工具。

二  跨膜蛋白的预测方法

有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知跨膜螺旋的研究而得到的。自然存在的跨膜螺旋**Tmbase 数据库**,可通过匿名FTP获得,TMPRED基于对tmpred数据库的统计分析,蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。

三 预测工具

表五 在线跨膜结构域预测工具(更多工具参见http://www.bio-soft.net/prool.html)

工具 方法 预测的结构 网络链接
DAS-TMfilter DAS AHTM http://mendel.imp.ac.at/sat/DAS/DAS.html
MINNOU RSA/SS AHTM and TMB http://minnou.cchmc.org/
PRED-TMMB HMM TMB http://bioinformatics.biol.uoa.gr/ PRED-TMBB/input.jsp
PRED-TMR Hydrophobicity profile AHTM and TMB http://athina.biol.uoa.gr/PRED-TMR/input.html
SOSUI Hydropathy scale AHTM http://bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html
TMBETA-NET Amino acid composition; NNs TMB http://psfs.cbrc.jp/tmbeta-net/
TMB-Hunt k-NN algorithm TMB http://bmbpcu36.leeds.ac.uk/~andy/betaBarrel/AACompPred/aaTMB_Hunt.cgi
TMMOD HMM profile AHTM http://liao.cis.udel.edu/website/servers/TMMOD/scripts/frame.php?p=submit
TSEG Tandem clusters of membrane proteins AHTM and TMB http://www.genome.ad.jp/
  • TMpred:预测蛋白质的跨膜区段和在膜上的取向,它根据来自SWISS-PROT的跨膜蛋白数据库Tmbase,利用跨膜结构区段的数量、位置以及侧翼信息,通过加权打分进行预测。

  • DAS 蛋白跨膜预测服务器、输入蛋白序列,预测跨膜区域。

斯德哥尔摩大学理论化学蛋白预测服务器提供的膜蛋白拓扑学预测Topology prediction of membrane proteins在线工具

四 我选用的工具

TMHMM Server v. 2.0这个工具既有网页版,还有下载版,网页版有上传序列文件和粘贴序列两种方式 3种输出结果:

4.1  Extensive, with graphics

tmhmm

4.2 Extensive, no graphics

4.3One line per protein模式的结果:

108_1 len=721 ExpAA=128.17 First60=19.38 PredHel=6 Topology=o27-44i87-109o129-151i174-196o201-223i236-258o
##len代表输入序列的长度,ExpAA代表预测出来的跨膜区的aa个数,
First60序列前60个aa中有多少个是处于跨膜区,
<span style="color: #ff0000;">Total prob of N-in: 0.00103???</span> 
topology中o代表膜外,i代表膜内,中间的数字代表跨膜区的碱基

 # 108_1 Length: 721
 # 108_1 Number of predicted TMHs: 6
 # 108_1 Exp number of AAs in TMHs: 128.17376
 # 108_1 Exp number, first 60 AAs: 19.38109
 # 108_1 Total prob of N-in: 0.00103

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn