蛋白质结构

编辑:礼让网互动百科 时间:2019-11-17 15:47:10
编辑 锁定
蛋白质结构是指蛋白质分子的空间结构。作为一类重要的生物大分子,蛋白质主要由碳、、氮、硫等化学元素组成。所有蛋白质都是由20种不同的L型α氨基酸连接形成的多聚体,在形成蛋白质后,这些氨基酸又被称为残基。蛋白质和多肽之间的界限并不是很清晰,有人基于发挥功能性作用的结构域所需的残基数认为,若残基数少于40,就称之为多肽或肽。要发挥生物学功能,蛋白质需要正确折叠为一个特定构型,主要是通过大量的非共价相互作用(如氢键,离子键,范德华力疏水作用)来实现;此外,在一些蛋白质(特别是分泌性蛋白质)折叠中,二硫键也起到关键作用。为了从分子水平上了解蛋白质的作用机制,常常需要测定蛋白质的三维结构。由研究蛋白质结构而发展起来了结构生物学,采用了包括X射线晶体学核磁共振等技术来解析蛋白质结构。
一定数量的残基对于发挥某一生物化学功能是必要的;40-50个残基通常是一个功能性结构域大小的下限。蛋白质大小的范围可以从这样一个下限一直到数千个残基。目前估计的蛋白质的平均长度在不同的物种中有所区别,一般约为200-380个残基,而真核生物的蛋白质平均长度比原核生物长约55%。更大的蛋白质聚合体可以通过许多蛋白质亚基形成;如由数千个肌动蛋白分子聚合形成蛋白纤维。
中文名
蛋白质结构
含    义
蛋白质分子的空间结构
性    质
一类重要的生物大分子
组成元素
化学元素

蛋白质结构发现历史

编辑
1959年佩鲁茨和肯德鲁对血红蛋白和肌血蛋白进行结构分析,解决了三维空间结构,获1962年化学奖。
鲍林发现了蛋白质的基本结构。克里克、沃森在X射线衍射资料的基础上,提出了DNA三维结构的模型。获1962年生理或医学奖。50年代后豪普特曼卡尔勒建立了应用X射线分析的以直接法测定晶体结构的纯数学理论,在晶体研究中具有划时代的意义,特别在研究大分子生物物质如激素、抗生素、蛋白质及新型药物分子结构方面起了重要作用。他们因此获1985年化学奖。

蛋白质结构结构种类

编辑
蛋白质分子是由氨基酸首尾相连缩合而成的共价多肽链,但是天然蛋白质分子并不是走向随机的松散多肽链。每一种天然蛋白质都有自己特有的空间结构或称三维结构,这种三维结构通常被称为蛋白质的构象,即蛋白质的结构。
蛋白质的分子结构可划分为四级,以描述其不同的方面:
  • 一级结构:组成蛋白质多肽链的线性氨基酸序列。
  • 二级结构:依靠不同氨基酸之间的C=O和N-H基团间的氢键形成的稳定结构,主要为α螺旋β折叠
  • 三级结构:通过多个二级结构元素在三维空间的排列所形成的一个蛋白质分子的三维结构。
  • 四级结构:用于描述由不同多肽链(亚基)间相互作用形成具有功能的蛋白质复合物分子。
除了这些结构层次,蛋白质可以在多个类似结构中转换,以行使其生物学功能。对于功能性的结构变化,这些三级或四级结构通常用化学构象进行描述,而相应的结构转换就被称为构象变化。

蛋白质结构一级结构

蛋白质的一级结构(primary structure)就是蛋白质多肽链中氨基酸残基的排列顺序(sequence),也是蛋白质最基本的结构。它是由基因上遗传密码的排列顺序所决定的。各种氨基酸按遗传密码的顺序,通过肽键连接起来,成为多肽链,故肽键是蛋白质结构中的主键。
迄今已有约一千种左右蛋白质的一级结构被研究确定,如胰岛素,胰核糖核酸酶、胰蛋白酶等。
  蛋白质的一级结构决定了蛋白质的二级、三级等高级结构,成百亿的天然蛋白质各有其特殊的生物学活性,决定每一种蛋白质的生物学活性的结构特点,首先在于其肽链的氨基酸序列,由于组成蛋白质的20种氨基酸各具特殊的侧链,侧链基团的理化性质和空间排布各不相同,当它们按照不同的序列关系组合时,就可形成多种多样的空间结构和不同生物学活性的蛋白质分子。
  蛋白质分子的多肽链并非呈线形伸展,而是折叠和盘曲构成特有的比较稳定的空间结构。蛋白质的生物学活性和理化性质主要决定于空间结构的完整,因此仅仅测定蛋白质分子的氨基酸组成和它们的排列顺序并不能完全了解蛋白质分子的生物学活性和理化性质。例如球状蛋白质(多见于血浆中的白蛋白、球蛋白、血红蛋白和酶等)和纤维状蛋白质(角蛋白、胶原蛋白、肌凝蛋白、纤维蛋白等),前者溶于水,后者不溶于水,显而易见,此种性质不能仅用蛋白质的一级结构的氨基酸排列顺序来解释。
  蛋白质的空间结构就是指蛋白质的二级、三级和四级结构。

蛋白质结构二级结构

蛋白质的二级结构(secondary structure)是指多肽链中主链原子的局部空间排布即构象,不涉及侧链部分的构象。
  1.肽键平面(或称酰胺平面,amide plane)。
  Pauling等人对一些简单的肽及氨基酸的酰胺等进行了X线衍射分析,从一个肽键的周围来看,得知:
  (1)肽链中的C-N键长0.132nm,比相邻的N-C单键(0.147nm)短,而较一般C=N双键(0.128nm)长,可见,肽键中-C-N-键的性质介于单、双键之间,具有部分双键的性质,因而不能旋转,这就将固定在一个平面之内。
  (2) 肽键的C及N周围三个键角之和均为360°,说明都处于一个平面上,也就是说六个原子基本上同处于一个平面,这就是肽键平面。肽链中能够旋转的只有α碳原子所形成的单键,此单键的旋转决定两个肽键平面的位置关系,于是肽键平面成为肽链盘曲折叠的基本单位。
  (3) 肽键中的C-N既具有双键性质,就会有顺反不同的立体异构,已证实处于反位。
  2.蛋白质主链构象的结构单元
  1)α-螺旋Pauling等人对α-角蛋白(α-keratin)进行了X线衍射分析,从衍射图中看到有0.5~0.55nm的重复单位,故推测蛋白质分子中有重复性结构,并认为这种重复性结构为α-螺旋(α-helix).
  α-螺旋的结构特点如下:
  ①多个肽键平面通过α-碳原子旋转,相互之间紧密盘曲成稳固的右手螺旋。
  ②主链呈螺旋上升,每3.6个氨基酸残基上升一圈,相当于0.54nm,这与X线衍射图符合。
  ③相邻两圈螺旋之间借肽键中C=O和H桸形成许多链内氢健,即每一个氨基酸残基中的NH和前面相隔三个残基的C=O之间形成氢键,这是稳定α-螺旋的主要键。
  ④肽链中氨基酸侧链R,分布在螺旋外侧,其形状、大小及电荷影响α-螺旋的形成。酸性或碱性氨基酸集中的区域,由于同电荷相斥,不利于α-螺旋形成;较大的R(如苯丙氨酸、色氨酸、异亮氨酸)集中的区域,也妨碍α-螺旋形成;脯氨酸因其α-碳原子位于五元环上,不易扭转,加之它是亚氨基酸,不易形成氢键,故不易形成上述α-螺旋;甘氨酸的R基为H,空间占位很小,也会影响该处螺旋的稳定。
  2)β-片层结构Astbury等人曾对β-角蛋白进行X线衍射分析,发现具有0.7nm的重复单位。如将毛发α-角蛋白在湿热条件下拉伸,可拉长到原长二倍,这种α-螺旋的X线衍射图可改变为与β-角蛋白类似的衍射图。说明β-角蛋白中的结构和α-螺旋拉长伸展后结构相同。两段以上的这种折叠成锯齿状的肽链,通过氢键相连而平行成片层状的结构称为β-片层(β-pleated sheet)结构或称β-折迭。
  β-片层结构特点是:
  ①是肽链相当伸展的结构,肽链平面之间折叠成锯齿状,相邻肽键平面间呈110°角。氨基酸残基的R侧链伸出在锯齿的上方或下方。
  ②依靠两条肽链或一条肽链内的两段肽链间的C=O与N-H形成氢键,使构象稳定。
  ③两段肽链可以是平行的,也可以是反平行的。即前者两条链从“N端”到“C端”是同方向的,后者是反方向的。β-片层结构的形式十分多样,正、反平行能相互交替。
  ④平行的β-片层结构中,两个残基的间距为0.65nm;反平行的β-片层结构,则间距为0.7nm.
  3)β-转角
  蛋白质分子中,肽链经常会出现180°的回折,在这种回折角处的构象就是β-转角(β-turn或β-bend)。β-转角中,第一个氨基酸残基的C=O与第四个残基的N-H之间形成氢键,从而使结构稳定。
  4)无规卷曲
  没有确定规律性的部分肽链构象,肽链中肽键平面不规则排列,属于松散的无规卷曲(random coil)。

蛋白质结构超二级结构和结构域

超二级结构(supersecondary structure)是指在多肽链内顺序上相互邻近的二级结构常常在空间折叠中靠近,彼此相互作用,形成规则的二级结构聚集体。目前发现的超二级结构有三种基本形式:α螺旋组合(αα);β折叠组合(βββ)和α螺旋β折叠组合(βαβ),其中以βαβ组合最为常见。它们可直接作为三级结构的“建筑块”或结构域的组成单位,是蛋白质构象中二级结构与三级结构之间的一个层次,故称超二级结构。
  结构域(domain)也是蛋白质构象中二级结构与三级结构之间的一个层次。在较大的蛋白质分子中,由于多肽链上相邻的超二级结构紧密联系,形成二个或多个在空间上可以明显区别它与蛋白质亚基结构的区别。一般每个结构域约由100-200个氨基酸残基组成,各有独特的空间构象,并承担不同的生物学功能。如免疫球蛋白(IgG)由12个结构域组成,其中两个轻链上各有2个,两个重链上各有4个;补体结合部位与抗原结合部位处于不同的结构域。一个蛋白质分子中的几个结构域有的相同,有的不同;而不同蛋白质分子之间肽链中的各结构域也可以相同。如乳酸脱氢酶、3-磷酸甘油醛脱氢酶、苹果酸脱氢酶等均属以NAD+为辅酶的脱氢酶类,它们各自由2个不同的结构域组成,但它们与NAD+结合的结构域构象则基本相同。

蛋白质结构三级结构


  蛋白质的多肽链在各种二级结构的基础上再进一步盘曲或折迭形成具有一定规律的三维空间结构,称为蛋白质的三级结构(tertiary structure)。蛋白质三级结构的稳定主要靠次级键,包括氢键、疏水键、盐键以及范德华力(Van der Wasls力)等。这些次级键可存在于一级结构序号相隔很远的氨基酸残基的R基团之间,因此蛋白质的三级结构主要指氨基酸残基的侧链间的结合。次级键都是非共价键,易受环境中pH、温度、离子强度等的影响,有变动的可能性。二硫键不属于次级键,但在某些肽链中能使远隔的二个肽段联系在一起,这对于蛋白质三级结构的稳定上起着重要作用。
  现也有认为蛋白质的三级结构是指蛋白质分子主链折叠盘曲形成构象的基础上,分子中的各个侧链所形成一定的构象。侧链构象主要是形成微区(或称结构域domain)。对球状蛋白质来说,形成疏水区和亲水区。亲水区多在蛋白质分子表面,由很多亲水侧链组成。疏水区多在分子内部,由疏水侧链集中构成,疏水区常形成一些“洞穴”或“口袋”,某些辅基就镶嵌其中,成为活性部位。
  具备三级结构的蛋白质从其外形上看,有的细长(长轴比短轴大10倍以上),属于纤维状蛋白质(fibrous protein),如丝心蛋白;有的长短轴相差不多基本上呈球形,属于球状蛋白质(globular protein),如血浆清蛋白、球蛋白、肌红蛋白,球状蛋白的疏水基多聚集在分子的内部,而亲水基则多分布在分子表面,因而球状蛋白质是亲水的,更重要的是,多肽链经过如此盘曲后,可形成某些发挥生物学功能的特定区域,例如酶的活性中心等。

蛋白质结构四级结构


  具有二条或二条以上独立三级结构的多肽链组成的蛋白质,其多肽链间通过次级键相互组合而形成的空间结构称为蛋白质的四级结构(quarternary structure)。其中,每个具有独立三级结构的多肽链单位称为亚基(subunit)。四级结构实际上是指亚基的立体排布、相互作用及接触部位的布局。亚基之间不含共价键,亚基间次级键的结合比二、三级结构疏松,因此在一定的条件下,四级结构的蛋白质可分离为其组成的亚基,而亚基本身构象仍可不变。
  一种蛋白质中,亚基结构可以相同,也可不同。如烟草斑纹病毒的外壳蛋白是由2200个相同的亚基形成的多聚体;正常人血红蛋白A是两个α亚基与两个β亚基形成的四聚体;天冬氨酸氨甲酰基转移酶由六个调节亚基与六个催化亚基组成。有人将具有全套不同亚基的最小单位称为原聚体(protomer),如一个催化亚基与一个调节亚基结合成天冬氨酸氨甲酰基转移酶的原聚体。
  某些蛋白质分子可进一步聚合成聚合体(polymer)。聚合体中的重复单位称为单体(monomer),聚合体可按其中所含单体的数量不同而分为二聚体、三聚体……寡聚体(oligomer)和多聚体(polymer)而存在,如胰岛素(insulin)在体内可形成二聚体及六聚体。

蛋白质结构作用

编辑
  1. 构成生物体内基本物质,为生长及维持生命所必需;
  2. 部分蛋白质可作为生物催化剂,即酶和激素;
  3. 生物的免疫作用所必需的物资;
  4. 有些蛋白质会导致食物过敏。

蛋白质结构组成

编辑
化学组成
(1).单纯蛋白质:仅含有AAs
(2).结合蛋白质:由AAs和其他非蛋白质化合物所组成
(3).衍生蛋白质:用化学或酶学方法得到的化合物
分子组成
基本单位:氨基酸 有不同的AAs通过肽键相互连接而成
蛋白质→眎→胨→多肽→二肽→多肽→氨基酸
元素组成
由碳,氢,氧,氮,硫,磷,碘,铁,锌等元素组成。
功能分类
(1).结构蛋白质:角蛋白,胶原蛋白,弹性蛋白
(2).有生物活性的蛋白质:酶,激素,免疫球蛋白
(3).食品蛋白质:凡可供食用,易消化,无毒和可供人类利用的蛋白质

蛋白质结构肽键

编辑
两个氨基酸可以通过缩合反应结合在一起,并在两个氨基酸之间形成肽键。而不断地重复这一反应就可以形成一条很长的残基链(即多肽链)。这一反应是由核糖体在翻译进程中所催化的。肽键虽然是单键,但具有部分的双键性质(由C=O双键中的π电子云与N原子上的未共用电子对发生共振导致),因此C-N键(即肽键)不能旋转,从而连接在肽键两端的基团处于一个平面上,这一平面就被称为肽平面。而对应的肽二面角φ(肽平面绕N-Cα键的旋转角)和ψ(肽平面绕Cα-C1键的旋转角)有一定的取值范围;一旦所有残基的二面角确定下来,蛋白质的主链构象也就随之确定。根据每个残基的φ和ψ来做图,就可以得到拉氏图,由于形成同一类二级结构的残基的二面角的值都限定在一定范围内,因此在拉氏图上就可以大致分辨残基参与形成哪一类二级结构。下表列出了肽键与对应类型单键以及氢键键长的比较。
肽键
平均长度
单键
平均长度
氢键
平均长度(±30)
Cα - C
153 pm
C - C
154 pm
O-H --- O-H
280 pm
C - N
133 pm
C - N
148 pm
N-H --- O=C
290 pm
N - Ca
146 pm
C - O
143 pm
O-H --- O=C
280 pm

蛋白质结构侧链构象

编辑
残基侧链上的原子根据希腊字母表的顺序(α、β、γ、δ、ε等)来命名,如Cα指的是对应残基上最接近羰基的碳原子,而Cβ则是次接近的。Cα通常被认为是主链骨架的组成原子。这些原子之间的键对应的二面角则相应以χ1、χ2、χ3等来命名,如赖氨酸侧链上第一、二个碳原子(即Cα和Cβ)之间共价键的二面角为χ1。侧链可以有多种不同的构象,每一种类型的残基都有几种比较稳定的侧链构象。

蛋白质结构结构域、结构花样与折叠类型

编辑
许多蛋白质都可以被分为多个结构组成单元,结构域就是这样一个组成单元。结构域一般可以自稳定,且常常独立进行折叠,而不需要蛋白质其他部分的参与;很多结构域都有自己独特的生物学功能。很多结构域并不是一个基因基因家族对应蛋白质的独特结构单元,而往往是许多类蛋白质的共同结构单元。结构域常常是以其生物学功能来命名,如“钙离子结合结构域”;或以几类最初发现此结构域的蛋白名称衍生而来,如PDZ结构域(最初发现于PSD95、DlgA和ZO-1这三个蛋白质)。由于结构域自身可以稳定存在,因此可以将不同来源的结构域通过遗传工程人为地结合在一起,形成杂合蛋白质。
结构花样(structural motif)同样是一种结构组成单元,它是由几个二级结构的特定组合(如螺旋-转角-螺旋)所组成;这些组合又被称为超二级结构。结构花样往往还包含有长度不同的loop区。
折叠类型则指的是整体的结构排列类型,如螺旋束和β桶。
尽管真核生物体可以表达数万种不同的蛋白质,但对应的结构域、结构花样与折叠类型的数量却少得多。一种合理的解释是,这是进化的结果;因为基因或基因的一部分可以在基因组内被加倍或移动。也就是说,通过基因重组,一个结构域可以从相应蛋白质A移动到本不具有此结构域的蛋白质B上,而其发生的进化驱动力可能是由于该结构域对应的生物学功能趋向于被蛋白质B所利用。

蛋白质结构蛋白质折叠

编辑
从一级结构到更高级结构的过程就被称为蛋白质折叠。一个序列特定的多肽链(折叠之前的蛋白
蛋白质折叠前后 蛋白质折叠前后
质一般都被称为多肽链)一般折叠为一种特定构象(又称为天然构象);但有时可以折叠为一种以上的构象,且这些不同构象具有不同的生物学活性。在真核细胞内,许多蛋白质的正确折叠需要分子伴侣的帮助。

蛋白质结构结构分类

编辑
对蛋白质结构进行分类的方法有多种,有多个结构数据库(包括SCOP、CATH和FSSP)分别采用不同的方法进行结构分类。存放蛋白质结构的PDB数据库中就引用了SCOP的分类。对于大多数已分类的蛋白质结构来说,SCOP、CATH和FSSP的分类是相同的,但在一些结构中还有所区别。

蛋白质结构结构测定

编辑
专门存储蛋白质和核酸分子结构的蛋白质数据库中,接近90%的蛋白质结构是用X射线晶体学的方法测定的。X射线晶体学可以通过测定蛋白质分子在晶体中电子密度的空间分布,在一定分辨率下解析蛋白质中所有原子的三维坐标。大约9%的已知蛋白结构是通过核磁共振技术来测定的。该技术还可用于测定蛋白质的二级结构。除了核磁共振以外,还有一些生物化学技术被用于测定二级结构,包括圆二色谱。冷冻电子显微技术是近年来兴起的一种获得低分辨率(低于5)蛋白质结构的方法,该方法最大的优点是适用于大型蛋白质复合物(如病毒外壳、核糖体和类淀粉蛋白纤维)的结构测定;并且在一些情况下也可获得较高分辨率的结构,如具有高对称性的病毒外壳和膜蛋白二维晶体。[1-2] 
解析不同分辨率的蛋白质结构中可能出现的问题(X射线晶体学)
分辨率(
结构中可能出现的问题
>4.0
单个原子坐标无意义
3.0 - 4.0
整体折叠可能是正确的,但很可能有错误存在。很多侧链摆放位置不正确。
2.5 - 3.0
整体折叠基本是正确的,除了位于结构表面的一些环状结构可能没有正确建模。长侧链的极性残基(Lys、Glu、Gln等)和小侧链残基(Ser、Val、Thr等)的侧链摆放位置有可能不正确。
2.0 - 2.5
与2.5 - 3.0类似,只是出现错误的情况更少。可以明显观察到水分子和小配基。
1.5 - 2.0
侧链摆放位置基本无误,甚至一些小的错误也可以被检测到。整体折叠,包括位于结构表面的环状结构,基本不可能出现错误。
0.5 - 1.5
在这一分辨率下,一般不会有结构错误。侧链异构体库和立体几何研究都是利用这一分辨率范围内的结构来进行的。
近年来,随着结构基因组学的兴起,大量的蛋白质结构获得了测定,为研究蛋白质的作用机理提供了重要的结构信息。

蛋白质结构结构预测

编辑
测定蛋白质序列比测定蛋白质结构容易得多,而蛋白质结构可以给出比序列多得多的关于其功能机制的信息。因此,许多方法被用于从序列预测结构。
  • 二级结构预测
  • 三级结构预测
    • 同源建模:需要有同源的蛋白三级结构为基础进行预测。
    • Threading法。
    • “从头开始”(Ab initio):只需要蛋白质序列即可进行结构预测。由于运算量大,需要有超级计算机来进行,或采用分布式计算,如Rosetta@home等。
  • 四级结构预测:主要是预测蛋白质-蛋白质之间的相互作用方式。
参考资料
  • 1.    Branden C, Tooze J. (1999). Introduction to Protein Structure 2nd ed. Garland Publishing: New York, NY
  • 2.    Gonen T, Cheng Y, Sliz P, Hiroaki Y, Fujiyoshi Y, Harrison SC, Walz T. (2005). Lipid-protein interactions in double-layered two-dimensional AQP0 crystals. Nature 438(7068):633-8.
词条标签:
生物 理学