蛋白质结构预测

蛋白质结构预测（英语：Protein structure prediction）是指从蛋白质的氨基酸序列中预测蛋白质的三维结构。也就是说，从蛋白质一级结构预测它的折叠和二级、三级、四级结构。结构预测与蛋白质设计（英语：Protein design）的反问题有着根本的不同。蛋白质结构预测是生物信息学与理论化学所追求的最重要目标之一；它在医学上（例如，在药物设计）和在生物技术上（例如，新的酶的设计）都是非常重要的。每隔两年，当前蛋白质结构预测技术的性能在蛋白质结构预测技术的关键测试（CASP）实验中被评测。蛋白质结构预测的网络服务器连续的评测是由社区项目CAMEO3D（英语：CAMEO3D）执行。

蛋白质结构和术语

蛋白质是由氨基酸链通过肽键连接在一起。与α碳原子相连的C-N键和C-C键相对旋转，产生了蛋白质主链的多种构象，也正是这些构象变化造成了蛋白质三维结构上的差异。每一个氨基酸的主链都是极性的，即碳氧双键上的碳原子带正电性、氧原子带负电性（δ+ C=O δ-），氧原子可以作为氢键受体；氮氢单键有（δ- N-H δ+），氮原子可以作为氢键供体。这些基团在蛋白质结构中便可以相互作用。根据侧链结构的不同可以分为20种常见氨基酸，各自在蛋白质中扮演着重要的角色。甘氨酸（Glycine）的角色往往很特殊，因为它的侧链是最小的，只有一个氢原子，没有侧链的空间位阻就增加了主链的局部灵活性。半胱氨酸（Cysteine）可以与另一个半胱氨酸发生交联反应形成二硫键，使蛋白质整体更加稳定。

蛋白质结构的形成以二级结构元素（Secondary Structure Elements, SSE）为基础，二级结构中有α螺旋和β折叠，它们共同构成了蛋白质链的三级结构。在这些常见的二级结构中，相邻的氨基酸之间形成氢键，主链也有类似的Φ（或者φ,Phi）和Ψ（Psi）角。

这些结构的形成使每个氨基酸主链的极性得到了中和和稳定。在疏水环境里，二级结构常常紧密地堆叠形成蛋白质核心。每个氨基酸侧链的体积的限制，加之与邻近侧链可能产生的相互作用的限制，我们需要运用分子模拟与结构叠合的手段来预测蛋白质的细微结构^[1]。

α螺旋

α螺旋是在蛋白质二级结构中最丰富的类型。α螺旋的平均每个螺旋周期包含3.6个氨基酸，形成一个氢键，在每4个残基中；平均长度为10个氨基酸（3个螺旋）或10埃（Å），但变化范围5到40（Å）（1.5个至11个螺旋）。沿螺旋排列的氢键也构成了带部分电荷的偶极矩，氮端带部分正电。因为氮端有自由的氨基，可以与带负电的基团，比如磷酸基团，进行反应。α螺旋常位于蛋白质核心区靠近表面的位置，有利于于水环境发生作用。面向蛋白内部的螺旋倾向于采用更多的疏水氨基酸，面向外部的多为亲水氨基酸。因此，螺旋链上每四个氨基酸中位置处于的第三位的多为疏水，这也很特征很容易被识别出。比如对亮氨酸拉链模体（Leucine zipper motif）有高度预测性的重复特征是两个相邻的螺旋相对的面上均有亮氨酸的存在。螺旋轮图可以显示出这种重复性的特征。其它的藏在蛋白质核心区或者细胞膜内的α螺旋会更经常分布疏水氨基酸，这样的结构也更能被预测。暴露在螺旋表面的氨基酸中疏水氨基酸所占的比例会更小。所以说氨基酸的类别组成可以用来预测α螺旋区域。那些有更多丙氨酸（Alanine,A）、谷氨酸（Glutamic acid,E）、亮氨酸（Leucine,L）、蛋氨酸（methionine,M），更少脯氨酸（Proline,P）、甘氨酸（Glycine,G）、酪氨酸（Tyrosine,Y）、丝氨酸（Serine,S）的氨基酸容易形成α螺旋。脯氨酸通常破坏或者使α螺旋更不稳定，但是在更长可以存在因为它在α螺旋中形成一个弯折。

β折叠

环肽链

卷曲

一个二级结构的区域不是一个α螺旋，一个β折叠，或可识别的转动，通常被称为一个卷曲（Coils）^[1]。

蛋白质分类

蛋白质结构和序列分类术语

参考文献

^ ^1.0 ^1.1 Mount DM. Bioinformatics: Sequence and Genome Analysis 2. Cold Spring Harbor Laboratory Press. 2004. ISBN 0-87969-712-1.

延伸阅读

Majorek K, Kozlowski L, Jakalski M, Bujnicki JM. Chapter 2: First Steps of Protein Structure Prediction (PDF). Bujnicki J (编). Prediction of Protein Structures, Functions, and Interactions. John Wiley & Sons, Ltd. December 18, 2008: 39–62. ISBN 9780470517673. doi:10.1002/9780470741894.ch2. ^{[失效链接]}
Baker D, Sali A. Protein structure prediction and structural genomics. Science. October 2001, 294 (5540): 93–6. Bibcode:2001Sci...294...93B. PMID 11588250. doi:10.1126/science.1065659.
Kelley LA, Sternberg MJ. Protein structure prediction on the Web: a case study using the Phyre server (PDF). Nature Protocols. 2009, 4 (3): 363–71 [2020-03-05]. PMID 19247286. doi:10.1038/nprot.2009.2. hdl:10044/1/18157. （原始内容存档 (PDF)于2017-09-22）.
Kryshtafovych A, Fidelis K. Protein structure prediction and model quality assessment. Drug Discovery Today. April 2009, 14 (7–8): 386–93. PMC 2808711 . PMID 19100336. doi:10.1016/j.drudis.2008.11.010.
Qu X, Swanson R, Day R, Tsai J. A guide to template based structure prediction. Current Protein & Peptide Science. June 2009, 10 (3): 270–85. PMID 19519455. doi:10.2174/138920309788452182.
Daga PR, Patel RY, Doerksen RJ. Template-based protein modeling: recent methodological advances. Current Topics in Medicinal Chemistry. 2010, 10 (1): 84–94. PMC 5943704 . PMID 19929829. doi:10.2174/156802610790232314.
Fiser, A. Template-based protein structure modeling. Methods in Molecular Biology 673. 2010: 73–94. ISBN 978-1-60761-841-6. PMC 4108304 . PMID 20835794. doi:10.1007/978-1-60761-842-3_6. |journal=被忽略 (帮助)
Cozzetto D, Tramontano A. Advances and pitfalls in protein structure prediction. Current Protein & Peptide Science. December 2008, 9 (6): 567–77. PMID 19075747. doi:10.2174/138920308786733958.
Nayeem A, Sitkoff D, Krystek S. A comparative study of available software for high-accuracy homology modeling: from sequence alignments to structural models. Protein Science. April 2006, 15 (4): 808–24. PMC 2242473 . PMID 16600967. doi:10.1110/ps.051892906.

参阅

外部链接

（英文）CASP experiments home page （页面存档备份，存于互联网档案馆）
（英文）ExPASy 蛋白质组学工具（页面存档备份，存于互联网档案馆） — 预测工具和服务器的列表

[Mount-1] 1.0 ^1.1 Mount DM. Bioinformatics: Sequence and Genome Analysis 2. Cold Spring Harbor Laboratory Press. 2004. ISBN 0-87969-712-1.

[1]

查论编蛋白质：关键研究方法
实验	蛋白质纯化绿色荧光蛋白蛋白质印迹蛋白质免疫染色蛋白质测序凝胶电泳/蛋白质电泳蛋白质免疫沉淀肽质量指纹（英语：Peptide mass fingerprinting）双偏振干涉测量术（英语：Dual-polarization interferometry）微尺度热泳（英语：Microscale thermophoresis）染色质免疫沉淀表面等离子共振 X射线晶体学
生物信息学	蛋白质结构预测蛋白质与蛋白质对接蛋白质结构比对（英语：结构比对）蛋白本体蛋白质交互作用预测（英语：Protein–protein interaction prediction）
化验	酶活性测定（英语：Enzyme assay）蛋白质定量 Secretion assay
展示技术	细菌展示（英语：Bacterial display）信使RNA展示技术（英语：mRNA display）噬菌体展示核糖体展示（英语：Ribosome display）酵母展示（英语：Yeast display）
超分辨率显微镜	光激活定位显微镜（英语：Photoactivated localization microscopy）垂直显像SMI

查论编生物分子结构（英语：Biomolecular structure）
蛋白质结构	一级二级三级四级测定预测设计（英语：Protein design）热力学
核酸结构	一级二级三级四级（英语：Nucleic acid quaternary structure）测定（英语：Nucleic acid structure determination）预测（英语：Nucleic acid structure prediction）设计（英语：Nucleic acid design）热力学
参阅	蛋白质蛋白质结构域蛋白质工程核酸脱氧核糖核酸（DNA）核糖核酸（RNA）核酸双螺旋