爱操操网 来鲁华实验室在全原子卵白质序列联想中取得新进展
布景爱操操网
少妇白洁全集基于骨架结构的卵白质序列联想是全新卵白质联想的要害问题之一。比年来,跟着深度学习关节和时候的发展,全新卵白质序列联想取得了垂危进展。其中代表性的责任包括ProteinMPNN,ABACUS-R,ProDesign-LE等,皆在序列联想中取得了垂危进展,并进行了相应的实验考据。然而,这些代表性的关节在模子现实和规模输出中均莫得径直沟通卵白质侧链的原子细节信息。一方面,卵白质侧链构象对卵白质实行功能具有垂危作用。另一方面,精深的序列联想较法依赖结构瞻望来评估联想序列的可靠性,而单序列结构瞻望依旧是一个尽头大的挑战。近期,北京大学来鲁华实验室发展了全原子卵白质序列联想的深度学习算法GeoSeqBuilder,这一规模近期发表于Angewandte Chemie1,著作初稿2024年3月以预印本口头发表2。GeoSeqBuilder在生成序列的同期,也给出了高精度的侧链构象,不错更径直给出原子之间的互相作用,不需要进行单序列结构瞻望。GeoSeqBuilder在自然卵白质结构、全新联想结构和酶的序列联想的实验测试中获取了高告捷率,剖析的晶体结构与联想结构模子在原子模范细节上高度吻合。
爱操操网
模子框架及规模
GeoSeqBuilder主要包含三部分:(1)多模范图卷积网罗用于学习中心残基周围5阶邻居的环境信息;(2)三角网罗用于默示学习残基水平的二体和三体互相作用;(3)迭代模块基于以上网罗从肇始序列开赴更新序列,多步迭代后得到管束序列。GeoSeqBuilder最终输出联想序列对应的卵白质全原子模子。具体见图 1.
图 1 GeoSeqBuilder框架图
GeoSeqBuilder在CATH4.3数据集上进行现实和考据,序列规复率达到了52%,与ProteinMPNN等关节的说明访佛。此外,GeoSeqBuilder联想出来的诸位点的残基类型频频和野生型具有同样的物理化学性质。GeoSeqBuilde生成的各式残基的丰采与自然卵白访佛。GeoSeqBuider对侧链构象瞻望的规模也远优于基于传统能量函数的关节FASPR和Scwrl4(见图 2)。
图 2. GeoSeqBuilder的序列和侧链构象瞻望规模爱操操网
该责任当先选拔了两个典型的卵白质折叠骨架对GeoSeqBuilder生成的序列进行实验考据,包括自然硫氧还原卵白(1FB0)和通过幻念念模子东说念主工联想的螺旋束骨架(0705)。作家辨别为其联想了9条和6条序列,这些序列均不错在大肠杆菌中以可溶口头抒发。对硫氧还原卵白从新联想的序列具有很高的热剖析性,热变性温度较野生型卵白进步了40摄氏度,X-射线晶体学结构剖析标明联想的全原子模子与所解出的晶体结构高度吻合,而况联想卵白质领有新的疏水堆积中枢,具体见图3。
图 3 GeoSeqBuider告捷为靶标1FB0和0705联想了序列,联想模子与晶体结构高度一致
以上规模标明GeoSeqBuilder学习到了卵白质折叠结构和序列的关系,不错在保执卵白质折叠结构正确性的同期联想出新的疏水中枢。一般觉得疏水中枢在卵白序列的当然进化经过中是比拟保守的,疏水中枢从新联想后的卵白是否还会保执原有的功能是一个很真义的问题。作家选拔细胞铁圆寂中的要害卵白谷胱甘肽过氧化物酶(gpx4, PDB代码2obi)行为磋议对象,固定gpx4的溶剂显露残基位点,只联想gpx4的疏水中枢区域,并选拔5条序列进行实验考据,其中4条序列的卵白不错测出gpx4的酶响应活性,3条活性高于野生型卵白。作家随后解出了这4个有酶活性的联想卵白的高分辨晶体结构,均与计较联想的结构模子在原子水平上高度一致(图4)。
图 4 诳骗GeoSeqBuilder为靶标gpx4联想了5种新的疏水中枢堆积方式,其中3条序列对应卵白的酶活性有显耀进步。
归来
该责任发展了一种基于卵白质骨架结构和全原子模子的序列联想关节GeoSeqBuilder。该关节所联想的卵白质可溶性好、抒发量和热剖析性高,不错折叠成预联想的卵白质结构。值得注释的是,GeoSeqBuilder不仅提供了与实验结构一致的侧链构象,新联想的序列还提供了各样化的疏水中枢堆积方式,从而扩大了序列景不雅。GeoSeqBuilder不仅在卵白质序列重新联想中具有垂危真义,而且为卵白质工程和卵白质序列结构关系磋议提供了新的视角。GeoSeqBuilder当今已开源(https://github.com/PKUliujl/GeoSeqBuilder),为卵白质联系的科学磋议和分娩配置提供了过劲的器具。
该责任的第一作家为北大-清华人命科学聚集中心2020级磋议生刘佳乐,通信作家为北京大学化学与分子工程学院/前沿交叉学科磋议院定量生物学中心/北大-清华人命科学聚集中心/北京大学成皆前沿交叉生物时候磋议院来鲁华陶冶和北京大学化学与分子工程学院张长胜副磋议员。北大-清华人命科学聚集中心磋议生郭政、北大化学学院博士后由瀚天对该责任的完成作念出了垂危孝顺。联系责任得到了国度重心研发计议(2022YFA303700)和国度当然科学基金委员会容貌(21977007, 22237002, T2321001)的资助。
参考文件
[1] Jiale Liu, Zheng Guo, Hantian You, Changsheng Zhang*, and Luhua Lai*. All-Atom Protein Sequence Design Based on Geometric Deep Learning. Angew. Chem. Int. Ed. 2024, e202411461.
[2] Jiale Liu, Zheng Guo, Changsheng Zhang*, and Luhua Lai*. All-atom protein sequence design based on geometric deep learning. bioRxiv (2024): 2024-03.
论文淹没
https://onlinelibrary.wiley.com/doi/10.1002/anie.202411461