利用超级计算机了解生物分子特性
芝加哥大学的科学家们正在研究生物系统中原子的功能和运动。该团队正在修改他们的代码,以便在未来的英特尔- hpe极光超级计算机上运行,该计算机估计可以提供超过2千万亿次的峰值双精度计算性能。极光号将被安置在美国能源部阿贡国家实验室。该研究小组得到了阿贡领导计算设施(ALCF)极光早期科学计划(ESP)的支持。
ESP项目的首席研究员,Benoît Roux博士,芝加哥大学解释说,“我们的该团队正在一台预生产的超级计算机上运行计算机模拟,使用英特尔的硬件和软件,这些硬件和软件将在未来的极光超级计算机上使用。该系统包括预生产的英特尔图形处理器(gpu)。”
Roux表示:“我们ESP项目的目标是开发新技术,以前所未有的精度模拟生物分子系统的虚拟模型。当我们转向在百亿亿次超级计算机上运行计算机模拟时,比如未来的极光系统,我们希望我们正在朝着理性理解生物系统的方向前进。”
定义生化原子粒子的性质和运动
分子的行为和运动遵循物理、热力学和化学定律。Roux指出活细胞的不同部分具有膜、蛋白质和酶等结构。例如,细胞膜是由脂质形成的薄鞘,脂质将细胞的不同区域分开。膜通常是30或40埃厚,但有些蛋白质膜很大,可以达到100埃宽。细胞膜传递细胞外发生的事情的信号。蛋白质通常穿过膜,具有将化学物质泵过膜或控制不同物质通过的功能。
分子生物化学涉及很多方面,计算机模型只能提供分子如何运动和行为的近似值。生物学是非常复杂的,随着研究的进行,可能会发现一些意想不到的因素。Roux指出,将计算机模拟的结果与实验室或临床试验中进行的真实世界的实验进行比较是很重要的。
“我们使用这种全原子分子动力学模拟来严格计算构象自由能和结合自由能。我们特别感兴趣的是了解生物分子系统的功能。我们还在开发新的计算方法(可极化力场、溶剂边界势、高效采样方法)来研究生物大分子系统,”Roux说。
生物分子力场能量案例研究
该团队ESP研究的主要重点是使用超级计算机模拟来确定两个大型膜转运体功能背后的自由能格局。该团队测量了Ca2 +atp酶(SERCA)和p -糖蛋白多药耐药转运体(PGP)。16目标是通过对路径和控制运动的自由能景观进行定量描述,从而获得对其机制的更全面的理解。
SERCA和PGP是两大类转运蛋白。两种蛋白质都使用三磷酸腺苷(ATP)水解作为运输活动的能量来源,涉及与ATP/ADP结合、解结合和水解紧密耦合的复杂构象转变。PGP是一种具有高度生物医学意义的最大超家族的成员磷酸腺苷磁带在许多癌症类型中转运体和介导多药耐药。PGP是一种明确鉴定的膜转运蛋白,能够将药物分子排出癌细胞,导致化疗效率降低.癌细胞上调PGP表达作为逃避化疗介导的细胞死亡的适应性反应。
图1显示了这些结构的一个示例。这项研究的结果可以提供有关癌症多药耐药的重要信息。
数字
1
.米研究中研究的两种转运蛋白的膜结合结构:Ca2 +atp酶泵SERCA(左)和多药物转运蛋白PGP(右)。由芝加哥大学的Roux博士提供。
用于生物分子研究的软件
研究小组使用分子动力学(MD)进行大规模模拟纳米分子动力学(NAMD)项目在研究中。7NAMD是为大型生物分子系统的高性能模拟而设计的并行MD代码。NAMD支持用实验方法无法实现的原子和亚纳秒分辨率测量细胞过程动态的生物学研究。
准备在极光超级计算机上运行
Roux团队在Argonne的Aurora系统评估联合实验室测试平台系统上开始了NAMD代码迁移。Aurora将采用英特尔的新技术,如英特尔Xe-HPC图形处理器(代号Ponte Vecchio)和下一代英特尔至强可扩展处理器(代号Sapphire Rapids),都配备了高带宽存储器旨在提高内存使用。这个团队使用SYCL编译的数据并行c++ (DPC++)编译器,它是英特尔主导的跨行业的一部分oneAPI旨在统一和简化跨不同计算体系结构的应用程序开发的计划。
魏江他以前是鲁克斯实验室的博士后研究员,现在是阿贡的计算科学家,是ALCF催化剂团队的一部分。他使用的是英特尔编译的SYCLDPC + +编译器,以帮助移植CUDA模型运行在英特尔GPU。Jiang指出,使用oneAPI还将帮助开发人员更容易地修改代码以在各种系统上运行。
姜这表明ALCF和英特尔团队开始使用现有的NAMD CUDA GPU模型。该团队使用了oneAPI将现有的GPU代码转换为能够在Intel上运行的c++代码内核模型的工具Xehpc gpu(代号Ponte Vecchio)。NAMD的开发工作将在Intel DPC++兼容工具的帮助下,通过将CUDA内核移植到SYCL来提高跨平台支持。Intel VTune分析器用于帮助提高GPU利用率和新SYCL内核的整体性能。
Jiang指出英特尔为ALCF团队提供研讨会和支持。团队目前可以访问Intel oneMKL库,并且Intel工程师可以帮助调试代码问题设计用于未来极光百亿亿次系统的代码。
Jiang说:“oneAPI工具非常方便,因为它们包含一个完整的编译器和链接器。此外,还包括英特尔VTune分析器,它有助于解决性能问题。oneAPI设计为跨各种gpu工作,最大限度地减少了为各种架构编写代码的任务。”
复杂生物系统的未来研究
“目前的超级计算机可以为中等大小的生物系统模拟几百微秒,但它们仍然有限。分子运动的时间范围很广,从几皮秒到几毫秒不等。许多与生物相关的动态都发生在微秒到毫秒的范围内。现有的超级计算机无法真正模拟像atp驱动Ca这样复杂系统的功能2 +泵。未来超级计算机的新前沿需要理论进步,以模拟提供的信息为基础,来理解复杂生物系统的功能,并准确地确定系统中正在发生的事情。最终的目标是快速找到与疾病或药物开发相关的答案,”Roux说。
ALCF是美国能源部的科学用户设施办公室。
引用:
1.王志强,王志强,王志强,等。大型生物分子系统的恒ph分子动力学模拟。化学理论计算.2017; 13(12): 5933 - 5944。doi:10.1021 / acs.jctc.7b00875
3.Das A, Rui H, Nakamoto R, Roux B.肌浆网钙泵的构象转变和交替通路机制。J Mol生物学.2017, 429(5): 647 - 666。doi:10.1016 / j.jmb.2017.01.007
4.Thirman J, Rui H, Roux B. ATP水解转化为驱动Ca2+泵SERCA的有用工作的难以捉摸的中间状态键。物理化学B.2021, 125(11): 2921 - 2928。doi:10.1021 / acs.jpcb.1c00558
5.王晓燕,王晓燕,王晓燕,等。哺乳动物ABC转运蛋白p -糖蛋白的能量转导和交替通路。自然.2017, 543(7647): 738 - 741。doi:10.1038 / nature21414
6.Kapoor K, Pant S, tajkhorshshe .膜脂在多药转运蛋白p -糖蛋白抑制中的积极参与。化学科学.2021; 12(18): 6293 - 6306。doi:10.1039 / D0SC06288J
7.Phillips JC, Hardy DJ, Maia JDC,等。利用NAMD在CPU和GPU架构上扩展分子动力学。化学物理.2020年,153(4):044130。doi:10.1063/5.0014475
本文是英特尔编辑计划的一部分,旨在突出由高性能计算和人工智能社区通过先进技术推动的前沿科学、研究和创新。bet188真人内容的发布者拥有最终的编辑权,并决定发表什么文章。