单一粒子的低温电子显微镜(低温电子显微镜)是一个功能强大的技术,生物大分子的结构测定和该领域的重大进展已经在过去二十年中(Kuhlbrandt, 2014;诺加利斯,2016)。改进的电子探测器技术(麦克马伦等,2016)和数据分析算法(谢尔,2012;Punjaniet al。,2017;格兰特等,2018;Tegunov &克莱默,2019),以及简化数据采集的软件专业显微镜(卡拉格等,2000;Mastronarde, 2005)增加了可访问性低温电子显微镜的结构测定的方法。因此,蛋白质和蛋白质复杂的结构由单粒子低温电子显微镜(见不断增加https://www.rcsb.org/stats/growth/growth-em)。
低温电子显微镜,蛋白质溶液冷冻是一层薄薄的玻化冰是嵌入在一个电影在一个EM网格(韦森伯多洞的支持et al。,2021)。冷冻低温电子显微镜网格通常需要广泛的冰层厚度优化,以及蛋白质粒子浓度和完整性,通过重复的循环低温电子显微镜检查和改变样品制备(Passmore & Russo, 2016;高贵的et al。,2018)。一旦样品进行了优化,面向大量随机粒子图像获取、分类、对齐和最终重建一个卷代表的库仑势密度蛋白粒子(Sigworth, 2016)。
在低温电子显微镜网格筛选和数据采集,显微镜操作需要手动选择合适的地区(广场)基于网格概述(atlas)并选择目标孔与合适的冰层厚度根据外表(图1)。在许多情况下,冰层厚度必须仔细选择,以避免损坏或优先面向粒子(高贵et al。,2018;D 'Imprimaet al。,2019)。尤其是收购大型数据集,选择手动广场和洞可能非常耗时和缺乏经验的经营者会有困难目标网格区域产量高质量数据(李等,2022)。如今,数据分析完成“动态”在收购(汤普森et al。,2019),提供有价值的实时数据质量信息,和显微镜操作符可以根据结果调整目标选择。然而,这样的试错策略导致的低效使用仪器的高需求和昂贵的维护。自动化的目标广场和洞在低温电子显微镜扫描和数据采集,因此,很有可能增加吞吐量以及低温电子显微镜实验的成功率所有经验层次的人员。
在这个问题上IUCrJ,金et al。(2023)目前的软件工具箱托勒密使用机器学习自动化的任务选择单粒子目标地区低温电子显微镜检查和数据收集。内的算法托勒密使用元数据注释pre-trained人类操作员显微镜会话。托勒密第一个地址的自动选择和排名适合数据采集的广场。要做到这一点,托勒密使用卷积神经网络(CNN,综述Dhillon (2020) & Verma)分类器预测广场的值得收藏的阿特拉斯和可以复制人类专家运营商选择神经网络对未知样本。托勒密然后自动发现孔用神经网络对这些方块U-Net (Ronnebergeret al。,2015)体系结构和二维晶格孔位置的限制。U-Net不仅再现了人类操作员选择精度高,但是概率U-Net分配一个洞似乎也合适的措施值得收藏的一个洞。总而言之,托勒密提供了一个一体化的解决方案可靠和准确的自动瞄准广场和孔单粒子低温电子显微镜网格。这是一个巨大的一步低温电子显微镜检查和数据收集的全部自动化,在显微镜下操作软件很容易实现Leginon(实现的细节,请参阅et al。(2023),也发表在这个问题IUCrJ]。
而托勒密使用专门定制和优化CNN和U-Net机器学习方法实现高精度识别和排名的广场和漏洞,其他软件已接近自动数据采集的问题稍微不同的方法。采取的方法是类似的概念SmartScope(Bouvette等,2022),利用专用的广场和漏洞发现者为操作员选择目标。相比托勒密,SmartScope广场和孔识别过程是基于一个YOLOv5 R-CNN ResNet50架构和模型CSPNet骨干广场和孔识别,分别。还有待观察的深度学习实现收益更好的性能在实际cryoEM成像。值得注意的是,SmartScope实现托勒密作为替代自己的广场和孔识别算法(Bouvette & Viverette, 2022),所以直接比较是可能的。
一个概念上采取不同的方法cryoRL(李等,2022)。而不是试图产生一个完整的选择合适的低温电子显微镜成像之前,广场和洞cryoRL将成像目标的选择算法的路径规划问题的回报当成像好目标。目前,一个目标被认为是好的收益率高的低温电子显微镜图像信息内容,而反向与冰层厚度。然而,最薄的冰层可能可能不是一个合适的目标获取数据的敏感或非常大的蛋白复合物(D 'Imprima等,2019;高贵的et al。,2018)。相反,其他的动态数据分析结果,如复杂的完整性,粒子数量每图像或粒子的取向分布的看法的3 d重建,可能是合适的质量目标。
似乎相结合的方法托勒密,SmartScope和cryoRL将导致非常强大的自动低温电子显微镜数据采集工具。这些工具首先生成高度精确的初始值得收藏排名广场和漏洞,而数据收集的过程将遵循sample-specific“动态”的决策是基于数据分析的结果。
确认
作者感谢丽贝卡·汤普森和詹姆斯·沃尔什的批判阅读手稿。
引用
Bouvette, J。、黄问。,Riccio, A. A., Copeland, W. C., Bartesaghi, A. & Borgnia, M. J. (2022).eLife,11,e80047。
Bouvette, j . & Viverette大肠(2022)。外部插件安装——SmartScope文档。https://docs.smartscope.org/docs/v0.7/。
卡拉格,B。,Kisseberth, N., Kriegman, D., Milligan, R. A., Potter, C. S., Pulokas, J. & Reilein, A. (2000).j . Struct。医学杂志。132年,33-45。
程,。,金,P. T., Kuang, H., Mendez, J. H., Chua, E. Y. D., Maruthi, K., Wei, H., Sawh, A., Aragon, M. F., Serbynovskyi, V., Neselu, K., Eng, E. T., Potter, C. S., Carragher, B., Bepler, T.& Noble, A. J. (2023).IUCrJ,10,77 - 89。
Dhillon, a & Verma g·k (2020)。Artif。智能。9,85 - 112。
D 'Imprima, E。Floris D。Joppe, M。,年代ánchez, R., Grininger, M. & Kühlbrandt, W. (2019).eLife,8,e42747。
格兰特,T。,Rohou, A. & Grigorieff, N. (2018).eLife,7,e35383。
金,p . T。,高贵的,a·J。程,。& Bepler, T. (2023).IUCrJ,10,90 - 102。
Kuhlbrandt, w (2014)。科学,343年,1443 - 1444。
李,Y。,Fan, Q., Cohn, J., Demers, V., Lee, J. Y., Yip, L., Cianfrocco, M. A. & Vos, S. M. (2022).bioRxiv,2022.06.17.496614。
Mastronarde, d . n . (2005)。j . Struct。医学杂志。152年,36-51。麦克马伦,G。,Faruqi, A. R. & Henderson, R. (2016).Enzymol方法。579年,1卷。
高贵的,a·J。,D和ey, V. P., Wei, H., Brasch, J., Chase, J., Acharya, P., Tan, Y. Z., Zhang, Z., Kim, L. Y., Scapin, G., Rapp, M., Eng, E. T., Rice, W. J., Cheng, A., Negro, C. J., Shapiro, L., Kwong, P. D., Jeruzalmi, D., des Georges, A., Potter, C. S. & Carragher, B. (2018).eLife,7,e34257。
诺加利斯,大肠(2016)。Nat方法。,1324 - 27日。
Passmore、洛杉矶和罗威c . j . (2016)。方法Enzymol。579年,51 - 86。
Punjani,。,Rubinstein, J. L., Fleet, D. J. & Brubaker, M. A. (2017).Nat方法。,14,290 - 296。
Ronneberger, O。,Fischer, P. & Brox, T. (2015).arXiv,150504597。
谢尔,s·h·w·(2012)。j . Struct。医学杂志。180年,519 - 530。
Sigworth, f . j . (2016)。显微镜(Oxf)。65年57 - 67。
Tegunov d &克莱默,p (2019)。Nat方法。,16,1146 - 1152。
汤普森,r F。,Iadanza, M. G., Hesketh, E. L., Rawson, S. & Ranson, N. A. (2019).Protoc Nat。14,100 - 118。
韦森伯G。,Henderikx, R. J. M. & Peters, P. J. (2021).Nat方法。,18,463 - 471。
这篇文章最初发表在IUCrJ(2023)。10,4 -5。