DNA将成为世界上最小的硬盘
阅读时间:
世界正在产生比以往任何时候都多的数据。国际数据公司预测全球数据存储需求将从2020年的33泽字节增加到2025年的175泽字节——这一数字远远超过了中国的存储能力目前可用的方法。这个不断增长的数字,再加上维护和传输数据的成本和能源需求,需要新的解决方案。
使用DNA作为一种存储数据的方法的前景已经被考虑自1950年代。“DNA是一种分子,储存了创造我们人类所需的所有指令。这是大量的信息,我们身体的每个细胞都有所有这些信息的副本。Keith EJ Tyo博士他是西北大学合成生物学中心的化学与生物工程副教授。
细胞vs电脑
在生物细胞中,DNA由四种核酸碱基组成,腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C),它们以不同的组合组合在一起形成基因。基因是转录和翻译变成蛋白质,我们细胞的功能“主力”。在计算机中,信息以二进制数字或“位”的形式存储,即1和0。当这些位以特定顺序读取时,它们可以用作指令程序运行的代码。基于DNA的数据存储的总体目标是对合成的DNA链之间的二进制数据进行编码和解码。虽然该领域拥有巨大的潜力,但目前存在的缺陷体外DNA的合成限制了它的大规模应用。Tyo解释说:“与固态硬盘等其他存储技术相比,最先进的DNA化学合成技术价格昂贵。”
Tyo和西北大学的同事开发了一种小说在体外方法将信息记录到依赖酶系统的DNA中。该方法,使用TdT对本地环境信号进行时间敏感的无模板记录,或称TURTLES,发表在美国化学学会杂志 。
“我们已经研究了一段时间将DNA改造成存储介质。在很长一段时间里,我们研究了最常见的复制DNA的DNA聚合酶。我们意识到,这种类型的复制聚合酶可以暂停相对较长的时间,这将是不可接受的数据存储。相反,我们开始研究非复制DNA聚合酶,并找到了一种具有完全正确属性的酶。”他说。
用DNA记录环境
DNA聚合酶,称为末端脱氧核苷酸转移酶或TdT,将核苷酸碱基添加到单链DNA的3'端。它的选择性取决于细胞的生理条件和环境。Tyo解释道:额外的链接被依次添加到[DNA链]的一端。当一种化学物质——例如钴——存在时,被添加的DNA倾向于含有更多的a和更少的g。当钴是不现在,情况正好相反。因此,当我们允许钴存在时添加链接,我们记录一个1,当钴不存在时记录一个0。”当DNA随后被读取以解码信息时,如果一个区域存在大量a碱基,则将其记录为1。如果有很多G基,则记为0。这样,随着环境的变化,被合成的DNA链的组成也会发生变化。核苷酸掺入的平均速率也可以用作“时间戳”,以准确地指出环境变化发生的时间。“我们设计TdT在生理相关浓度的钙存在时变构关闭。我们使用该工程TdT与参考TdT一起开发了一个双聚合酶系统,能够记录Ca的单步变化2 +在60分钟的时间内,信号到一分钟之内,”作者在论文中写道。
当被问及这种方法与化学合成DNA的速度相比如何时,Tyo说:“化学DNA合成的工作原理是将DNA拴在一个表面上,需要依次添加化学物质,然后在添加下一种化学物质之前将它们冲洗掉。这一洗涤步骤使速度变慢。我们的方法不需要清洗步骤,相反,所有用于DNA合成的试剂都留在混合物中,DNA聚合酶的性质被可逆地调节。”
呼吁创新与合作
这项研究是一个原理证明,该团队能够在一小时内报告多达3/8字节的信息。Tyo说:“一张数字图片有数百万字节,读取和写入硬盘只需要不到一秒的时间。数百万条DNA链的并行化将允许更多更快的数据存储,但我们将解决技术障碍,以增加字节数,缩短一条DNA链的记录时间。”
“这是一个非常令人兴奋的概念证明,有一天我们可以同时研究数百万个细胞之间的相互作用。我不认为之前有任何报道的直接酶调制记录系统。” 说 Namita Bhan 他曾是Tyo实验室的博士后研究员。
Tyo和他的同事们希望全球其他研究团队能够为这项技术做出贡献,以使其成为可行的商业化概念。他总结道:“谁知道呢,也许如果他们找到了真正好的东西,他们可以给我们写信,解释他们在DNA链上做了什么!”
Keith EJ Tyo采访了科技网络的科学作家Molly Campbell。188金宝搏备用
参考: 张志强,张志强,等。使用酶DNA合成记录时间信号,分辨率为分钟。美国化学学会。2021; 143(40): 16630 - 16640。doi:10.1021 / jacs.1c07331。
广告