深度学习表明遗传图案进行“音乐的生活”
阅读时间:
我们的基因编码控制不仅蛋白质细胞产生,但也-在很大程度上量。这个突破性的发现,适用于所有生物生命,最近由系统在查尔姆斯理工大学的生物学家,瑞典,使用超级计算机和人工智能。他们的研究,可以揭示癌症的奥秘,最近发表在《科学》杂志上自然通讯。
DNA分子包含细胞生产各种蛋白质的指令。这是已知自上世纪中期双螺旋结构被确定为生命的信息载体。
但直到现在,什么因素决定了某一蛋白质的数量生产一直不清楚。测量表明,单个细胞可以从几个分子包含任何给定的蛋白质,成千上万。
在这项新的研究中,我们对背后的机制的了解这一过程,称为基因表达,已经跨出了一大步前进。查尔默斯的科学家小组已经表明,大部分的信息数量监管也是DNA嵌入代码本身。他们已经证明,此信息可以阅读借助超级计算机和人工智能。
相当于一个管弦乐得分
助理教授Aleksej Zelezniak,查尔默斯的生物学和生物工程系,导致后面的研究小组的发现。
“你可以比较这一场交响乐得分。的笔记描述音高不同的仪器应发挥。但notes就不要说太多关于音乐的声音,”他解释说。
音乐的节奏和动态的信息也是必需的,例如。相反的书面指示等快板或的强项在连接符号,遗传学的语言传播这个信息在大面积的DNA分子。“以前,我们可以阅读笔记,但不应该如何演奏音乐。现在我们能做的,”国家Aleksej Zelezniak。
“另一个比较可能是,现在我们发现遗传语言的语法规则,也许之前我们只知道词汇的地方。”
这是什么语法,这决定了基因表达的数量吗?根据Aleksej Zelezniak,需要重复模式的形式和组合的四个“笔记”的遗传学——分子构建模块指定为C、G和t .这些模式和组合被称为“主题”。
关键因素是这些主题之间的关系——他们重复次数和在哪些位置的DNA代码出现。
“我们发现,这些信息是分布在编码和非编码DNA——这意味着,它也出现在地区曾经是被称为“垃圾DNA”。”
这一发现适用于所有生物的生命
虽然有其他因素也会影响细胞的基因表达,根据查尔莫斯研究者的研究中,嵌入在遗传密码的信息约占80%的过程。
研究人员测试了七种不同的生物模型的方法——从酵母和细菌果蝇,老鼠和人类——和发现机制是相同的。发现他们是普遍的、有效的对所有生物的生命。
根据Aleksej Zelezniak,发现不可能没有最先进的超级计算机和人工智能。研究小组进行了巨大的计算机模拟在查尔姆斯理工大学的在瑞典和其他设施。
“这个工具允许我们看到成千上万的职位同时,创造了一种自动检测的DNA。这是必不可少的能够识别模式从这些大量的数据。”
博士后研究员Jan Zrimec查尔默斯集团和第一作者的研究,同意,说:
“与以前的技术,研究人员必须告诉系统在DNA代码搜索主题。但由于人工智能,系统现在可以自己学习,识别不同的图案和图案组合相关基因的表达。”
他补充说,这一发现也由于他们研究更大的DNA的一部分在一个比以前。
快了制药行业的价值
Aleksej Zelezniak认为,这一发现将产生极大的兴趣在研究世界,这方法可能成为一个重要的工具在几个研究领域——遗传学与进化的研究中,系统生物学,医学,生物技术。
新知识也能够更好地了解突变会影响基因表达的细胞,因此,最终,癌症是如何产生和功能。的应用程序可能最快是重要的公众在制药行业。
“可想而知,这种方法可以帮助提高的转基因微生物今天已经使用“生物工厂”——导致更快和更便宜的新药的开发和生产,”他推测。
参考:Zrimec J, Borlin CS, Buric F, et al .深度学习表明基因表达在互动共赢基因编码的监管结构。Nat Commun。2020;11 (1):6141。doi: 10.1038 / s41467 - 020 - 19921 - 4。
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。
广告