解释“暗物质”的DNA
计算方法,称为TargetFinder,可以预测非编码DNA DNA不代码proteins-interacts基因。这项技术可以帮助研究人员连接所谓的基因突变与它们的基因影响“暗物质”,可能揭示新的治疗遗传疾病的目标。
在这项研究中研究人员观察的非编码DNA片段称为增强剂。增强子像一个基因的说明书,决定何时何地打开一个基因。基因可以通过长时间分开他们的增强剂包含许多其他基因的DNA。
“大多数基因突变与疾病相关联发生在增强剂,使他们一个非常重要的研究领域,”资深作者凯瑟琳·波拉德说,博士顿研究院高级研究员。”现在,我们难以理解增强剂找到他们行动的遥远的基因。”
科学家最初认为增强剂主要影响最近的基因。然而,新的研究表明,DNA链,增强剂可以远离它们的基因影响数以百万计的信件,跳过的基因。当一个增强器远离它的基因影响,两个连接形成一个三维的循环,就像一个弓在基因组上。
使用机器学习技术,研究人员分析了数以百计的现有数据集从六个不同的细胞基因组中寻找规律,确定一个基因和增强器进行交互。他们发现存在一些模式的循环连接增强子的基因。这种模式准确预测是否gene-enhancer交互发生85%的时间。
“值得注意的是,我们可以预测复杂的三维交互从相对简单的数据,”第一作者肖恩·瓦伦说,博士,生物统计学家格莱斯顿。“没有人看了信息存储在循环之前,我们惊奇地发现这些信息是多么的重要。”
做实验在实验室确定所有这些gene-enhancer交互可以数百万美元和多年的研究。新的计算方法是更便宜和更少的耗时的基因组中识别gene-enhancer连接的方法。这项技术还提供了洞察DNA循环如何形成以及如何同他们可能在疾病。科学家们提供了所有的代码和数据从TargetFinder免费在线。
“我们的能力来预测基因增强子的目标准确地使我们能够链接突变基因的增强子目标,”波拉德说。“有链接的第一步是使用这些连接来治疗疾病。