对疾病的DNA遗传算法细节的链接
基因组是身体的说明书。它包含原始信息- DNA的形式决定从一个动物是否走在两个四条腿,一个疾病的潜在风险。但本手册是用生物学的语言编写的,因此所有的感觉,它编码已被证明具有挑战性。现在,哥伦比亚大学的研究人员已经开发出一种计算工具,揭示了基因组的最hard-to-translate段。使用此工具,科学家可以接近理解DNA指南从生长和发育到衰老和疾病。
研究人员最近发表了他们的研究结果在美国国家科学院院刊》上。
“即使简单的生物如果蝇的基因组包含价值1.2亿的信件的DNA,其中许多尚未解码由于其提供的线索太微妙的现有工具拾取,”理查德·曼说,博士,哥伦比亚大学首席研究员的心理大脑行为研究所和莫蒂默·扎科曼的资深作者。“但我们的新算法让我们席卷这些数百万行遗传密码,甚至拿起微弱的信号,导致一个更完整的DNA编码。”
遗传学家一直寻找破译神秘隐藏在DNA的方法。这样一个神秘的涉及到一个特别普遍的类称为Hox基因的基因。
“Hox基因是人体的主建筑师;他们驾驶的一些生长和分化的最早、最重要的方面,如在胚胎发育过程中头部和四肢应该定位,”曼博士说,他也是希金斯教授生物化学和分子生物物理学(在系统生物学)欧文在哥伦比亚大学医学中心。“Hox基因通过产生蛋白质被称为转录因子,它绑定到DNA序列,以打开或关闭大群基因;像成千上万的开关以正确的顺序。”
但数十年的Hox基因的研究发现了一个悖论:尽管每个Hox基因引导经济增长的不同特性,Hox转录因子都绑定强烈和明显相同的DNA序列很容易地辨认出。
2015年,曼博士和他的团队发现Hox转录因子也绑定在其他地点,只是更多的离散在所谓的“低亲和力的网站。科学家们认为这些低亲和力Hox转录因子结合位点是关键能够驱动开发与另一个的一个方面。这个问题仍然是如何从基因组破译这些网站。
应对这一挑战,曼博士和他的实验室与实验室的Harmen Bussemaker,博士,哥伦比亚大学教授生物科学部门和系统生物学和专家建立计算模型的基因活动。
几年前,两个实验室开发了一个基因测序方法称为SELEX-seq系统地描述所有Hox结合位点。但他们的方法仍有局限性:它要求相同的DNA片段测序一遍又一遍。随着每一个新的,更多的拼图的碎片被发现,但这些关键信息低亲和力结合位点仍然隐藏。
“这是类似于通过谷歌翻译多次运行相同的段落,但最终仍然只有百分之十的准确翻译,”曼博士说。
为了克服这一挑战,Bussemaker博士和他的团队开发了一种先进的新型计算机算法,能够解释——第一次——SELEX-seq所有DNA序列的行为实验。他们称这种算法没有读留下,或者NRLB。
“简而言之,NRLB允许我们覆盖整个光谱的结合位点,从最高到最低的亲和力,更大程度的灵敏度和精度比现有的方法,包括最先进的深度学习算法”Bussemaker博士说,他是该论文的其他高级作者。“在这个基础上,我们现在希望开发出更深入的生物学和计算模型来帮助回答关于基因组最复杂的问题。”
“例如,疾病,如精神分裂症、帕金森病和自闭症被映射到特定的DNA区域,似乎没有一个明确的功能,”曼博士说。“NRLB,科学家可能拼凑转录因子结合并激活这些地区。这将是设法操纵的关键,活动一天减少疾病的风险。”
这篇文章被转载材料所提供的哥伦比亚大学。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。
参考:Rastogi C。土包子,h·T。Kribelbauer, j·F。克罗克,J。物料间,r E。马提尼,g D。h . j .,…Bussemaker (2018)。准确和敏感的量化protein-DNA绑定关联。美国国家科学院院刊》上,201714376。https://doi.org/10.1073/pnas.1714376115