模型破坏了规则,基因开关
多年来,科学家们一直在努力破译遗传说明书细节,当20000个基因在人类细胞将被开启或关闭。在每个细胞类型在不同的时间不同的基因操作,这最终精心编排是区分一个大脑细胞肝脏或皮肤细胞。
现在,圣路易斯华盛顿大学医学院的科学家们报告说,他们已经开发出一种模型,在酵母基因表达,预测精确度高的基因是否会被开启或关闭。这项研究现在可以在大自然的推进在线出版。
“一个巨大的魔法生物的一部分发生在细胞的水平决定是否它将转录的基因,”资深作者巴拉克·科恩说,博士,遗传学助理教授。“我们已经发现,只是几个简单的规则可能构成复杂的基因表达模式,确定一个特定基因是否表达在一个组织高水平和低水平在另一个组织。”
自从发现了DNA的双螺旋结构超过半个世纪前,科学家们曾把工作的重心大部分注意力集中在理解2%的基因组是由经典的基因,这对蛋白质的生产代码。
然而,说明打开或关闭这些基因通常不是在基因本身。相反,它们是埋在98%的基因组,曾经抛弃多基因“垃圾”。
“从理论上讲,我们应该能够阅读这些说明,“科恩解释说。“细胞可以看一段DNA,知道在哪里及什么时候来表达一个特定的基因。但是我们看着的基本问题开始前提,科学家不能这么做。”
研究人员已经知道了一段时间,控制基因表达的指令躺在短的DNA序列,称为启动子,嵌入在长,大多数基因的DNA的散漫的延伸。蛋白质被称为转录因子与启动子激活特定基因或关闭其活动。
但在现实中,一个基因的规定要复杂的多。每一个启动子可以同时绑定一个转录因子,其中一些工作启动基因的活动和其他人将其关闭。
此外,结合位点在启动子区域容忍DNA碱基替换,所以同样的转录因子可以用稍微不同的亲和力结合,根据启动子的基因序列。转录因子结合创建一个净影响基因活性远远大于或小于预期,使得它极难量化对基因的影响。
科恩和他的同事们开发模型可以归结为几个简单的规则转录因子与DNA的相互作用,并相互比较。模型只考虑如何紧密结合DNA转录因子蛋白启动子区域和转录因子结合紧密。这些简单的规则可以解释大部分的不同启动子之间的基因表达的变化。
然后他们创造了2800个简单人工启动子,问这些规则都能充分理解这些启动子的活性。”,因为如果我们不能归结和理解这些复杂交互简单人工启动子,还有没有希望理解真正的推动者,”科恩说。
科学家们构建促进剂,由三个或四个转录因子结合位点的随机组合,或构建块,使用共有18个不同的构建块。然后记录每一个启动子的DNA序列,以及其相应的基因表达。通过把复杂的数学公式和统计分析,他们最终可能预测,给定一个特定的启动子序列,是否激活或抑制基因活性。
团队决定,65%的复杂的基因表达的变化从一个细胞到另一个可以解释的简单规则集中在转录因子的结合亲和力。
当研究人员测试他们的模型在酵母的基因组真正的推动者,他们证实,它可以准确地预测转录因子的结合位点Mig1抑制了基因表达。模型识别所有40个基因已知被Mig1监管。但此外,通过将信息从弱结合位点,其他模型没有考虑,他们之前也发现了8个基因不受Mig1。
”,我们的模型可以包含信息从弱结合位点是非常重要的,因为非常微妙的相互作用可以影响基因表达的启动子区域,”科恩说。“没有其他模型已经能够占到这些微妙的相互作用。”
一些科学家提出,生化过程,包括酶促反应,比亲和力更重要,但科恩纠纷断言说,他的模型。
尽管科恩仍然是完善模型,他说这可能最终使科学家能够确定何时何地都表达的基因在人类基因组中会通过看在启动子区域的基因代码。