科学家绘制心脏基因调控元件图
阅读时间:
科学家们设计了一种新的计算模型,可以用来揭示负责人类心脏发育和维持其功能的遗传调节元件。
虽然研究小组的研究重点是心脏,但他们开发的计算方法广泛适用于其他组织,并成功地用于识别四肢和大脑细胞的调节元件。编目这些调控序列可以提高对疾病的认识,并为改进医疗奠定基础。
这项研究由美国国立卫生研究院国家生物技术信息中心(NCBI)和芝加哥大学的科学家进行,发表在2010年3月的《基因组研究》杂志上,并可在网上查阅。
人体的所有细胞都拥有相同的46条染色体和约23000个基因,但只有这些基因的特定子集会在单个器官和组织中被激活。心脏和其他组织中的细胞通过调节元件在不同细胞和生命周期的不同时间点开启和关闭基因,调节元件是控制基因表达的DNA片段,分布在人类基因组的30亿个碱基序列中。
计算模型是一种工具,可以检测大量DNA片段中的这些开关。它提供了对器官发育和维持的遗传蓝图的一瞥,并可能为研究人员研究疾病提供新的目标。
这项研究的作者之一、芝加哥大学人类遗传学助理教授马塞洛·诺布雷加(Marcelo Nobrega)说:“这些序列简直是荒无人烟,是匿名序列海洋中的这些小东西。”“问题是:你要怎么找到这些?”
为了进行这项艰难的搜索,NCBI (NIH国家医学图书馆的一个部门)和芝加哥大学的科学家开发了一种机器学习方法来准确检测心脏调节元件的签名。机器学习方法涉及算法的使用,使计算机能够识别数据中的复杂模式,并通过自动适应实验数据的计算方法来提高识别的准确性。
NCBI的科学家们首先分析了已知的心脏调控元件的DNA片段,并确定了这些调控元件中常见的短DNA片段或基序的组合。“然后,我们扫描了人类基因组的整个序列,以寻找其他类似motif组合的实例,以找到能够准确预测心脏调节活动的遗传特征,”NCBI研究人员Leelavati Narlikar解释说,她将她的机器学习专业知识应用于这项研究,是该论文的主要作者。
随后,芝加哥大学的研究小组对计算机预测的调控元件进行了测试,他们将候选元件附着在绿色荧光蛋白上,并将其注射到斑马鱼卵中。研究人员可以通过斑马鱼胚胎发出的绿光证实这些元素在心脏细胞中是活跃的。
这两个研究团队经过了几个周期的训练,让计算机识别遗传密码,并在斑马鱼卵中测试新的预测,以实现最终的预测,这些预测将点亮心脏中较高比例的候选调节元件。
诺布雷加说:“如果你在基因组中随机抽取一个序列进行测试,你击中心脏增强剂的几率可能只有百分之几。”“然而,根据我们的序列列表,你有60%的机会。它好得多。”
他们发现的潜在心脏调节序列的最终统计?近42000。
美国国家心肺血液研究所(NHLBI)基础研究副主任、医学博士、博士艾伦·m·迈克尔森(Alan M. Michelson)说:“发现4万多个控制心脏相关基因活动的新DNA片段是向前迈出的重要一步,因为迄今为止的研究已经表明,许多与疾病相关的DNA变化存在于生物学功能不容易识别的基因组部分。”“这项研究为我们理解个体基因变化如何导致心脏病提供了一种全新的方法。”
“我们终于可以说,在我们的基因组中有一个定义明确的遗传密码,可以用来专门识别构成人类基因组的巨大序列中的心脏调节元件,”NCBI团队的负责人伊万·奥夫查连科(Ivan Ovcharenko)说,他是这篇论文的合著者。“随着计算方法的进步,我们可以用计算机破解这个密码,了解它的加密,并了解心脏细胞接收到的调节基因的信号。”
这种新型分类器是由博士们开发的。加州大学旧金山分校心血管研究所教授兼副主任布莱恩·布莱克说:“Nobrega和Ovcharenko以及他们的同事将为科学家们提供一个重要的新工具,以解开控制心脏形成的复杂监管代码。”
芝加哥大学的这项研究是由NHLBI和NIH国家人类基因组研究所共同资助的。
虽然研究小组的研究重点是心脏,但他们开发的计算方法广泛适用于其他组织,并成功地用于识别四肢和大脑细胞的调节元件。编目这些调控序列可以提高对疾病的认识,并为改进医疗奠定基础。
这项研究由美国国立卫生研究院国家生物技术信息中心(NCBI)和芝加哥大学的科学家进行,发表在2010年3月的《基因组研究》杂志上,并可在网上查阅。
人体的所有细胞都拥有相同的46条染色体和约23000个基因,但只有这些基因的特定子集会在单个器官和组织中被激活。心脏和其他组织中的细胞通过调节元件在不同细胞和生命周期的不同时间点开启和关闭基因,调节元件是控制基因表达的DNA片段,分布在人类基因组的30亿个碱基序列中。
计算模型是一种工具,可以检测大量DNA片段中的这些开关。它提供了对器官发育和维持的遗传蓝图的一瞥,并可能为研究人员研究疾病提供新的目标。
这项研究的作者之一、芝加哥大学人类遗传学助理教授马塞洛·诺布雷加(Marcelo Nobrega)说:“这些序列简直是荒无人烟,是匿名序列海洋中的这些小东西。”“问题是:你要怎么找到这些?”
为了进行这项艰难的搜索,NCBI (NIH国家医学图书馆的一个部门)和芝加哥大学的科学家开发了一种机器学习方法来准确检测心脏调节元件的签名。机器学习方法涉及算法的使用,使计算机能够识别数据中的复杂模式,并通过自动适应实验数据的计算方法来提高识别的准确性。
NCBI的科学家们首先分析了已知的心脏调控元件的DNA片段,并确定了这些调控元件中常见的短DNA片段或基序的组合。“然后,我们扫描了人类基因组的整个序列,以寻找其他类似motif组合的实例,以找到能够准确预测心脏调节活动的遗传特征,”NCBI研究人员Leelavati Narlikar解释说,她将她的机器学习专业知识应用于这项研究,是该论文的主要作者。
随后,芝加哥大学的研究小组对计算机预测的调控元件进行了测试,他们将候选元件附着在绿色荧光蛋白上,并将其注射到斑马鱼卵中。研究人员可以通过斑马鱼胚胎发出的绿光证实这些元素在心脏细胞中是活跃的。
这两个研究团队经过了几个周期的训练,让计算机识别遗传密码,并在斑马鱼卵中测试新的预测,以实现最终的预测,这些预测将点亮心脏中较高比例的候选调节元件。
诺布雷加说:“如果你在基因组中随机抽取一个序列进行测试,你击中心脏增强剂的几率可能只有百分之几。”“然而,根据我们的序列列表,你有60%的机会。它好得多。”
他们发现的潜在心脏调节序列的最终统计?近42000。
美国国家心肺血液研究所(NHLBI)基础研究副主任、医学博士、博士艾伦·m·迈克尔森(Alan M. Michelson)说:“发现4万多个控制心脏相关基因活动的新DNA片段是向前迈出的重要一步,因为迄今为止的研究已经表明,许多与疾病相关的DNA变化存在于生物学功能不容易识别的基因组部分。”“这项研究为我们理解个体基因变化如何导致心脏病提供了一种全新的方法。”
“我们终于可以说,在我们的基因组中有一个定义明确的遗传密码,可以用来专门识别构成人类基因组的巨大序列中的心脏调节元件,”NCBI团队的负责人伊万·奥夫查连科(Ivan Ovcharenko)说,他是这篇论文的合著者。“随着计算方法的进步,我们可以用计算机破解这个密码,了解它的加密,并了解心脏细胞接收到的调节基因的信号。”
这种新型分类器是由博士们开发的。加州大学旧金山分校心血管研究所教授兼副主任布莱恩·布莱克说:“Nobrega和Ovcharenko以及他们的同事将为科学家们提供一个重要的新工具,以解开控制心脏形成的复杂监管代码。”
芝加哥大学的这项研究是由NHLBI和NIH国家人类基因组研究所共同资助的。
广告