转录组的“阴暗面”
映射的一种新的方式“转录组”——RNA家里的集合所表达的细胞的活跃的基因,研究人员设计出了佩雷尔曼医学院的宾夕法尼亚大学。RNA分子DNA之间的桥梁和执行功能的蛋白质的生产生活和蛋白质分子工具箱,共同帮助那些做他们的工作。因此,RNA中存在多种形式,每一个都有特定的作用和目的,但并不是所有的完全理解。
使用新的方法来揭示RNA的作用更多的细胞,研究小组发现了RNA变体在哺乳动物中,很大程度上是无形的先前技术。研究人员还表明,这些“黑暗”变化在哺乳动物细胞RNA是非常常见的,可能有角色在组织的基因调控,发展,在人类的疾病。小组计划执行分析使用免费软件来审问异常细胞在神经退行性疾病,癌症和其他疾病。
”对我们来说是非常令人兴奋的,我认为研究社区一般来说,在其他的原因,因为我们现在可以通过大量的现有的转录组数据,知道新的和重要的事情会出现,”约瑟夫Barash资深作者说,博士,遗传学助理教授。Barash也是一个宾夕法尼亚大学生物医学信息学研究所高级研究员。
一个不完整的图片
Barash的实验室主要致力于研究RNA转录及其变化,通过机器学习和计算机建模。变化的主要机制之一,称为可变剪接,自1970年代以来科学家一直是个众所周知的问题。当一个蛋白质编码基因转录成RNA,细胞机械片新鲜的RNA转录成段。然后丢弃non-protein-coding段(内含子)和拼接起来蛋白质编码段(外显子)完成了信使rna的转录,这是后来翻译成蛋白质。
有时候,根据情况在细胞中,拼接机械故意省略了一个或多个外显子剪接,结果是一个更短的信使rna转录,进而为不同形式的蛋白质编码。通过这种方式,一个基因可能为多种形式的代码相同的蛋白质,每一种都有其独特的生物学作用,例如工作只有在一组细胞类型或只在胎儿发育。拼接模式偏离正常的被认为是导致许多疾病。
生物学家的一个长期存在的问题是,他们不容易,错误的方法识别和量化样本中的所有不同的信使rna拼接变异。现代RNA-sequencing技术(RNA-seq)是一个强大的科学工具,但大多收益率序列的信使rna的碎片。那些片段序列本质上必须缝在一起,借助先进的软件和现有RNA数据库,得到一个完整的转录组。但不一定是一个完整的图片。
“读取从RNA-seq稀疏短也比较实际的信使rna转录本,所以你直接不知道这些读取来自成绩单,”Barash说。“因此你也直接不知道丰富的记录。”
转录组的一个新视图
Barash所设计的新方法和他的团队开始于他们所谓的当地拼接变化的映射(低速)带可变外显子之间的连接,也可以跨多个外显子序列。
“这些地方的拼接机械细胞使选择哪些外显子拼接到另一个地方,”Barash说。
团队开发的软件从RNA-seq生成LSV地图数据并将这些数据与现有RNA数据库产生,包括普通照片,已知的剪接变体,以及复杂的剪接变体,其他方法无法检测。
测量的重要性前所未有的转录组的一部分,该团队使用新的MAJIQ软件(建模替代结包含量化)分析RNA-seq数据从各种各样的物种包括蜥蜴、老鼠和人类。分析表明,复杂的拼接变异比以前thought-comprising更为常见,例如,大约37%的转录组变化在人类样本。
“这些变化是有点像月亮的黑暗面,”Barash说。“他们知道存在,但我们缺少一束光照耀在他们的能力——现在他们占三分之一的人类信使rna的变化。”
复杂的剪接变体发现MAJIQ包含高度保守的,但从基因Ptbp1以前未报告的变体,这是适当的大脑发育的关键。进一步分析表明,新发现的变异参与控制的表达后Ptbp1 birthby引入“毒药外显子”,这标志着成绩单去后续退化。
MAJIQ的另一个复杂的变异检测,从人类,synapse-related基因CAMK2D,原来是表示从老年痴呆症患者脑组织低大约40%,而控制。团队后来发现类似的下降,大RNA-seq数据集,也来自阿尔茨海默氏症病例。总的来说,改变了拼接的团队发现大约200例老年患者在两个独立的可再生的研究。
“我们认为,发现像那些只是冰山的一角,”苏珊说。他和他的同事们现在打算做进一步MAJIQ-based调查复杂的拼接变体在其他障碍。然而,Barash强调MAJIQ软件包将会免费提供其他学术研究者,谁都能以自己的方式使用它。除了MAJIQ,团队也产生了一个互补的软件包,瞧,这使研究人员能够可视化复杂的拼接变异MAJIQ探测到。