更精确的计算工具读RNA序列发展
从基因到蛋白质,可以切割和加入新生的RNA分子,或拼接,以不同的方式在被翻译成蛋白质。这一过程,称为可变剪接,允许单个基因编码不同的蛋白质。可变剪接发生在许多生物过程,当干细胞成熟的组织细胞。的疾病,然而,可以提供可变剪接。因此,重要的是要检查转录组——也就是说,所有的RNA分子,可能源于基因——理解条件的根源。
然而,历史上它已经很难“读”RNA分子全部,因为他们通常是成千上万的基地。相反,研究人员依靠所谓的短内容RNA序列,它打破了RNA分子和序列在更短,介于200到600基地,根据平台和协议。然后使用计算机程序重构RNA分子的完整序列。短内容RNA序列可以高度精确测序数据,每个基站错误率低约0.1%(即一个基地是每个1000碱基测序错误的决定)。然而,有限的信息,它可以提供由于短序列读取的长度。在许多方面,短内容RNA序列就像打破了大图片成许多拼图块都是一样的形状和大小,然后试图把图片重新拼凑起来。
想要更多的最新消息?
订阅188金宝搏备用的日常通讯,提供每天打破科学消息直接发送到您的收件箱中。
免费订阅最近,“读”平台可以RNA分子长度超过10000个碱基序列的端到端可用。这些平台不需要分解之前RNA分子测序,但他们有一个更高的每个基站错误率,通常在5%到20%之间。这个著名的限制已严重阻碍了读核糖核酸测序技术的广泛应用。特别是高错误率使得它很难确定小说的有效性,未知的RNA分子在特定的条件或发现疾病。
绕过这个问题,费城儿童医院的研究人员(切)开发了一种新的计算工具,可以更准确地发现并量化这些容易出错的读RNA RNA分子测序数据。工具,叫做咖啡(拼接误差统计提升评估者网站选项),据报道科学的进步。
“读RNA序列是一个功能强大的技术,将使我们能够发现RNA罕见遗传疾病和其他条件的变化,如癌症,“兴说,博士计算与基因组医学中心主任剁碎,这项研究的资深作者。“我们可能是一个转折点在我们如何发现和分析RNA分子。从短内容过渡到读RNA序列代表一个令人兴奋的技术改造,和计算工具,可靠地解释读RNA序列数据是急需的。”
咖啡可以准确地发现和量化不同的RNA分子相同的基因——被称为RNA亚型独自使用容易出错的读RNA序列数据。,计算工具比较所有长给定基因的RNA序列读取相应的基因组DNA,然后自信地使用个人长时间的误差模式读取识别接头连接——新兴的RNA分子的地方已经切割和加入,以及相应的完整的RNA亚型。通过区域之间的完美匹配长测序读和基因组DNA, RNA以及借贷信息在所有RNA基因测序读长,该工具能够识别高度可靠接头连接和RNA亚型,包括那些先前没有被记录在现有的数据库。
研究人员评估性能的咖啡使用模拟数据和真实数据的生物样本。目前他们发现咖啡执行比多个工具,无论是发现RNA亚型和量化。研究人员还生成和分析超过10亿测序读长RNA覆盖30人体组织类型和三个人类细胞系,为研究提供有用的资源解决人类转录组变化完整的RNA亚型。
“咖啡地址读RNA序列和一个长期问题的发现将迎来新的机遇,“邢博士说。“我们设想,咖啡将是一个有用的工具,研究人员探索细胞的RNA曲目在各种生物医学和临床设置。”
参考:高Y,小王,小王R, et al。咖啡:健壮的发现和量化转录亚型的容易出错的读RNA-seq数据。Sci副词。2023;9 (3):eabq5072。doi:10.1126 / sciadv.abq5072
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。