门店工作流程:通过软件更简单的生活
有太多数据听起来像一个很好的问题。但下一代测序(上天)数据的普及带来了挑战以及遗传学家的机会。快速、准确、可靠的工作流是普通遗传学家的愿望列表的顶部,和牛津基因技术(油气痕迹)认为他们SureSeq™解释软件就是答案。我们赶上了油气痕迹的戴夫·库克讨论门店数据的挑战,以及软件如何使事情更简单。
Ruairi Mackenzie (RM):是什么让门店数据麻烦吗?
戴夫·库克(DC):主要生成的数据量和增加每一个新的或更新的音序器。所有这些数据需要组织,收集和分析。在此背景下,一个共同的阅读将150个碱基对长度。当这3000000000个碱基的基因组相比,它代表1/20,000,000人类的序列。因此,映射和组装个人读取计算费力。此外,这催生了大量数据,卷从g字节根据测序硬件。这些数据需要存储和访问,这对很多人来说可能是一个严重的问题,只会成为更大的问题。
RM:如何挥动软件使工作流程更简单遗传学家?
DC:遗传学家想要从数据结果在尽可能少的时间和尽可能的容易,和一个工作流可以启用这个。SureSeq解释这始于原始数据文件上传样本自动配对并加载到一个数据库,所以所有的分析都可以跟踪。一旦样品可用的用户可以选择一个工作流遵循分析。一个正常的工作流程将包括:
- 原始数据的对齐参考基因组
- QC样品的分析个体和一批水平。
- SNVs变异检测,基因拷贝数异变、易位和其他结构性的变化
- 注释的变异支持信息
- 结果保存在一个数据库中
- 表示结果的报告
作为一个整体工作流允许用户加载原始数据文件,然后等待结果,而不需要任何交互分析管道在工作流完成之前。这意味着他们会有更多的时间专注于他们的结果而减少对生物资源的需求。此外,一个自动化的工作流有助于缓解处理门店数据上面讨论的负担。
RM:门店项目不断发展与门店工作流程;SureSeq灵活吗?
DC:非常。SureSeq由两部分;分析管道和用户界面。都是模块化的,这意味着它是可以插入新组件在不影响整体方案。分析管道已经打包在一个容器,包含所有需要处理捷数据文件。使用一个容器确保管道将不考虑硬件基础设施一致地工作。此外,任何对管道的更新都会生成一个新的容器,可以取代现有的容器。同样,包含用户界面开发的一个插件框架。这提供了一种方法来实现个人定制用户的需求。例如,如果一个特定格式的报告是必需的,那么可以创建一个模板插件并提供给用户。 The SureSeq Interpret user interface provides a means to load such plug-ins and once loaded the additional functionality will be available.
RM: SureSeq与厂商无关的,或者专门为油气痕迹基因面板吗?
DC:SureSeq目前从油气痕迹基因面板配置为运行数据。FASTQ文件生成与SureSeq non-OGT面板可以分析解释但是能够上传non-OGT面板的床上文件是不可能的。
RM:我们如何才能走向标准化,高质量的门店数据,最终将被要求实现的临床潜力门店数据?
DC:我不认为有一个简单的答案。然而,有两个部分;首先,实验室流程和计算分析。样本转换成一个序列是一个高度技术性的多步骤的过程错误合并的可能性是一个固有的危险。任何此类错误将通过分析阶段更难检测任何真正的变体。高质量总会依赖确保这两个尽可能准确的错误降到最低和最大变异检测。
戴夫•库克说Ruairi J Mackenzie科学作家技术网络188金宝搏备用