佐治亚理工学院开发的计算算法
然而,真正的革命即将到来的新兴廉价地能力和准确的整个基因组序列的癌症,允许特定突变的识别负责个别病人的疾病。
只有一个缺点。的测序技术提供大量的数据不容易处理和翻译的科学家。这就是为什么佐治亚理工学院创造了一个新的数据快速分析算法,将复杂的RNA序列数据转换成有用的生物学家和临床医生的内容。RNA-Seq分析管道(R-SAP)是由学院生物学教授约翰·麦克唐纳和博士生物信息学候选人Vinay米塔尔。管道的细节发表在《核酸的研究。
”的一个主要瓶颈实现个性化医疗的梦想不再是技术。它的计算,”麦克唐纳说,佐治亚理工学院的主任新创建的综合癌症研究中心。“R-SAP遵循分层决策过程来准确地描述各种类基因转录的癌症样本。”
至少有23000块的RNA在人类基因组中编码蛋白质的序列。数以百万计的其他帮助调节蛋白的生产。R-SAP能够快速确定每个基因的RNA表达水平和提供信息拼接变异,生物标记和嵌合RNA。生物学家和临床医生能够更容易地使用这些数据来比较RNA概要或正常细胞的转录组与个体癌症,从而更好地开发优化个人疗法。
个性化癌症医学方法已经在广泛使用几个“癌症生物标记”包括BRAC 1基因的变异,可以用来识别高的女性患乳腺癌和卵巢癌的风险。
“我们的目标是设计一个管道,很容易安装和并行处理能力,”米塔尔说。“R-SAP能使1亿只读入90分钟。运行程序同时在多个cpu可以进一步减少。”
R-SAP是开源软件,在麦当劳免费开放实验室的网站。
“这是佐治亚理工学院的另一个例子的能力将计算机技术与科学创造下一代生物信息学工具的一个重要特征,”麦克唐纳说。“我们希望R-SAP将是一个有用的和用户友好的工具领域的科学家和临床医生癌症生物学。”