我们已经更新了隐私政策为了更清楚地说明我们如何使用您的个人资料。

我们使用cookie为您提供更好的体验。你可参阅我们的饼干的政策在这里。

广告

大数据推动药物研发的7种方式

当你以为自己已经掌握了大数据的概念时,一组全新的流行语出现了:人工智能(AI)、机器学习、深度学习、结构化和非结构化数据。但对于目前的制药行业来说,这些不仅仅是流行语,它们是生产力新时代的承诺。这是两件事的完美风暴:大数据的可用性和对其进行有意义分析的计算能力。那么,这些新工具——人工智能、算法——真的会给研发带来革命吗?还是只是炒作而不是希望?

这个列表强调了目前大数据为药物研发提供的一些方式,并显示了行业将从大数据的最新发展中获得多少。

1.发现遗漏的目标


大数据在药物研发方面最有前途的应用之一是,它能够发现以前方法可能错过的新药物靶点。像葛兰素史克(GSK)而且辉瑞已经在利用这一点,与人工智能技术提供商合作,从大量不同的生物数据中寻找新的药物靶点和策略。一些生物技术公司也在建立自己的人工智能平台,用于内部药物研发。其中包括Berg健康他们的方法是从单个患者开始,使用他们专有的机器学习算法来检查健康和患病细胞环境的分子活动。这种方法已经发现了几种治疗青光眼、脱发、癌症和神经退行性疾病的靶点和候选药物。

2.找到艾滋病病毒的致命弱点


将目标发现提升到一个全新的水平,香港的研究人员最近使用机器学习来估计gp160的适应度,1这是一种包含HIV病毒峰值的多蛋白,是HIV疫苗和基于抗体的药物的一个有吸引力的靶点。为了制造出理想的疫苗,研究小组想要针对艾滋病毒用来复制和繁殖的尖峰片段。这需要他们将多蛋白序列映射到适合度,如果没有大数据方法,这是不可能的。他们使用人工智能处理了来自1918名hiv感染者的20043个序列中的815个氨基酸残基。研究结果将确定新的免疫原和疫苗接种方法,迫使病毒变异为不适合的状态,并限制其引起感染的能力。

3.药物筛选有区别


机器学习也在药物筛选领域获得了一席之地,在药物筛选领域,更快、更高分辨率的药物反应查询方法可以揭示原本可能被遗漏的结果。这就是背后的概念递归的药物再利用平台,该平台使用“计算机视觉”从遗传疾病的人类细胞模型中提取单个细胞水平的数千个形态学指标。这种方法为罕见疾病的药物研发增添了特别的力量,目前对这些疾病的靶标生物学知之甚少或一无所知赛诺菲筛选他们的临床阶段分子新的迹象表明。2

4.挖掘文献


人工智能技术为制药行业提供了一个机会,可以更有效地开展研发的各个方面,这延伸到不起眼但重要的文献研究。BenevolentAI已经开发了一个判断相关系统(JACS),其算法可以审查数百万篇科学研究论文和摘要中的数十亿句话和段落。然后,JACS识别数据之间的直接关系,并将其调整为“已知事实”。利用科学家设定的标准,对这些已知的事实进行整理,并建立迄今尚未认识到的联系,从而产生大量可能的假设。然后,研究人员的专家团队评估这些假设的有效性,以生成一个被认为值得进一步探索的优先列表。该公司的生物医学部门将这项技术应用于肌萎缩性侧索硬化症(ALS),并优先选择了五种化合物在实验室进行测试。其中,有两种疗法在实验室中对ALS细胞的治疗效果比金标准疗法要有效得多。这些化合物目前正在进一步进行试验。3.

5.Patient-powered研究


大数据技术不仅改变了信息分析,也改变了我们收集信息的能力。LymeDisease.org最近推出了MyLymeData这是一个以患者为主导的登记系统,旨在加速慢性莱姆病的研究,慢性莱姆病是美国最常见的媒介传播传染病。4许多莱姆病患者在治疗后仍然病情严重。事实上,治疗失败率可高达35%至50%。但在过去15年里,美国国家卫生研究院资助的慢性莱姆病试验只有三次,而且它们规模太小,无法为治疗反应提供强有力的见解。他们希望通过注册从数千名患者中收集的数据能够提供必要的数字,以了解为什么有些患者对治疗有反应,而有些患者没有。

6.众包癌症药物数据


由欧洲肿瘤数据合作组织发起,CODE-cancer.com是一项计划,旨在整理7个欧洲国家200个癌症治疗中心头3年的癌症药物使用数据,并在未来10年内扩大到可能达到2000个治疗中心。该技术平台旨在汇总所有癌症、所有患者和欧洲所有希望加入的治疗中心的抗癌药物使用数据。我们的目标吗?整理全面的最新数据,描述抗癌药物的使用情况,然后利用这些数据为下一代癌症治疗提供信息。

7.用人工智能挖掘健康数据


虽然严格意义上说,这并不是药物发现,但一种新的“大的挑战在癌症方面的研究很可能为我们整合和挖掘结构化和非结构化数据的能力开创先例。这对于制药业来说尤其重要,因为他们需要分析来自不同内部和公共来源的数据。英国癌症研究中心(Cancer Research UK)将为能够找到新方法来查询医疗和非医疗数据源,从而发现可以更早发现癌症的模式的研究人员提供3000万美元的资助。这一挑战将需要整理来自医疗记录的匿名数据集,并将其与来自在线和社交活动的匿名数据结合起来,然后开发新的工具和算法来发现模式,这些模式可以随着数据源的变化而优化。如果成功,团队将回答一些最困难、道德上最复杂的大数据问题——如果我们能找到使用个人医疗数据的方法,谁会使用它?以及如何?


与作者见面
乔安娜·欧文斯博士
乔安娜·欧文斯博士
广告
Baidu