最大限度地提高药物发现与机器学习的成功
管道新药并不简单。同时一些估计只有5 - 10%的药物项目使其批准可能会真正的虚报率,成功还远未得到保证。保证是一个复合的庞大的时间和成本从发现到治疗。作为回应,它们都太了解,寻求利用的可能是他们最大的资源——数据。
利用分子数据试验开始之前意味着更好的选择目标化合物和更快的开发过程。但是数据不仅仅是一种工具,它是一种商品,一个非常有价值的。我们如何鼓励自由企业共享数据资产?
提供了一个潜在的解决方案机器学习分类编排的药物发现(MELLODDY)。这一创新药物行动(IMI)资助的财团希望利用区块链架构来保证shareability医药数据和安全。更重要的是,它已经有10个主要制药公司的支持。我们和Hugo Ceulemans MELLODDY项目负责人和科学主任,发现数据科学杨森制药公司和马蒂厄Galtier,数据科学公司的项目协调员Owkin了解更多。
劳拉·兰斯顿(LL):什么是“MELLODDY”和为什么它了吗?
雨果Ceulemans (HC):MELLODDY是一种新的创新药物行动(IMI)资助的财团的制药、欧洲技术和学术合作伙伴。MELLODDY目标是,第一次使用机器学习方法注释化学10制药公司开发一个平台的集合能够创建更精确的预测模型的化合物可以承诺在后期阶段的药物发现和开发。
MELLODDY启动加速药物发现使用机器学习来解锁的最大潜在医药数据——世界上最大的收集与已知的生物化学小分子或细胞活动,使更准确的预测模型在药物发现和提高效率。
Ruairi Mackenzie (RM): MELLODDY有助于提高药物发现的效率如何?
HC:我们的假设是,MELLODDY保护隐私联合机器学习平台将帮助医药财团的合作伙伴探讨较少的候选药物的整体质量更高,因此可能节约时间和成本。
噢,MELLODDY财团将使用Owkin区块链技术。你能告诉我们更多关于这项技术在药物发现和它的好处?
马修Galtier (MG):MELLODDY财团将使用一个区块链架构技术,叫做Substra,它是由Owkin。Substra是可追踪的机器学习框架编排在分布式和敏感数据。它使人们有可能部署的网络节点(在我们的例子中制药公司服务器)和编排机器学习模型的训练数据,存储在不同的节点上。它是基于分布式分类技术(Hyperledger织物)确保一个完整的可追溯性的操作发生在网络上。它允许演员合作,而不必分享他们的资产。在药物发现的情况下,这种方法适用,因为制药公司价值保密性和数据保护,因此Substra技术可以放弃所有的局限性与数据共享。
我们相信,通过结合大量的小分子数据与我们先进的机器学习技术,我们可以更好地了解分子结构和效果,生物通路和异构的结果——成为现代药物发现数据驱动方法精度的基石。
我是联合学习什么?
MG:联邦学习范式提供了一种实用的解决方案来训练大量数据预测模型,由不同的数据控制器(在我们的例子中制药公司服务器),同时保证数据完整的可见性的使用到它的控制器。数据永远不会离开它的“家”位置,因此保留隐私和安全。而数据保持锁定在每个合作伙伴的基础设施,我们的预测模型数据控制器旅行从一个到另一个训练有素的受保护的数据。联合学习使我们训练算法在数据规模,创造最准确和驱动应用程序的健壮的预测模型。
RM: MELLODDY预示着未来更多的数据处理和分析制药公司之间的合作?
HC:MELLODDY方法结合predictivity-boosting信息交换的安全性和隐私保护基础数据和敏感的模型。,独特的组合主要为制药公司合作伙伴包括前所未有的集体竞争发现的数据量。假设MELLODDY旨在直接测试是在集体数据量相当大的跳跃,直接访问任何个人的伴侣会提高的性能和适用性的域模型。确实证据的概念可能会激励和相关技术的使用使协作分析在数据从制药公司和其他利益相关者的目标将对患者安全、有效的治疗。
雨果Ceulemans和马蒂厄Galtier劳拉·伊丽莎白·兰斯顿和Ruairi J Mackenzie,科学技术网络作家。188金宝搏备用