稀疏数据AI在制药行业的力量
人工智能正在制药行业迅速得到应用,特别是用于改进药物发现和早期临床前开发中的预测模型。在研发过程中产生的大量数据的推动下,大数据人工智能领域的这些创新项目正在催生令人兴奋的新疗法。然而,在药物开发中产生的大部分数据是有限的,导致可用数据的数量有限。为了充分利用人工智能,必须开发新的方法。
稀疏数据AI——将AI应用于有限数量的数据——正在为增强药物开发开辟新的途径。它提供了一种对复杂生物化学建模的方法,并对每个推理背后的潜在机制进行了已知的解释。通过摆脱大数据方法,制药行业内的人工智能可以以更高的透明度推进,并导致更多改变生命的药物进入市场。
从大数据到稀疏数据的进步
计算化学的主要目标之一是预测复杂有机反应的结果。这是因为经验方法既耗时又昂贵。近年来,已经开发出针对特定目标分子设计高效反应序列的模型,并已被证明具有与化学教授相同的水平1.尽管取得了这些进展,但剩下的一个挑战是理解这些模型是否能在训练数据的领域之外做出准确的预测,与大量可能的分子相比,这仍然是有限的。
大数据人工智能涉及大量数据,用于以最少的领域知识创建灵活和通用的输入/输出预测模型。这些系统是由没有先验知识的数据诱导出来的。针对大数据的深度学习此前已应用于制药行业的计算化学,包括开发预测药物分子物理化学性质的模型。
在过去的十年中,由于新的实验技术的发展,如高通量筛选和并行合成,可用的化合物活性数据的数量有了急剧增加2.人工智能被用于有效地挖掘这种大规模化学物质,以用于药物研发。人工智能的大多数应用都使用大数据;然而,在制药行业,访问大型数据集并不总是那么容易,因为许多公司更喜欢将数据保存在内部。因此,稀疏数据AI的应用为信息有限的制药数据集的利用提供了重要机会。
利用贝叶斯优化稀疏数据
大数据人工智能可以被定义为一种黑盒方法——使用未知解释的算法。这种方法是有限的,因为无法理解模型背后的潜在机制,这对于获得批准在制药行业使用是至关重要的。相比之下,稀疏数据AI是一种白盒方法,更适合理解因果推论。提高稀疏数据AI的透明度非常重要;人工智能要在行业中全面实施,就需要得到信任和理解3..
此外,与大数据AI相比,稀疏数据AI直接用详细的专家知识来增强实验结果,以进行所需数量的概率预测,例如给定分子在特定条件下的行为。专家知识的提取模仿了对被建模现象的相同理解,这允许产生预测。增强的目标是特定的,而不是通用的,具有透明和可理解的预测机制的模型。
稀疏数据AI的一个基本组成部分是贝叶斯优化的使用,它利用概率来开发一种基于顺序模型的方法来解决问题。贝叶斯优化提供了有效解决探索与开发困境的方法——找到一种方法,既可以从本地数据空间内的搜索中受益,也可以从那些冒险进入未知空间的搜索中受益4.它可以用于搜索具有许多未知的最佳过程或模型,通常不会有一个简单的解析表达式。贝叶斯优化在探索和开发之间取得平衡,使用未知的概率替代模型快速找到和定义解决方案的确定性。它使学习更接近于人类水平,只需要一个或两个例子就可以得到更好的概括5.
稀疏数据AI和增强的纳米颗粒生产
稀疏数据人工智能正被用于加强药物开发,特别是用于改善溶解度和生物利用度特征——这是提高制药管道损耗率的关键目标。纳米化可以通过减小颗粒大小从而提高溶解速率来帮助药物化合物充分发挥其治疗潜力。稀疏数据AI正被应用于粒子工程技术,以帮助从有限的数据中定义候选药物的物理特征,并了解这些参数如何影响溶解度和生物利用度。这项工作将能够预测新的候选药物的纳米化成功,并将为药物开发创造一个更有效的粒子工程过程。
该项目包括构建该技术的数字版本,使科学家能够在硅中进行大量实验。稀疏数据AI将基于现有的体内和体外实验数据建立数字版本,以指导对其他实验的优化搜索,以学习模型参数设置。这项技术可以显著提高识别成功化合物的可能性,从而快速进入临床试验。它还可以用来重新分析分子,并确定它们是否可以被设计用于不同的治疗应用。虽然许多公司正在将AI应用于药物的智能设计,但稀疏数据领域最令人兴奋的未来工作将探索如何利用AI和粒子工程来寻找解决方案,以解决行业中最困难的药物开发和交付挑战。这包括生产能够穿透血脑屏障和深肺的药物。
展望未来
人工智能有可能通过分析大量信息和增强人类专家的能力,积极改变制药业。为了实现这一承诺,我们必须为复杂的问题选择正确的解决方案。稀疏数据AI的应用正在创造一个新的技术时代,一个基于透明和可理解模型的时代。一旦赢得对该技术的信任,人工智能在药物发现和开发方面的应用将大大扩大,使患者能够迅速受益于新的和增强的药物。
参考文献
1.Jin, W.等人(2017)用Weisfeiler-Lehman网络预测有机反应结果,第31届神经信息处理系统会议(NIPS 2017)。可在线购买:https://arxiv.org/abs/1709.04555
2.Chen, H. et al.(2018)深度学习在药物发现中的兴起,《今日药物发现》,23(6),第1241-1250页。
3.硅共和国:机器学习中白盒模型的好处是什么?可在线购买:https://www.siliconrepublic.com/enterprise/white-box-machine-learning
4.Shahriari, B.等人(2016)将人类从循环中剔除:贝叶斯优化的回顾,IEEE论文集,104(1),第148-175页。https://ieeexplore.ieee.org/abstract/document/7352306
5.Lake, B.M.等人(2015)通过概率程序诱导的人类级别的概念学习,科学,350(6266),第1332-1338页。
作者简介
Jukka Corander是Nanoform是一家创新的纳米颗粒药物启用公司。他目前是挪威奥斯陆大学生物统计学教授和芬兰赫尔辛基大学统计学教授。Jukka的研究兴趣包括使用最先进的机器学习技术,从稀疏数据创建基于模拟的模型。他最近在英国剑桥的惠康桑格研究所(Wellcome Sanger Institute)工作,涉及统计机器学习和贝叶斯推理算法在生物数据中的应用。Jukka是该领域的世界领先专家,在主要国际期刊上发表了230多篇研究论文。