用高通量筛选引导药物发现
十年前,有一种说法认为,高通量筛选(HTS)是药物发现效率下降的一个因素,它扼杀了创造力和创新。1但在过去的十年中,HTS在许多新药的发现中发挥了作用,并从大型制药公司的专利转变为小型公司甚至学术机构可用的方法。如今,将使用HTS生成的大型数据集与人工智能的最新进展相结合,对药物发现工厂来说更加有利。
HTS使用自动化机器人、微流体和灵敏探测器,使研究人员能够快速执行数百万次分析,以确定通常10万个化合物的大型文库的类药物性质。马萨诸塞州剑桥市Epizyme公司铅发现执行董事Bill Janzen教授说,铅发现已经使用了近30年,但在过去5年里,使用铅的人发生了变化。Janzen说:“在人们往往忽视的领域,最大的进步是外包高通量筛查的能力。”他补充说,合同研究机构现在正在进行大量的筛选,“不需要投入大量的资本投资,这给了小公司更多的灵活性,事实上许多大公司也在采用这种方法。”
近年来,HTS的许多基本要素并没有发生重大变化,但Janzen指出:“这是一个稳定的状态,在整个行业中绝不是相同的。”可供选择的测试微孔板,有96倍的小测试孔,包括标准的384和1536板,孔容量低至3μl。英国Saffron Walden查尔斯河实验室的高通量筛选科学主任David Cronk解释说,超过这个范围的微型化受到混合试剂和防止蒸发所需体积的限制:“在可以克服这个问题之前,我们似乎已经达到了我们的极限,有人可能会说,没有必要向更低体积或更高密度发展。”
生化对比细胞分析
用于和正在开发的高通量筛选的测定方法反映了正在研究的各种生物靶标。一个主要的区别是筛查是使用生物化学还是基于细胞的检测——两者都被广泛使用。Janzen说:“如果你去任何一家公司,我想你仍然会发现有接近50%的部门。与生物化学分析相比,细胞分析通常需要更高的效力,“尽管你得到了更好的起始材料,但你会错过一些线索,”Janzen补充道。Cronk认为,今天的趋势是从细胞系统转向生物化学,但他解释说:“这可能更多地反映了对目标类别的兴趣,其中细胞检测系统尚未完全验证和采用,而不是有意识的举动。”
很大一部分化验使用基于荧光的检测方法,这种方法在每数据点成本方面具有无与伦比的灵敏度和适应性。这阻止了向新的检测系统的转变,这些系统可能不太容易受到干扰(由本质上的荧光化合物或沉淀化合物引起的散射光引起)。但发光检测已经占据了市场份额。这些都是基于生物荧光素酶,可用于不同的目标。2
Cronk说:“关键的突破是在无标签环境和高通量质谱系统的发展中,这一领域继续快速发展。”
速度是一个问题,因为质谱仪(MS)是串行检测系统,一次只能分析一个样品,每个样品都要经过微尺度固相萃取,以便在分析之前快速脱盐和纯化。最先进的系统现在能够以大约10秒的间隔注入样品3.但这项技术的应用一直受到限制。
用于筛选的化学文库现在更好,也更容易获得,“你不必在大型制药公司获得一个好的化学文库,”Janzen说。它们的使用方式也在发生变化:“在HTS的早期,关键驱动因素是筛选尽可能多的化合物,因此许多筛选集合的化学多样性和/或质量远不理想。”正在寻找的靶标类型也在扩大,历史上重要的一类,如GPCRs、离子通道或激酶变得不那么相关,人们对新的酶类和免疫肿瘤学靶标更感兴趣。Cronk说:“问题是我们的复合库很大程度上是为了识别这些更经典的目标。”
但现在重点已经从数量转向了质量。“虽然许多组织仍然有大量的化合物集合(大约100万个化合物),但默认的位置不再是筛选整个库。相反,库被分层,以提供整个库的化学多样性的最广泛的表示,在可能的情况下,在一个减少的集合中,再加上库的目标定向组件,”Cronk解释道。从库化合物上获得的数据允许这种类型的分层,它还允许去除经常显示假阳性的有问题的化合物类,从而提高了匹配的质量。
DNA-encoded库
DNA编码库仍然是一个大项目,在这个库中,DNA序列与化合物结合,就像条形码一样,在某些情况下,还可以控制化合物的化学合成。2017年,丹麦生物制药公司Nuevolution宣布它的DNA编码库现在包含40万亿个独特分子。4dna编码可以对蛋白质目标进行亲和选择筛选,可以在一个容器中进行,而不需要生化分析。5洗涤去除弱结合化合物后,目标蛋白可以变性,与命中相关的DNA标签通过PCR扩增并测序鉴定。但克朗克警告说:“如果筛选出足够多的化合物,这种方法是否能实现其确定目标的承诺还有待观察,因为现在还处于早期阶段。”
高通量筛选:CRISPR-Cas9和RNAi
HTS也被用于探测功能基因组学。RNA干扰(RNAi)筛选被广泛用于发现涉及特定疾病途径的蛋白质,并确定干预方法。使用合成RNA分子,细胞中的特定基因会被沉默,任何导致的“功能丧失”都可以精确定位相关基因。6CRISPR-Cas9系统也已用于HTS,可以提供比RNA干扰更具体的信息。基于CRISPR- cas9的基因编辑已被用于创建针对不同基因的病毒CRISPR指南文库,这些可以转导到细胞系中。7
CRISPR先驱,张峰教授麻省理工学院和哈佛大学布罗德研究所(Broad Institute of MIT and Harvard)的研究人员使用该方法探测了黑色素瘤细胞对癌症药物vemurafenib (Zelboraf®)的耐药性。利用CRISPR敲除基因文库的高通量筛选,他确定了几个具有vemurafenib耐药性的命中基因。
高通量筛选:人工智能和机器学习
HTS的另一个重大进步是挖掘使用人工智能生成的大量数据的能力。Cronk说,HTS将受到巨大的影响:“通过云计算并行处理数据的能力将比数据获取方式的发展更有影响力。”
总部位于北卡罗来纳州的协作制药公司(协作Pharmaceuticals)首席执行官肖恩·埃金斯(Sean Ekins)博士说:“在过去的十年里,(使用机器学习来分析HTS数据)已经开始流行起来,这是因为数据的规模、计算的能力以及开始开发的算法。”该公司利用公开的HTS数据集和机器学习模型,专注于罕见和被忽视疾病药物的发现,以识别感兴趣的分子进行进一步测试。
Ekins解释说:“机器学习模型正试图从HTS数据中提取出活性分子的关键描述符或特征。”“一旦你有了一个模型,你就可以用它来筛选一个非常大的虚拟化合物库,看看它是否能找到具有你已经提取出来的那些特征的东西。”Ekins用他的方法鉴定了用于结核病治疗的铅分子。他能够虚拟筛选生物活性和细胞毒性信息,并产生超过典型HTS结果的命中率。8他使用了类似的方法来识别对抗埃博拉病毒和引起南美锥虫病的寄生虫的活性分子。
高通量筛选技术的发展
Ekins认为,随着机器学习的新发展和现有数据量的增加,对传统高通量屏幕的需求实际上可能会下降。但筛选可能会开始关注新的领域,他沉思道:“我们未来可能考虑的是大量的组合,三种、四种或更多的化合物。”
Janzen说:“当高通量筛选刚开始时,人们期望它能从屏幕上重新产生药物先导,但人们现在已经意识到,它只是发现新化学模板的一种工具,而绝不是唯一的工具。”虽然很明显,发现药物需要大量的工具,通常是并行使用的,但克朗克说:“今天,对HTS部门的看法肯定发生了变化,人们对这些团队中的技能有了更高的认识。”