项目使用云计算和人工智能解决不安全的街头毒品
药物检测是由温哥华岛药物检查项目与加拿大卫生部和维多利亚大学合作向公众提供的。图片来源:维多利亚大学,杰伊·华莱士
阅读时间:
科学家们使用超级计算机来帮助了解我们的世界正在经历的生物、化学和物理变化,发现科学的新前沿,发明新技术来改善人类的状况。现在,来自维多利亚大学位于不列颠哥伦比亚省温哥华岛的维多利亚大学(UVic)正在使用超级计算资源来解决社会最大的挑战之一——不受监管的毒品市场的风险——并帮助改变那些受过量影响的人的生活。他们的工作展示了这些冰冷、复杂的机器如何对我们的生活产生影响,并为我们的安全和保障打开了更大的可能性。
Arbutus高性能计算云
Arbutus phase 2 HPC云最近部署在维多利亚大学(UVic)。部分计算加拿大而且WestGrid 高级研究计算(ARC)Arbutus最初于2015年推出,旨在支持需要访问高性能计算云资源的新一代调查人员。“当时我们现有的IT服务没有基础设施,无法满足我们研究人员的一些高级计算需求,”他评论道被农业部 ,博士。大学系统部研究计算服务部门的高级研究计算专家。“我们有HPC集群,但研究人员迫切需要高可用性协作平台、定制网站、根访问、微服务环境和其他云计算服务,对许多研究人员来说,云计算正迅速变得与HPC集群一样重要,成为必不可少的ARC服务。”
由于当时维多利亚大学缺乏云服务,一些研究人员在亚马逊、Azure和谷歌自己的云平台上运行项目。基于这一需求,Arbutus于2015年构建了私有的OpenStack云基础设施,以交付基础设施即服务(IaaS)资源,并支持各种工作负载库。Arbutus 1包括数千核的英特尔至强处理器、10千兆以太网网络和1.6 PB的三冗余Ceph存储(总共4.8 PB)。Ceph存储是一个开源软件存储平台,它在单个分布式计算机集群上实现对象存储。
在接下来的四年里,新的研究项目启动,其中许多项目开始使用新兴技术能力和研究环境,如机器学习(ML)、人工智能(AI)、JupyterHub和大数据。这些新项目,以及对云服务日益增长的需求,需要更多的存储、先进的计算和更大的内存池,从而产生了更大的云基础设施和Arbutus 2。
杨梅和维多利亚岛毒品检查项目
维多利亚大学利用这些新资源的研究人员之一是Dennis Hore教授维多利亚大学化学系和计算机科学系。
“在过去的20年里,我一直在研究分子如何与表面相互作用,”霍尔说。“例如,在人体中使用的塑料有很多种——导管、支架、缝合线、人造器官——附着在这些设备上的蛋白质结构对它们的功能至关重要。我们的集团通过实验和理论方法的结合,包括HPC集群的分子动力学模拟,解决了与解决生物相容性的分子基础有关的问题。”
但一名减害药剂师的询问激发了一个新项目的灵感,该项目旨在帮助减少非处方街头毒品(包括芬太尼)的过量使用者数量,芬太尼是加拿大和美国阿片类药物危机的核心化合物。
“药剂师想要开发一种处方药的内部质量控制测试,”霍尔解释说。虽然他多年来一直从同一家制造商那里购买这种特定的药物,但他的客户告诉他,这种药物对他们的影响与以往不同。确定药物成分的目标最终导致了温哥华岛毒品检查项目”。
利用机器学习深入了解街头毒品
在过去的三年里,该项目将霍尔的核心研究领域与他对大数据、机器学习、软件和硬件工程的兴趣结合起来。该项目正在提供有关阿片类药物和其他药物使用的新数据。
“人们想知道他们的药物中有什么,”霍尔补充道。“有多少芬太尼、摇头丸、吗啡或其他化学物质和切割剂。我们匿名与人们合作,告知他们自愿拿来分析的药物的成分。我们的目标是量化样品的成分,包括有效成分和切割剂。一旦我们有了分析,减少伤害的工作人员就会让服务用户知道他们在处理什么,如果他们需要的话,就会给他们适当的指导。”
在20分钟内,该团队将通过一系列分析仪器对样品进行分析,包括质谱仪、红外光谱仪、两种不同类型的拉曼散射和抗体测试条。除了在短时间内通过所有这些仪器和测试并行进行分析的潜在硬件问题外,理解结果也很困难。化学药剂会留下指纹,霍尔的团队依靠已知药剂的图书馆和数据库来比对指纹。但是样本中的化合物越多,或者库越大,就越难匹配。随着没有已知指纹的新型设计药物上市,比如基于芬太尼的药物,它们的分析变得更加复杂。该项目需要云高性能计算资源。这就是杨梅的由来。
Moa解释说:“当研究人员需要一个我们认为是他们自己的虚拟实验室的环境时,我们就会设置网络和硬件来支持他们的工作。然后,不管有没有我们的支持,他们都可以在几分钟内通过工具和软件库创建自己的环境。”
每个研究人员定制他或她的虚拟实验室。有些人只需要高度可用的网站来收集和/或共享数据。其他人则安装大数据应用程序,如Apache Spark。一些人正在运行小规模的高性能计算工作负载,包括GROMACS,这是一种用于研究SARS-CoV-2病毒等物质的分子动力学软件。其他人则建立机器学习平台。Hore的项目需要多种工作负载的混合环境。
“我们使用从每个样本中收集的数据以及化学库和数据库来构建机器学习算法和应用程序,”霍尔解释说。
他的团队使用了各种方法,从无监督的方法,如简单的主成分分析、偏最小二乘回归和随机森林分类,到层次聚类分析和其他方法。根据Hore的说法,对于一个管道来说有太多的可能性。
在红外吸收光谱测量中,将少量样品放置在反射红外线的晶体上。图片来源:维多利亚大学,杰伊·华莱士
Moa补充说:“我们的想法是能够进行完整阶段的在线机器学习。”“我们从现有的样本中学习,用这种学习来描述下一个样本,预测结果,并根据我们所学习的内容制定行动。”
但这需要一个灵活而强大的计算基础设施,如Arbutus,以便在一个灵活的系统上运行许多不同类型的计算。
Arbutus第二阶段由208个联想ThinkSystem SR630、SR670和SD530节点组成,于2020年初部署。新系统增加了近8000核的第二代英特尔至强黄金6248处理器和英特尔至强黄金6130处理器。每个节点中1 tb的Intel Optane持久内存提供了内存容量,以支持越来越多的研究人员和持续运行的工作负载,这些工作负载有时是无限期地运行。
根据Moa的说法,Arbutus 2允许用户从不同的机器学习环境(如TensorFlow、PyTorch、Julia、Pandas和Apache Spark)中进行选择。这些环境依赖于Conda发行版。Conda发行版是一个开源包管理器和环境管理系统,在使用numpy、scipy和sklearn等Python包时,使用英特尔数学内核库进行低级操作。
设计基于ml的远程分析的未来
霍尔和他的团队在维多利亚州所做的研究有潜力应用于更多的应用领域,比如远程医疗,这些发现可能会导致便携式设备和信息亭的开发,可以快速交互式地分析化合物。这在不存在分析资源和计算设施的远程站点尤其有用。这种使用机器学习的远程分析可以快速洞察样品的构成,并为那些寻求分析的人提供指导。
在传统的研究空间,如霍尔的项目,研究人员有一个大的实验室,昂贵的仪器和训练有素的操作人员的好处。科学家进行分析,提出问题,从数据中学习,并改进算法。要将这种分析作为移动或便携式服务进行,需要重新考虑技术,包括对计算资源的访问。
对于他的药物分析项目,霍尔设想了基于便携式计算的解决方案,将分析与在线机器学习和处方相结合,这样它们就可以消除人为偏见,并可以部署到可以访问云资源的偏远地区。
“随着基于云计算的家庭和个人助理的出现,人们习惯了与电脑对话。他们正在学习信任技术的公正指导。最近资助的一个项目试图建立一个互动亭,人们可以带着他们的样本进行分析,计算机提供基于科学的指导,没有性别或种族偏见,也没有基于他们回答问题的偏见。”
但是,小型化和移动化带来了新的挑战。霍尔解释说:“如果你想用移动技术做到这一点,仪器就必须耗尽电池,并依赖远程云资源。”“它必须很小,所以它可以放在汽车的后备箱里,或者是手持的,能够进行多种分析,同时也负担得起。现在,我们仍然有一段路要走,就拥有良好的移动和便携式应用技术而言。一些仪器很大,操作人员训练有素,计算资源强大且易于获取。考虑到这种类型的部署,我们会回到起点,重新思考如何设计这些仪器。”
本文是英特尔编辑计划的一部分,旨在突出由高性能计算和人工智能社区通过先进技术推动的前沿科学、研究和创新。bet188真人内容的发布者拥有最终的编辑权,并决定发表什么文章
广告