改变科学,改变科学家:技术如何改变分析化学家的角色
这是令人兴奋的一天,当一个新的套件到达实验室。博士后们在计划实验,博士生们在想如果他们打破了它会发生什么,实验室经理们在想如何把它放在台式电脑上,技术进步影响着每一个参与科学的人。但某些技术进步不仅带来了新的能力,而且有可能从根本上改变实验室团队或公司的研究方式。
Andrew Anderson是工业软件解决方案提供商ACD/Labs的创新、信息战略副总裁,他对技术如何影响分析化学领域有着独特的优势。在这次采访中,我问安德鲁,化学家的日常生活是如何被人工智能和自动化等技术改变的,以及崭露头角的化学家如何掌握自己的技能,以应对分析科学不断变化的面貌。
Ruairi Mackenzie (RM):技术进步是如何改变目前研究科学家的工作规范的?
安德鲁·安德森(AA):这是个好问题。如果我们在五年前谈话,我会有一个与今天不同的愿景。在制药行业中有一些很好的例子,特别是围绕催化剂D2D的商业化(阅读更多)在这里).你们可能还记得,我们曾与一家大型制药公司合作,之后又与其他几家公司合作。为了描述我在这些公司中看到的科学家工作角色的变化,我将谈谈我所习惯的,特别是在化学方面。如果你想想制药行业,传统的治疗方法是使用小分子技术制造的,它们通过药物发现和开发过程进入,最终进入商业化。
如果你回到五年前,我们看到的,特别是在发现方面,是对供应商和合同研究组织,合同开发和制造组织的外部生态系统的依赖。这些生态系统健康而充满活力。但在我看来,我们现在也看到了内部投资的复苏。这是基于与这些不同角度和客户合作的市场沉浸感。我看到的是重新转向对核心基础设施的投资,比如技术平台、机器人和自动化。我不会深入探讨这种复苏背后的原因,但我确实认为,从事真正关键项目的科学家们希望在内部和外部工作之间重新转向更平衡的投资组合。
我可以推测或假设有几个原因。其中之一可能是在项目团队级别进行协作的能力。我不认为支持协作的技术已经完全取代了面对面协作的水平,我们称之为高质量的协作。当然,有人在努力利用技术使地理位置不同的协作者更有效地合作。但是,当你看到在药物发现、开发和商业化过程中跨职能的努力时,这些人有时需要非常密切地合作。这是原因之一。另一个,在我看来,是实验技术的进步。你可以拥有内部员工,他们现在使用的技术比过去更高效。
这种新技术的早期采用者已经在药物发现和开发过程中实现了生产力的提高。例如,利用高通量实验技术,你可以以比过去更快的速度生产材料。现在有缺点,但可以肯定的是,高通量实验范式正在产生好处。我们确实看到人们对自动化投资的兴趣有所提升,这样你就有了高生产力的内部能力。您肯定会继续利用外部化资源来完成不需要自动化的工作。但我认为两者之间的平衡非常重要,我们确实看到这些组织的高级领导人也认识到这种平衡的价值。我确实看到,在全球一些正在开展大型制药研发业务的地区,内部员工的招聘有所增加。
我看到的是很多化学家进入了这些组织。现在的化学家和五年前的已经不一样了。
RM:与五年前相比,今天化学家的角色有什么变化?
AA:让我们假设你是一家制药公司的药物化学家。你的职责是决定如何优化一个特定的先导化合物,并使其成为可以被提名为临床开发候选药物。在旧世界里,你的职责主要集中在通风柜周围,你的工作通常是致力于一些设计工作,根据结构和活性关系来理解应该制造什么分子。你甚至可以建模来确定一个特定的分子如何适合特定的药物靶标,并根据它应该如何适合来优化分子。
现在,一个变化的因素是人工智能,你有机器规定要做什么。这是一个现实的未来,你正在使用在网上这些工具有助于增强科学家下一步要做什么的决策。
遵循机器增强的方法来定义要制作什么,现在决定如何制作。你会想要制作这些材料并对其进行物理分析,在体外化验等。然后你将利用工具来帮助规定制作特定材料的过程。如果你听说过任何关于反合成分析和反应预测方面的创新,这是当今科学家将利用这些技术的领域。这意味着,如果你有机器学习应用程序或人工智能应用程序规定制作什么和如何制作,那么这个过程可能会非常快,因为计算机的速度和其他因素。
瓶颈转移到如何并行生产和高吞吐量。下一个技术创新是高通量实验。你可以比过去更快地生产更多的材料。从历史上看,你一次只能研究一个或一小组反应,我们已经看到,在今天的范式中,或者在短期的未来的范式中,取决于你与哪个公司交谈,你现在可以使用自动化工具一次生产多达1500个分子。如果你结合人工智能进行设计,人工智能进行反应计划,然后利用自动化工具进行高通量和并行实验,那么通过传统的试错过程来达到候选药物开发的速度就会快得多。
你想要的最后一件事是我称之为无损保真决策支持接口。许多公司还投资于从设计到执行再到任务,在科学过程中那些离散单元操作中产生的所有数据,以便能够以整体的方式向决策者展示这些数据。
从我的角度来看,这对科学家来说意味着除了他们的化学知识、生物学知识、药学知识之外,他们还需要能够处理大量的数据。他们的部分工作从化学家转变为数据科学家或数据工程师。
RM:这是否意味着今天的分析化学家将在通风柜中花费更少的时间,还是他们期望在通风柜中花费相同的时间,并在此基础上分析数据?
AA:我想说的是,在未来没有通风柜,我的意思是,与你传统想象中的通风柜和反应瓶之类的东西相连接,未来的范式,甚至是当前的范式是你走向通风柜或手套箱里的机器人。你有效地向机器人提供机器指令让它们为你工作,对吧?这种转变是科学家们不再接触材料了。你实际上是在为机器提供你将在这个过程中执行的单元操作集的指令。这和三年前作为传统化学家所做的肯定是不一样的。你实际上是在与机器人技术和数字软件接口进行交互。
RM:软件如何帮助化学家扮演这个新角色?
AA:它是系统之间的转录和翻译。当然,这需要大量的人力。我们讨论过这个数据工程目前需要能够将信息从一个系统转录到另一个简单的例子是如果我用一个自动反应堆系统执行了一个反应,我会说大部分的分析都是在甲板上进行的。我的意思是反应甲板上有一个机器人,一个机械臂,它把材料分散到容器中,这些容器将作为反应容器,这些反应容器受到不同的环境条件,比如加热,搅拌或加压等。
在实验结束时,甚至在实验过程中,你会想要做一些分析来确定反应的进行情况。通常情况下,这意味着机器人会在实验结束或实验过程中取样,并创建分析样本。分析设备通常与反应设备分开。
我需要确保我从分析实验中得到的数据通过样品来源与我的反应实验有某种联系。这确实是目前的挑战之一,就是如何在这些系统之间建立接口。我们强烈提倡让软件来完成转录和翻译的工作;让软件为你做这些。我们的工作是帮助我们的客户连接反应设备和分析设备,通过创建样品来源的数字表示,然后格式化这些数字表示,这样它们就可以被分析设备使用。
一个实际的例子是,如果我在实验结束时对一个96孔板的反应进行了采样,我将采样并放入96个高效液相色谱瓶中,然后我走过去,把这些高效液相色谱瓶装上。我需要的是将高效液相色谱瓶与96孔板中的位置相关联的标识符,这样我就知道样品属于什么。
在催化剂应用程序中,我们有反应板的标识符,我们将这些标识符映射到加载到系统中的样品板上。此外,我们为这些样本准备了一个序列文件,其中包括样本标识符关系。无论是注释字段还是文件名,或者是建立这种关联的各种方式。然后,我们所做的是一旦数据被获取,我们读取,所以催化剂将读取样本标识符,使关联到适当的反应信息。
这就给了我们一个软件体验,里面有所有的反应信息,比如我加了什么试剂,我做了什么产物,我有所有与反应信息相关的分析数据。现在我能做的就是走到一个软件界面,在一个地方有所有的信息。传统上,科学家在整个实验之后要做的是从分析软件包和反应中获取数据,然后自己进行关联。那是一项相当耗时的工作。我们几乎把工作量减少到零。
RM:软件的进步是否意味着科学家们不需要所有这些数据处理培训,或者只是将大量的数据处理手工劳动排除在方程之外?
AA:在我看来,有两种思想流派。首先是构建紧密集成的单片系统。有一些公司用完美集成的单片应用程序构建了这些非常高端的平台。这些都是机器人平台与软件的紧密结合。虽然这些都很好,但在这种范式下,你看到的数据工程较少,因为这些都是庞然大物,它们不是模块化的。
这是一个后果;如果您正在进行的科学实验不适合该平台,则该平台将不支持该实验。我给你举个例子来说明这一点。假设你有一种化学物质,需要一个平台无法承受的压力水平。现在你又要回到传统的通风柜里做化学实验了。您的平台不支持它。你可以用这些单片平台进行的实验的广度是有限的。我喜欢说的类比是,就像你有一所房子,你想做的就是移动沙发,但你必须重建房子才能做到这一点。在这些例子中,虽然它们对于预期的范围是有效的,但如果范围发生了变化,那么就非常困难了。
我们看到的另一个趋势是模块化自动化。如果您需要更改自动化流程中的某个特定元素或单元操作,对于该特定单元有很多选项。数据集成成了一个负担。
我们试图做的是提供一种能力,使用软件和集成工具来集成或更改平台的不同组件,以降低在平台中创建庞然大物的风险,使它们模块化先天的.您可以通过有效的软件集成来实现这一点。你的数据得到了整合。与编写硬代码(如构建在一块巨石上操作设备的软件)相反,我们有效地使用模块化组件中存在的软件,并在它们之间提供指令列表。该指令列表可以由人交付,也可以由软件交付。这取决于模块化组件的应用程序编程接口以及它可以接收和支持什么等等。
关键是:我认为你永远都不必完全放弃不理解数据工程,因为它需要模块化。我们当然希望减少系统之间手工转录的负担,但是我们将促进一种自动化或非常方便和有效的机制,通过这种机制,您可以自动重新格式化数据,从而翻译信息。如果我们可以用软件重新格式化数据,这将大大减轻科学家将信息从一个系统转录到另一个系统的负担。
RM:对于新进入这个在过去五年中变化如此迅速的领域的化学家,您有什么其他建议吗?
AA:我想说的是,你在处理预测应用程序方面的经验越多,当然这是一项需要获得的重要技能。第二件事是能够使用一些更现代的数据处理和分析工具来处理数据也同样重要。最后,从我的角度来看,因为我们谈论的是高吞吐量和并行,所以我不禁认为对统计的良好理解是需要获得的一项重要技能。原因是,如果你能使用高度可扩展的反应设备,有能力确保你在进行有效的实验统计设计,这样你就能用最少的实验集捕获尽可能多的变量,这是一个非常重要的知识集因为如果你能同时执行1536个经验,从这1536个实验中收集到的信息量最大化可能是个好办法。其中一种方法是利用实验数学的统计设计。我认为这是一件需要注意的重要事情。顺便说一下,大量的人工智能和机器学习,大量的统计数据,你可以获得双倍的好处,不仅在你的实验设计上,而且在你分析数据的方式上。
Andrew Anderson采访了Ruairi J Mackenzie,科技网络的科学作家188金宝搏备用