自动化的研究来提高再现性和吞吐量
阅读时间:
几十年来人类看起来繁琐和容易出错的手动步骤进行自动化在实验室里,用一个目标来提高科学再现性和吞吐量。我们最近跟查尔斯•拉基亚BioBright开网的CEO和创始人之一,学习如何自动化可以用来帮助科学家分析数据。查尔斯讨论挑战时要考虑执行分析以自动化的方式,他也强调了你的数据的价值,网络安全的重要性。
劳拉·兰斯顿(LL):数据是如何革新我们做科学的方式?
查尔斯·拉基亚(CF):直到现在几乎所有的科学过程驱动的。特别是,一开始这个过程非常手册。主题选择手动执行步骤,观察是手动完成的。分析是手动完成的。
我们取得了很大的进展在科学、和自动化已经帮助,特别是在前两个步骤(主题选择和观察),但过去的前沿,如果你愿意,是可以完全自动化的方式进行分析。
图1:科学方法包括三个步骤;主题选择、观察、分析。无声的巨大的努力导致了前两个步骤的自动化,努力成功自动化最后一步(分析)仍在继续。来源:BioBright查尔斯•拉基亚。
这一概念在几年前是不可想象的。现在我们有很好的技术,如机器学习和人工智能(AI),可以帮助我们分析自动化。
我们有一个卷的数据是前所未有的,也是我们现在有前所未有的计算能力。
这就是数据主要是改变我们做科学的方式——我们会从数据驱动方法的过程驱动的方法。它是把整个科学过程。而不是说:“我要做的A、B和C,然后信任结果”研究人员采用一个数据驱动的过程,“我有,A, B和C的数据…那是什么告诉我,我需要收集其他数据做什么?”——这种反演可以带来很多挑战。
举个例子,如果你不小心在控制你的数据时,或如果你粗心,收集数据,实验可能会变得毫无价值。再现性危机相关的现象,这是美国经济成本每年约280亿美元。我们经常看到的情况现在科学家正淹没在数据没有办法处理这些数据的容量和复杂性,导致一个巨大的浪费时间和资源。
我:你有解释说,主题选择和观察步骤自动化已经有很长一段时间,而分析步骤仍主要是手工的。你认为是为什么?
CF:它是一个更有挑战性的步骤,传统上,它就是人类所做的步骤。为了这一天,我们依然这样做,对吗?很多人认为,能够自动分析步骤是把数据转换成一个AI平台和“瞧”奇迹发生,和有意义的见解。是很正常的,我们在宣传循环,有很多的承诺。但现实是自动化只是另一种分析方法,但它转变人类的角色从一个绝对的瓶颈,成为更多的监督。
在自动化概念在其他领域,而不是在生物医学领域,但它的到来——人类的循环和人类的循环;通过循环扭转,人类是定位在循环,监督过程。这是现在常见的在汽车制造业,网络安全,和金融服务,但是我们将这些原则到生物医学领域。
显然,我们没有。在每次运行后,即使这是一个高通量运行,分析人类,然而,他们在玩一个窄的角色,我认为这是好的。这个新的自动化步骤,减少错误,提高吞吐量是一个受欢迎的转变正在发生,这将使我们更接近自动化分析。
我:你谈到了在实验室工作流程分析步骤可以真正受益于机器学习;然而,你触及一些陷阱和要注意的事情。你能突出一些吗?
CF:有三个关键问题:
1。炒作圆
这一概念在几年前是不可想象的。现在我们有很好的技术,如机器学习和人工智能(AI),可以帮助我们分析自动化。
我们有一个卷的数据是前所未有的,也是我们现在有前所未有的计算能力。
这就是数据主要是改变我们做科学的方式——我们会从数据驱动方法的过程驱动的方法。它是把整个科学过程。而不是说:“我要做的A、B和C,然后信任结果”研究人员采用一个数据驱动的过程,“我有,A, B和C的数据…那是什么告诉我,我需要收集其他数据做什么?”——这种反演可以带来很多挑战。
举个例子,如果你不小心在控制你的数据时,或如果你粗心,收集数据,实验可能会变得毫无价值。再现性危机相关的现象,这是美国经济成本每年约280亿美元。我们经常看到的情况现在科学家正淹没在数据没有办法处理这些数据的容量和复杂性,导致一个巨大的浪费时间和资源。
我:你有解释说,主题选择和观察步骤自动化已经有很长一段时间,而分析步骤仍主要是手工的。你认为是为什么?
CF:它是一个更有挑战性的步骤,传统上,它就是人类所做的步骤。为了这一天,我们依然这样做,对吗?很多人认为,能够自动分析步骤是把数据转换成一个AI平台和“瞧”奇迹发生,和有意义的见解。是很正常的,我们在宣传循环,有很多的承诺。但现实是自动化只是另一种分析方法,但它转变人类的角色从一个绝对的瓶颈,成为更多的监督。
在自动化概念在其他领域,而不是在生物医学领域,但它的到来——人类的循环和人类的循环;通过循环扭转,人类是定位在循环,监督过程。这是现在常见的在汽车制造业,网络安全,和金融服务,但是我们将这些原则到生物医学领域。
显然,我们没有。在每次运行后,即使这是一个高通量运行,分析人类,然而,他们在玩一个窄的角色,我认为这是好的。这个新的自动化步骤,减少错误,提高吞吐量是一个受欢迎的转变正在发生,这将使我们更接近自动化分析。
我:你谈到了在实验室工作流程分析步骤可以真正受益于机器学习;然而,你触及一些陷阱和要注意的事情。你能突出一些吗?
CF:有三个关键问题:
1。炒作圆
我们需要炒作周期的小心,以确保人们不要急于下结论时机器学习——它不是一个黑盒,将解决我们所有的问题——不是银弹。
这个阶段已经在其他领域-self-driving汽车就是一个很好的例子。
我们得通过炒作周期。所以,理解机器学习不是会神奇地解决你的问题是非常重要的。理解当和如何它是适用的是极其重要的。
2。网络安全
2。网络安全
东西非常接近BioBright的心是网络安全。当你搬到一个数据集中处理你的数据就是一切。它拥有所有的价值。我想我们有这个在我们的公共对话变得更加正面和中心。这是我们在BioBright非常担心,因为其他行业之前犯的错误。所以我们积极努力的位置,在我们所做的前沿。DarwinSync完全加密的,例如,我们的平台,它旨在从第一天,由于我们的起源是由美国国防部高级研究计划局和美国国防部。在休息,至关重要的是,数据被加密,它在安全通道上,整个系统设计有多个故障保险,以减少违反的结果。
网络安全是至关重要的,如果你的过程依赖于所有这些数据和所有这些培训然后把机器学习算法然后把你一个结果。竞争对手或恶意用户可能否则飙升,数据——有大量的例子发生在其他领域。
3所示。人类的可用性
网络安全是至关重要的,如果你的过程依赖于所有这些数据和所有这些培训然后把机器学习算法然后把你一个结果。竞争对手或恶意用户可能否则飙升,数据——有大量的例子发生在其他领域。
3所示。人类的可用性
无论多么自动化流程进入这一领域,总有人类的循环。即使在最高水平的自动化公司,他们仍有人类解释数据并决定哪个方向的实验。不幸的是,在我们的领域的很多解决方案,在不将人类可用性纳入设计。如果你看看很多专有软件,功能通常是很好,但勉强可用。和大部分时间,供应商比给你更专注于锁定你的工具和接口,使大部分的数据生成。
噢,网络安全是您特别注意的。为什么人们不精明,这是他们真正需要的注意的,尤其是当有破坏的例子可以在其他领域?
CF:我认为,从文化上讲,是一个非常广泛的计算机科学和生物学和之间的鸿沟正在迅速缩小,仍有差距。不仅如此,即使你专门在计算机科学方面就不一定是网络安全位置。我的意思是,我们有巨大的危机,最近的危机,现在我们仍在努力解决。我们当然还学习作为一个领域。
正如我前面所提到的,网络安全是我们的优先工作之一,这可以追溯我们如何成立,我们收到了格兰特开始自己的公司从国防高级研究计划局(DARPA)和我跳出我的博士项目成为BioBright的首席执行官。这就是安全的一个例子是一个非常重要的问题——这已经很多年了,他们有更多的经验在自治系统与其他行业相比。
噢,网络安全是您特别注意的。为什么人们不精明,这是他们真正需要的注意的,尤其是当有破坏的例子可以在其他领域?
CF:我认为,从文化上讲,是一个非常广泛的计算机科学和生物学和之间的鸿沟正在迅速缩小,仍有差距。不仅如此,即使你专门在计算机科学方面就不一定是网络安全位置。我的意思是,我们有巨大的危机,最近的危机,现在我们仍在努力解决。我们当然还学习作为一个领域。
正如我前面所提到的,网络安全是我们的优先工作之一,这可以追溯我们如何成立,我们收到了格兰特开始自己的公司从国防高级研究计划局(DARPA)和我跳出我的博士项目成为BioBright的首席执行官。这就是安全的一个例子是一个非常重要的问题——这已经很多年了,他们有更多的经验在自治系统与其他行业相比。
我们必须装备,以避免类似的情况下,那些黑客闯入配电网络和关闭有时的部分国家,对吗?
我们不可能发生在生物医药行业因为…
它只是不能发生。
噢,你相信每个实验室都可以受益于自动化吗?
CF:很好的问题- - - - - -我肯定会想如果你以自动化为更广泛的观点。我觉得我们朝着更以数据为中心的方法,也就是说,即使整个过程仍然手动但自动化数据分析到位,那么仍然有巨大的收益。
所以很大程度上我同意。虽然点的问题,你知道,自动化这不是万能的,它必须正确应用和深思熟虑的,在某种程度上提高了科学家。
广告