云计算改变研究的4种方式
基于云的信息学解决方案已经成为研究的一个组成部分。如今,云无处不在,每一个新的信息学工具似乎都有一些云的特征或功能。但这对研究人员来说到底意味着什么呢?有了这个方便的列表,你会发现答案是“相当多”,因为我们探索了云计算改变研究的四个关键方面。
云的定义
在我们开始之前,重要的是阐明云计算的确切含义。云计算使用户可以按需获得各种IT服务和资源,而这些资源不必由用户直接管理或托管。云计算资源通常定义为它们所提供的巨大资源规模,利用了规模经济、平台的弹性(它可以根据用户的需要增长或收缩)以及资源的共享和灵活性。
云计算通常分为三种类型的服务。软件即服务(SaaS)模型在现收现付的基础上提供应用程序和软件。平台即服务(PaaS)提供了在云基础设施中设计定制应用程序所需的开发工具,而基础设施即服务(IaaS)允许用户通过云利用高性能计算的强大功能。要了解更多关于如何设计基于云的信息学的信息,请下载我们的信息图表在这里.现在,让我们深入探讨云计算改变研究的四个方面。
增加对应用程序的访问
云技术开始在过去的五年里,这些软件模式已经变得司空见惯,正如欧盟委员会云专家组早在很久以前所预测的那样2012.SaaS消除了实验室昂贵的许可证带来的经济负担,取而代之的是一种便宜得多的现收现付模式,并允许研究人员使用他们需要的工具来完成他们需要的任务——而且仅仅是这项任务。PaaS模型为研究人员提供了必要的工具,使他们能够使用云提供商的基础设施设计自己的应用程序(我们将在下面讨论该基础设施的好处)。通过云计算提供的按现收现付模式的应用程序现在已经远远超出了基本的文字处理程序和电子邮件客户端。研究人员现在可以使用供应商提供的基于云的实验室信息管理系统、电子实验室笔记本电脑和色谱数据系统,并且通过PaaS解决方案的灵活性,可以利用云进行专门应用。因此,云可以提供有益于整个生物医学科学的应用程序。只要你能想到的,都有一个基于云计算的工具:from医学成像来电生理学来质谱分析.
每个人的超级计算机
IaaS可能是最具吸引力的云应用程序——IaaS不是提供专门的应用程序,而是向任何可能需要它们的科学家提供高性能计算资源。这对研究产生了两个主要影响。首先,打开大数据项目的大门,这在科学界越来越重要。组学的爆发使得庞大的数据集变得更加普遍;一个完整的基因组序列充满了100gb的数据,即使对使用经典计算方法的最耐心的研究人员来说,分析这种大小的文件所花费的时间也会让人感到麻木。相反,云托管工具,如CloudAligner和CloudBurst允许研究团队从他们自己的基础设施中卸下负载,并将工作分散到后端服务器上。这使得研究人员可以利用以前过于笨重的数据集。组学革命只有在云技术的同时繁荣才成为可能。
IaaS平台的第二个主要影响是科学的巨大民主化。这些大数据项目不再只是大型研究机构的专利,尽管它们仍然能够获得相当强大的内部技术;蓝脑计划,一个神经模拟计划,基于瑞士École理工学院Fédérale de Lausanne,最近支付了近1800万美元以覆盖其新的超级计算机蓝大脑5。有了云计算,如果你的预算不能满足每秒几十次千万亿次的计算,你也可以不受限制地进行你需要的实验。云所支持的平台的一个很好的例子是布罗德研究所的平台FireCloud,一个开放的可扩展数据分析平台,任何拥有谷歌账户的研究人员都可以访问。Firecloud的弹性特性意味着研究人员可以随心所欲地使用或多或少的电力。布罗德研究所还向用户提供了他们的最佳实践工作流程。
数据库满足您的所有需求
在人们开始使用基于云的分析应用程序和利用基于云的超级计算机之前,研究人员需要访问数据,而云在提供这种访问方面发挥着越来越重要的作用。来自大规模基因组学项目的数据,比如1000人基因组都可以通过云服务提供商亚马逊网络服务(AWS)获得。你会发现,即使云正在开放科学,云服务的提供仍然是寡头垄断的,由亚马逊、谷歌和微软拥有一半的市场它们之间的云基础设施。NIH在2015年决定向云存储开放其基因数据库,这只会加速云数据库的增长。正如参与全基因组泛癌症分析的研究人员在《自然》杂志最近的一篇评论中详细描述的那样一块在美国,如果一名研究人员想要下载国际癌症基因组联盟(International Cancer Genome Consortium)的数据集(2pb)——相当于近7年的全高清视频录制——那么一个典型的大学互联网连接将让他们等待超过15个月。云技术是大数据新时代存储和下载文件的最佳方式。
分享可以成为现实
积累大量的结果,然后像一条数据巨龙一样坐在上面,对任何人都没有多大好处。在现代研究中,高效和有效地共享数据是必不可少的,而云使这一过程变得极其简单。云创新是美国国立卫生研究院BD2K计划的关键组成部分,该计划旨在最大限度地发挥生物医学科学的数字潜力欧洲开放科学云(EOSC)是一个全欧洲范围内的项目,旨在为科学家创建一个数据共享空间。对于EOSC来说,“云”一词是开放数据的隐喻,云技术对于该项目的目标至关重要,即使数据和分析数据所需的资源在整个大陆上都可以访问。