谷歌帮助搜索安全、可共享的云数据
云技术正在成为现代研究的核心部分。采用云是使现代“大科学”项目成为可能的重要一步,同时云也向各个实验室展示了它的价值。尽管如此,关于云数据的安全性和可共享性的问题仍然存在。只有在备受瞩目的研究项目中证明云的实用性,这些问题才能最终得到答案。我们采访了谷歌Cloud的教育总监Kevin Kells,讨论了云如何改变研究的项目,以及新技术如何使安全简单的数据共享成为现实。
Ruairi Mackenzie (RM):云是如何改变研究的?
凯文·凯尔斯(KK):一般来说,通过支持更多的问题,大规模的计算,更快的结果,更容易的协作,所有这些都花费更少的钱。研究人员如何利用所有这些好处的一个例子是在哥伦比亚大学的拉蒙特-多尔蒂地球天文台在那里,研究人员画了一个NSF BIGDATA将他们关于洋流的数据密集型工作转移到云端,与世界各地的同事合作进行气候研究。气候科学的高分辨率三维数据集意味着要处理数百tb的数据来创建他们的地球系统建模模拟。迁移到云端可以让研究人员提出更多的问题,运行包含更多变量的模型,并更快地得到答案。
RM:云提供商如何保证他们的学术用户的安全,尤其是那些处理敏感数据的用户?
克鲁舍:数据安全和隐私在人类基因组学领域尤为重要。菲姆芬兰分子医学研究所(Institute for Molecular Medicine Finland)利用其云系统内置的身份和访问管理工具,帮助满足捐赠者、机构和欧盟对临床和生物数据进行身份识别的法规,同时在未来三年内扩大管理1.5 pb的基因组数据。
基于云计算的生物医学研究的创新也已经在改善临床实践埃默里大学使用云来建立实时患者数据的快速医疗互操作性资源(FHIR)数据库,并运行分析来帮助预测败血症的发作,败血症是一种每年影响75万美国人的潜在致命疾病。云平台使数据共享更容易,同时有助于确保私人健康信息更安全,并有助于遵守严格的HIPAA法规和机构标准。
虽然没有组织可以保证安全性,但与云提供商合作可以为组织提供显著的安全好处。云提供商能够雇佣和留住高技能的安全工程和运营团队,他们的唯一职责是确保他们和用户的数据安全。提供商的责任是保护所有底层基础设施,让客户专注于他们最了解的事情——保护和管理由正确的人访问他们的数据。此外,云提供商可以提供非常高级的功能,用户可能无法在自己的环境中获得或部署这些功能——例如,在谷歌cloud,我们默认情况下加密所有静态数据—很少有组织在自己的基础设施中实现这种功能。最后,大多数云提供商定期由第三方审计严格的国际安全和隐私标准确保他们遵循公认的最佳实践。
RM:数据共享是合作研究的核心部分。使用谷歌Cloud的研究人员可以轻松地将数据共享给使用其他平台的合作者吗?
克鲁舍:在密歇根大学基因组研究人员将他们的3pb数据转移到谷歌的云容器中,以便在全国各地进行的40项TOPMed精确医学研究中更容易协作和重现结果。使用GCP和谷歌的Preemptible vm可以加速他们的研究,简化部署,并降低成本。
其他研究人员哥伦比亚大学磁共振研究中心(CMRRC)正在利用GCP的可扩展性,将纽约市的五家研究机构连接到一个基于云的MRI研究中心,该中心在一个共享数据池中收集、处理、存储和分析高分辨率医学图像。从长远来看,云基础设施可能能够帮助CMRRC扩展这种与基于云的诊断和研究资源连接的分布式护理点模型,以创建一个全国和全球的诊所和实验室网络。
谷歌云平台使使用谷歌账户或其他类型账户的合作者可以轻松共享数据。根据研究人员想要如何配置他们的应用程序,可以使用消费者Gmail帐户、学校/组织附属的G Suite帐户和单点登录选项进行身份验证。
没有谷歌账户的合作者可以使用有时间限制的签名url,即使没有谷歌账户的用户也可以使用一段数据。最后,应用程序开发人员可以选择利用客户和合作伙伴的云身份,一个身份和访问管理系统,支持多种身份验证方法,如用户名/密码和社交网络登录。
Kevin Kells接受了Ruairi J Mackenzie的采访,他是技术网络的科学作家188金宝搏备用