一个全球HPC-Powered自然灾害研究中心
考虑到加快气候变化的速度,比赛也在寻找更好的方法来预测自然灾害的影响,减少他们的损失,并使更快、更有针对性的复苏。风暴在2018年,迈克尔是最强的飓风袭击美国大陆自1992年以来,最强的袭击佛罗里达狭长地带。佛罗伦萨飓风,这冲击了迈克尔,前几周是历史上最严重的暴雨影响整个美国东海岸。此前2017年大西洋飓风季节,17个被命名的风暴,导致超过3000人死亡和2650亿美元的损害赔偿。
但比赛对抗气候变化不需要研究人员之间的比赛。如果研究人员合作,他们可以避免不必要的重复工作,利用一组公共的数据,分享工具,扩大彼此的工作,并应用相同的度量,定义和标准——所有这些加快研究的步伐和速度,研究拯救生命和财产。
研究人员想要回答的问题包括:
•给定一个特定的风暴潮,风速和风向,而建筑的位置可能会经历洪水或风害,和多少钱?
•如何将不同的建筑方法和材料承受不同的影响(风暴潮、大风等)?
回答这些问题具有真正的现实后果的能力。举个例子,如果你能准确地模拟洪水条件飓风的预计影响区内然后可以预警应急管理者优先考虑特定建筑物下的救援工作。这将减少风暴受害者的时间等待被拯救而反应他们不需要搜索搜索区域。
DesignSafe背后的想法,在美国一个基于web的研究平台基于自然灾害工程研究基础设施(NHERI)。DesignSafe使研究人员管理、分析和关键信息了解自然灾害——从地震和飓风和龙卷风灰岩坑。这个平台是由从美国国家科学基金会(NSF)资助,由得克萨斯高级计算中心(TACC)和Cockrell工程学院在德克萨斯大学奥斯汀分校合作伙伴莱斯大学和佛罗里达理工学院。
基于云计算的研究平台
DesignSafe是一个基于云计算的平台,其主要目的是汇集在一个地方进行所需的资源和协作对自然灾害的研究:
•一个中央存储库能够持有大量的现场数据收集实地调查在飓风的影响
•图书馆先进的映射、可视化仿真和数据分析工具,用户可以对任何数据在存储库中直接应用
•高性能计算资源提供的得克萨斯高级计算中心(TACC)包括Stampede2 18 petaflop戴尔提供的系统EMC,包含Intel Xeon处理器可伸缩和英特尔Omni-Path架构
•虚拟社区频道在松(一种基于云计算的协作工具)用来协调现场调查和研究活动
•项目研究人员可以在门户发布研究结果,包括正式的研究论文支持数据和代码,如Matlab或Python脚本
除了实地勘查研究,DesignSafe还支持许多其他类型的研究,包括实验和数值模拟的项目。
DesignSafe行动的一个很好的例子是在佛罗伦萨飓风当研究人员使用这个平台来捕获和分析大量的个人受损建筑物的调查和收集照片——所有这些通过DesignSafe侦察团队的努力协调。
高性能计算的挑战
助理教授大卫•Roueche奥本大学土木工程是研究人员协调,努力之一。他说,这种调查的复杂性和规模方面的团队和数据——需求集中的方法以高性能计算为基础。
“这些数据集越来越巨大,所以能够处理和利用高性能计算是关键。佛罗伦萨飓风我们收集超过三百字节。这对每个人来说都是不可行的数据量上来回分享他们的个人工作站在试图沟通。这是一个更有效的过程在中心主机和处理数据,不用担心下载你的分析。你可以做所有的云通过DesignSafe和TACC。”
正如DesignSafe使跨合作者共享工作更有效率,它同样工作在数据和应用程序,Roueche博士说。
“我已经做了一些工作,例如,标注照片,包括无人机的照片使用HazMapper(基于web的应用程序,用于创建、可视化和分析地理空间数据由DesignSafe团队开发)。我可以直接从DesignSafe图像数据导入HazMapper快速可视化,我们收集的照片,然后使用HazMapper输出作为参考其他因素我们看从另一个数据库。优点是我们可以直接连接这些点之间的一个研究领域,另一个。”
DesignSafe的另一个好处是研究者的能力建立在彼此的工作,加速研究两个方面:首先,通过添加知识,其次,通过简化研究过程本身。Roueche博士说,一个很好的例子是使用TACC的超级计算机创建机器学习算法来自动标记灾难图片所以他们不必手动标记后未来的灾难。
“我们收集所有这些照片灾后从本质上,我们试图解析工程失败,并与那些失败的风暴条件的建筑。在目前的这个过程是手动完成的,但我们同时创建大型集带安全标签的数据时,可以使用其他机器学习训练或深度学习进程来自动识别建筑属性从照片。所以一旦我们创建了这个巨大的标签数据集,别人可以很容易地访问它和用它来开发新的算法。这反过来会导致一个更高效的过程,同样,真的说为什么我认为DesignSafe将加速研究在很多不同的方式”。
大规模推广质量控制
这样的解决方案,加快研究是必要的;考虑到大量的数据收集和分析研究人员面临的挑战。
“当你想到灾难像飓风迈克尔,“Roueche博士说,“有成千上万的结构破坏和影响。所以,我们怎么可能有几个研究团队走出去,不仅收集数据,收集足够数量的数据代表的实际条件,不同的结构类型,每个人都经历过的危险条件,然后还做,之前所有得到清理和修理吗?所以这种平衡:我们如何收集尽可能多的数据,尽快,然后还能够处理,到一些有用的东西,复苏的社区可以使用?”bet188真人
添加到数据收集的挑战是确保数据捕获的挑战以一致的方式在不同的时间由不同的人员,从不同的调查和数据从不同的研究可以组合和相关的见解。
“我们试图做在我们的方法中,“天Roueche博士”不仅包括原始数据,照片,笔记,等等,但也包括处理CSV或JSON文件中的数据。例如,对于每一个结构我们调查的纬度和经度的实际结构,以及所有照片的纬度和经度的结构。我们也QC会或双重检查评级——即我们所有的伤害。,因为没有伤害,轻微、中等、严重,随访或销毁,确保一致的标准。我们发布这些标准。我们回去和QC将我们所有的值来确保我们跟踪的标准数据集出版。我们定义损害个人房屋构件,如屋顶、墙壁和窗户或门,所以研究人员研究这些单个组件可以快速解析所需的数据。我们也从公共记录附加建筑聚合数据属性,如年建造,建筑材料,屋顶形状,更多的建筑性能可以在正确的上下文中进行分析。”
这样的质量控制等大规模并不实用要不是DesignSafe提供的稀有资源的组合,Roueche博士说。“关于平台集成,研究社区,推动参与来自美国国家科学基金会,然后仿真,计算设施,以及存储库,和出版能力——是的,这组合是非常独特的。”
他继续说:“大多数大学研究员在存储库,可以举办自己的数据集;在大多数大学高性能计算中心,可以模拟运行。但在DesignSafe之前,没有一个中央枢纽,自然灾害从任何大学的研究人员可以去找到数据集,协作,模拟运行。所以,如果我不使用DesignSafe,那么我可能不会达到我的全部潜力方面能够合作和分析和共享数据和最大化数据的潜力。”
一个新边疆
DesignSafe之前“根据我的经验,这是一个有点狂野西部的研究社区一个破坏性的自然灾害事件后,“Roueche博士说。“你有多个团队到这些灾难现场,也许你知道别人,也许你没出去。但通常不太协调。你倾向于做自己的事情。这是竞争力。好像人员试图让自己的数据,最终抓住它,然后分析和发布它在其他人之前就得到信贷。而现在,通过DesignSafe中央枢纽,并强调更开放的数据来自美国国家科学基金会资助机构,似乎是有一个快速变化的模式和一个新的集成数据收集和共享的过程。”
集成的水果包括更快,更有效率,更有益的研究工作为自然灾害的影响,像飓风一样。
“我们当然可以回顾并指出明确的步骤的进展,我们已经能够制作,“Roueche博士说。“我们协调和沟通更好的所以没有重叠。我们扩展我们的报道。我们使用一致的数据收集和数据标准我们获得更高的质量和更一致的数据集的更广泛的报道。我们涉及的研究团体成员就不会参加。所以,我们扩大我们的社区。扩大我们的影响力。扩大的数量和质量,我们收集的数据。最终,我们正在扩大对社会影响的研究。我可以指出DesignSafe,它的功能,作为一个巨大的一部分。”
兰德尔·克朗克greatwriting的主人,LLC的技术营销写作公司在波士顿,马萨诸塞州。
# # #
本文是作为英特尔的HPC编辑程序的一部分,强调目标的尖端科学研究和创新驱动的HPC社区通过先进的技术。出版商的内容拥有最终的编辑权限,并确定哪些文章发表。