我们已经更新了隐私政策为了更清楚地说明我们如何使用您的个人资料。

我们使用cookie为您提供更好的体验。你可参阅我们的饼干的政策在这里。

广告

20年后:高性能计算的发展


想要一个免费的PDF版本的这个行业洞察?

填写下面的表格,我们会将PDF版本的《20年来:高性能计算的演变》

188金宝搏备用科技网络有限公司需要您提供给我们的联系信息,以便就我们的产品和服务与您联系。您可以随时退订这些通讯。有关如何退订的信息,以及我们的隐私惯例和保护您隐私的承诺,请查看我们的隐私政策

以下文章是罗素·斯莱克(Russell Slack)撰写的一篇观点文章。本文仅代表作者个人观点,并不代表科技网络的官方立场。188金宝搏备用

高性能计算(HPC)是全球所有研究机构和工程业务的核心。然而,只是在过去的十年里,它才聚集了今天的势头,并彻底改变了我们解决世界上最复杂难题的方式。

如果我们回顾一下HPC的发展,它在大约20年前还处于萌芽阶段,刚刚开始站稳脚跟。环境的规模要小得多,很大程度上是一个隐藏的秘密,藏在橱柜里。

一种相对较小的资源,少数用户将用于特定的研究领域。这也是非常手工的。这些组件并不是专门为它们所用于的任务设计的。像用于加速计算的图形处理器和基于开放标准的高性能互连(如InfiniBand)这样的东西,当时还不存在。

在过去的几年里发生了令人难以置信的变化,所以让我们回到一切开始的地方。

一开始

回顾最初,HPC环境被称为Beowulf集群,本质上由第一代英特尔“pizzabox”服务器组成,服务器之间连接着100 Mb的网卡,在所有服务器上运行非常粗略的Red Hat Linux。

当时,构建和稳定这些集群是一项挑战,特别是当您在服务器之间包括尖端的高速互连时,这对电缆来说是一场噩梦。从软件的角度来看,它实际上是一套非常未开发的工具,用于发现、编排和管理系统,上面的软件应用程序在很大程度上是由客户自己开发的。

HPC也是一种只有最高级的Linux用户才会使用的研究工具。该工具相对未开发,并且主要是开源的。同时,就即将出现的CPU架构或网络互连而言,高性能计算技术不太容易预测。当然,GPU计算或HPC云爆发的概念在最初构建HPC系统时并不存在。

因此,它在很大程度上处于婴儿期,这带来了它自己在稳定性,性能和微调方面的挑战。然而,当这些问题被解决后,这种计算类型的早期采用者在寻求解决复杂问题方面取得了一些重大突破。

如今,开源社区和商业软件提供商已经投入了大量的精力,为日常系统管理员和最终用户提供工具,他们现在都可以快速地使用服务。这种易于访问和强大的管理工具绝对最大限度地利用了系统的每个空闲周期。这些成熟且得到广泛支持的工具现在为用户提供了高水平的服务利用率和灵活性,使用户能够动态地更改内容,以适应其工作模式的动态性质。

转换

这些年来,数据管理已经发生了翻天覆地的变化。存储最初直接连接到集群中的一个系统,但现在有了存储区域网络和互联网,数据可以无限共享,有助于促进协作工作。现在的建筑与几年前相比有很大的不同。我们以前工作用的是又大又笨重的设备,一旦它们坏了,就无可替代了。现在,如果集群的一部分损坏了,可以很容易地替换掉那一部分。20年前,互联网还不普及,但现在我们可以为客户提供云端高性能计算的好处,因此您甚至不需要拥有内部基础设施。

热头痛

显然,现在在一个更小的空间里有更多的东西,这对客户来说是很好的,因为他们不需要大量的数据中心空间来容纳这些野兽,但它确实为为系统提供大量的电力带来了麻烦,而且显然所有这些超级密集的计算基础设施都会产生大量的热量。

关于后一点,热管理多年来一直很有趣。在过去,我们不得不在IBM刀片中心安装巨大而笨重的空气挡板,试图将红色的热空气从集群中引导出去,这些演变成大量的排气管道,IT机架后门热交换器,在那里水不会被带到非常接近IT基础设施。在过去的几年中,我们一直在安装具有直接水冷却的CPU和内存的HPC系统。

支持

同样难以想象的是,当HPC处于起步阶段时,为HPC解决方案提供支持合同的概念甚至还不存在,客户甚至没有要求它。时代变了。传统上,它只是在移交给客户以管理和支持向前发展之前构建的基础设施。

多年来,随着客户在遇到服务问题时需要专门的技术支持而不断发展,近年来,这进一步演变为为客户提供托管服务支持的需求。

这只是个开始

随着技术和理解的发展,HPC服务的用例也在发展。它已经走了很长一段路,更像是一种满足所有密集计算需求的服务,而不是一个只有最先进的计算专家才能掌握和有效使用的系统。

现在,我们有机会获得一些最新兴的技术,通过创新的冷却,直接到硅胶水冷却,使高密度HPC解决方案的利用成为可能,包括gpu和专用硅胶。随着这些高效的设计和管理软件的进步,这些解决方案现在在整个组织中使用,特别是在这些资源不可用或不知道的学科中。现在,它通常是一个机构拥有的最大的研究工具之一——一个真正的企业产品——在未来20年里只会取得更大的进步。


作者简介:

罗素·斯莱克(Russell Slack)是OCF的总经理。

广告
Baidu