高性能计算(HPC)社区近年来一直由追求Exascale系统——也就是说,系统能够至少一个exaflop,或每秒十亿次计算。在这个追求利益或多或少的被噪声淹没在计算机行业人工智能(AI)和机器学习(ML)在过去几年。追求exascale结束了吗?
人工智能这个词,“智能”这个词一样,嵌进我们的文化和亚马逊和谷歌等互联网巨头扩展艾未未的进入我们生活的每个角落和缝隙。所有这一切的背后,是巨大的计算资源,这在几年前是域的中央处理单元(cpu),但今天NVIDIA及其图形处理单元(gpu),在某种程度上,现场可编程门阵列(FPGA)当家在这个新世界的神经网络,如苹果的Siri。
gpu处理器通常运行的图形系统。CPU提供所有系统的主要功能,如运行Word或Excel,但不画图画;这一任务的GPU。当运行复杂的图形,例如计算机辅助设计(CAD)或视频游戏,需要运行一个专用的GPU。就在十年前,他们发现这些gpu可以把其他任务而不是创建和渲染图像,它们可以用于加速复杂的计算。GPU是固定电路“一成不变”的设计。fpga是类似于gpu但不是固定的,而可编程,可以改变依赖于加载任务和编程。
gpu和fpga符合HPC怎么样?电脑芯片制造商没有站在悠闲地。IBM的POWER9服务器,加上NVIDIA gpu的更紧密的集成,产生了一个计算引擎,将权力两个地球上最快的系统——峰会和塞拉超级计算机将在今年投入使用。
手臂正在进入传统数据中心和高性能计算市场,随着镉ThunderX 2获得牵引力。富士通已经计划使用手臂的力量Post-K机预计2020年,承诺1000每秒的野兽。
英特尔在市场上继续进步的x86处理器和似乎丢弃Xeonφ,滚动功能从φ处理器进入Xeon处理器,例如,AVX512特性。AVX512事实上AVX在处理器的指令集,利用向量元素的处理器。英特尔收购什么Altera FPGA制造商,英特尔最昂贵的购买日期吗?这意味着fpga必重因素到英特尔的产品。
这些企业将受益于记住exascale目标,因为他们都消耗大量的电力。好消息是,我们可以看到,每个项目都是打入生产更好的性能在一个更小的包。詹森黄,NVIDIA的总裁兼首席执行官表示,“gpu你买的越多,你越保存”,指的是他公司的新DGX-2取代300与单个DGX-2双cpu的服务器系统。很明显,节能潜力巨大的规模。
但仍然本身并不是所有应用程序移植到GPU使用。Exascale将通过处理器技术的混合物;CPU的协助下加速器(gpu或别的)作为数据gpu必须喂他们主机的CPU系统和通信系统的其余部分,存储管理等。
很多技术中使用人工智能还可以使用在HPC gpu, cpu和互连技术自然让自己在HPC或人工智能应用程序使用。我相信即使fp16 / fp32张量核心,深度学习专用处理器的优化应用程序,将在未来的应用程序。
人工智能带来了一种新的用户HPC提供者和non-computing熟练用户。例如,英国研究人员希望扫描所有文件是否一个特定的作者写了整个的作品,或者如果一个大学生从网上抄袭文本。野生动物园最近雇佣毫升天体物理学技术来识别遥远恒星的温度和化学成分,这样他们可以定位和计数濒危动物藏在布什和帮助游戏储备。人工智能和ML开放新的计算途径没有传统HPC的用户。
因此,回到我原来的问题,Exascale结束了吗?Exascale目标并没有消失,它只是似乎隐藏的AI的吸收。