为什么需要高性能计算?应用场景有哪些?

高性能计算是什么?

高性能计算是指将多个计算节点组织起来,通过网络连接在一起,进行协同工作,组成一台性能更强大的计算机,通常指具有极快运算速度、极大存储容量、极高通信带宽的一类计算机。高性能计算能够让整个计算机集群为同一个任务工作,以更快的速度来解决一个复杂问题。一台高性能计算上往往执行一个任务(或者有限的几个任务)。全部的计算机资源都被倾注到同一个任务中。为了解决同一个问题,集群的不同计算机之间要有非常好的沟通能力。高性能计算机是计算机和网络的结合。假设说互联网从外部将分立的计算机连接在一起,那么集群则是将网络内部化,让网络成为系统内部不同计算机的沟通桥梁。
在这里插入图片描述

高性能计算为什么重要?

高性能计算是计算机科学与工程的“皇冠”。高性能计算是计算机技术的源头之一。互联网产业依赖的数据中心的核心技术,诸如 Hadoop 等并行编程工具和 RDMA 等远程通信技术大多脱胎于此。因此,高性能计算机被视为计算机科学与工程的“皇冠”。

高性能计算的核心能力是 64 位双精度浮点运算能力。高性能计算是一种通用算力,其设计目标是提供完备、复杂的计算能力,在高精度计算能力更强。业界广泛用于衡量高性能计算性能的 Linpack 测试,测试的是高性能计算的“双精度浮点运算能力”,即 64位浮点数字的计算(FP64),这是一种高精度的数值计算。在以二进制所表示数字精度中,还有单精度(32 位,FP32)、半精度(16 位,FP16)以及整数类型(如 INT8、INT4)等。数字位数越高,意味着人们可以在更大范围内的数值内体现两个数值的变化,从而实现更精确计算。

高性能计算在底层芯片性能要求上高于普通的数据中心和智算中心。算力中心有多种,大致可分为数据中心、高性能计算中心、智算中心等,而它们都可以用云的形式来提供服务。以实现人工智能需求为例,推理、训练和模拟为 AI 的三类主要任务。在此维度上,芯片的应用上限由其底层构造所决定,即使采用软件优化也无法再提升。从芯片层面来看,如果底层芯片采用的是 CPU+专用 AI 芯片,那么其只能完成 AI 推理和训练任务,而无法完成模拟。因为 AI 芯片无法实现双精度浮点运算,双精度浮点运算大量涉及线性代数方程求解,而自然界的很多问题,包括科学问题、社会问题等,最后都可转化为线性代数方程求解问题。

高性能计算的体系结构设计和软件同样重要。芯片是高性能计算的重要组成部分,但不是高性能计算技术的全部。高性能计算不是简单的 CPU 堆砌,体系结构设计、高速互联网络、并行文件系统、储存列阵等方面如果有所欠缺,即使堆再多的 CPU,高性能计算性能也无法提高。随着计算能力的增强、应用课题规模和复杂度的增加,高性能计算机对并行文件系统等性能要求越来越高。高性能计算的技术溢出效益非常明显。由于服务器可以平滑地采用高性能计算的互联技术、CPU 技术、操作系统技术和并行软件设计等技术,在高性能计算方面的积累能够自然地溢出到服务器产业。

高性能计算平台在科研领域的应用

高性能计算已经成为衡量一所学校科研实力的最重要指标,高校其他各学科对高性能计算资源的依赖越来越强,需求递增攀升。

无论在国内还是全球,加强基础科研工作,都是高校的机遇、责任和使命。高性能计算已成为继理论和实验之后科学研究的第三大支柱,各学科对高性能计算资源的需求不断攀升。

高性能计算(High performance computing, 缩写HPC),指利用超级计算机实现并行计算,以处理标准工作站无法完成的数据密集型计算任务,常见的应用领域有仿真模拟、机器学习和深度学习等。

简单理解,高性能计算可以通过分布式计算实现单台计算机无法达到的运算速度,高性能计算系统的运行速度比商用台式机或服务器系统快一百万倍以上。原因在于高性能计算能够让整个计算机集群为同一个任务工作,以更快的速度来解决一个复杂问题。也正是因为此,在存储和处理海量数据,数据挖掘、图像处理和基因测序等场景里,如果想要获得突破性结果,高性能计算有时是唯一解法。

举例来说,人类首次尝试基因组测序耗时达13年,而如今,高性能计算只需要不到一天的时间内便可完成这项任务。从算力的目标和分类来看,高性能计算设计目标是提供完备、复杂的计算能力,范畴广阔,包含了超算,也包含了强调AI的智能计算。

在国内,由于成本高昂和应用领域有限,高性能计算目前主要应用于高校、科研机构以及大型制造业企业的研发侧。

建超算平台或者高性能计算平台,效率和稳定性是最关键的因素——科研计算任务有时需要历经数月甚至数年,因此,计算平台除了追求计算效率,还要尽可能降低计算过程发生故障的可能性。

另一个重要需求是节能。

这一需求可以通过两种可行的路径来满足:首先是使用软件。包括服务器内置的节能的软件和开源的第三方软件去对整个系统来进行节能。举例来说,高性能计算平台CPU的占用通常长期维持在一个较高的水平,软件则可以在CPU占用相对比较低的时候自动判断,让机器关机;其次是通过器件,即可以采用更高转换效率的电源和低损耗的材料来构建整个高性能计算的系统。

高性能计算在科研领域至关重要

在科学研究领域,AI for Science是近年来的新的研究风潮。传统科学计算不能满足Ai for science的需求,高性能计算可以,AI for science的兴起会提高对高性能计算的需求。

所谓AI for Science,即在科学计算中引入AI的方法,来进行科学研究——今天的通用人工智能,通过大数据、大算力和强算法,学会了没有教过它的技能,但这些技能仍是人类已掌握的。而未来,通用人工智能则是把人类的知识压缩给到计算机,通过新的技术和模型,继续训练人工智能,从而发现过去人类未知的领域。

AI for Science不仅可以帮助科学家解决已有的问题,也可以帮助科学家发现新的问题和方向。AI可以通过生成新的假设、设计新的实验、提出新的问题等方式,激发科学家的创造力和好奇心。例如,在医药领域,微软研究院科学智能中心(AI4Science)利用深度学习对药物分子进行生成和优化,从而加速药物开发和创新。在地球科学领域,美国国家气象局利用AI对气象数据进行预测和分析,从而提高灾害预警报和应对。

目前,全球各国大学都在高性能计算领域进行深度攻关,高性能计算(HPC)、理论、实验成为当今高校开展科学研究的三大支柱,尤其是高性能计算,已经成为衡量一所学校科研实力的最重要指标,高校其它各学科对高性能计算资源的依赖越来越强,需求递增攀升。

高校建高性能计算中心,是由高校进行科研创新、培养科研人才的切实需求决定的。高性能计算有助于推动科技创新能力的跨越式发展,要跨越式发展就一定要使用高性能计算进行突破。

中国高性能计算已经进入全球第一梯队,TOP100高性能计算机平均能力比全球TOP500平均能力高出30%。其中自主研发的集群占95%。

高校之外,高性能计算商用前景拓宽?

目前,我国高性能计算中心建设主要通过部省(市)合作协议确立高性能计算中心的建设计划,国家科技部代表国家科技战略对主机性能设定目标。地方政府希望高性能计算中心能成为区域科技发展的功能载体,为其聚集人才、创新科技并推动经济发展。

除了高校和科研机构,更广阔的使用前景理应是在产业。根据第三方机构统计数据,2022年中国整体高性能计算市场规模或超 400 亿元。除政府规划外,互联网巨头、运营商和硬件制造厂商均在均积极布局高性能计算建设。

随着高性能计算的发展,尤其是使用成本的不断下降,其应用领域也从过去传统的核武器研制、石油勘探、国防安全等专业领域向更广泛的制药、基因工程、动漫渲染、互联网等更“平民”经济领域延伸。利用高性能算力+专业数字研发平台+AI已经成为了新的趋势。

猜你喜欢

转载自blog.csdn.net/qq_23934063/article/details/131856721