人工智能 频道

新基建时代,联想HPC三大发展愿景有何看点?

  近年来,高性能计算(HPC)领域的技术正在从纯粹的计算技术向传统行业应用方向发展。

  以往HPC主要集中在传统行业领域的研究,如石油、气象、材料、物理和地球科学等。如今,随着HPC技术的快速发展,互联网与传统行业不断地渗透和融合,推动了工业4.0、智能语音、人脸识别等各个领域的快速发展。随着应用领域越来越广泛,HPC势必走入一个全新的时代。

  近日,CCF HPC CHINA 2020大会在郑州召开。本次大会主题聚焦“新超算、新基建、新经济”。为期三天的盛会全面回顾了2020年中国高性能计算领域的创新与实践,发布众多最前沿的科研成果,研讨高性能计算技术与应用的热点与难点问题,展望高性能计算未来发展的趋势与方向,为相关领域的学者、企业提供交流合作的机会,从而有力地推动中国高性能计算产业的发展。

  联想企业科技集团HPC&AI营销总经理于涛

  联想企业科技集团HPC&AI营销总经理于涛在大会主场进行了“联想超算赋能新基建,创造新价值”的主题演讲。在演讲中,于涛分享了联想近年来在HPC领域的一系列成就:2018年首次以140套的数量问鼎HPC TOP 500榜单全球先进,并且一直稳居榜首,在2020年6月HPC TOP 500刚发布的最新一期榜单中,联想的上榜数量达到了180套,占到整个TOP 500的303个领域,分布在全球20个国家和地区。

  对于联想HPC的发展方向,于涛分享了三个方向:开放、融合以及高效。

  基于客户需求,持续推动HPC与AI融合

  于涛以AI为例,分享了HPC的融合观点。

  科学计算的深入应用,深度学习驱动的人工智能,都正在重新定义HPC的创新和应用边界,唯有在强大的算力支持下,通过成熟的算法、大数据相结合,人工智能才能真正发挥效力。

  对于二者的融合,于涛强调了客户场景的驱动因素。因为HPC进行融合,是基于用户场景的不断复杂化:客户数字化转型过程中产生了大量新的数据,而这些数据后续在进行计算和分析的过程中,需要使用不同的软、硬件去应对,这也是HPC与AI融合背后的深层次原因。

  具体来说,在硬件层面联想坚持发展不同处理器的异构体系架构。最简单的例子,AI算法因为采用了深度学习的算法,用传统的CPU集群来处理是不适合的,联想的对策是通过发展与GPU相关的产品来解决这个问题。于涛表示,未来联想会在整个硬件的设计方面,着力发展不同的硬件技术去应对客户不同场景的复杂化。

  随着硬件的复杂化,自然也就带来了平台软件、硬件管理以及用户管理的复杂化,针对这个情况,联想推出了智能超算平台LiCO(Lenovo Intelligent Computing Orchestration),通过它,用户可以解决复杂场景下,对硬件管理和作业管理以及对整个计算过程进行管理。

  于涛特别强调,LiCO在通用技术平台的基础上做了场景化的优化,并没有为了融合而融合,基于对用户需求的理解,通过产品重构与创新,针对不同场景推出了多个LiCO版本,应对复杂用户场景下的多样化需求。

  技术驱动,以绿色赋能企业数字化转型

  对于超算赋能新基建的方式,就不得不提联想在数据中心领域的强大实力。在国内数据中心平均PUE高达1.9的大环境下,联想能够将传统数据机房PUE降低到1.1,这个数据带来的是高达每年42%的电费节省和相对应的污染物和二氧化碳排放降低,这背后就是联想的温水冷却技术。于涛透露,目前联想已在全球范围内累计部署超过40000个温水水冷节点,运行在全球十几家大型的超算中心。

  此次大会的一大亮点还集中在联想推出的最新一代海神水冷服务器。除了延续上一代海神水冷服务器50℃温水高标准不变外,为了提高系统的安全性,降低在大规模部署场景下和系统运行3年以上时可能出现的漏水概率,每个计算节点内采用了全铜管、硬连结的冷板,并且可以全面覆盖CPU、GPU、内存、SSD、网卡、PSU等功耗部件,从而在保证安全可靠的基础上,将整个超算中心的PUE降低到理想状态。

  同时,相较于上一代海神产品,联想对CPU的冷板通道也做了优化,从原来的水循环串行通过2颗CPU的模式改变为“并行通过”。这个升级可以保证一个节点内的2颗CPU都能保持在良好的散热环境下,确保可以发挥更好的性能而不受到温升的影响。

  此外,联想温水冷却技术与英伟达最新安培架构的A100 GPU的结合,可以说是本次新品披露最大的亮点。

  新经济、新基建带来了新需求、新机遇,高性能计算在增强算力方面有了更多用武之地和更大的发展潜力。未来,随着新基建项目的不断落地,超算中心将成为数字经济发展基石,在处理海量信息同时提供强大动能,全场景助推数字化建设,提速政府、企业和民众全面迈入智能时代:智能政务大厅,多部门实时联动,办事效率提升;超级算力,帮扶中小微企业提升科技场景开发能力;智能交通系统,实时数据解决交通拥堵现象……

1
相关文章