在3月落幕的“NVIDIAGTC”大会上,全球AI产业的前沿动态和未来趋势得以一窥。这场科技盛宴不仅为我们揭示了新技术的创新与新场景的落地,更为业界指明了发展方向。
借此东风,极智技术沙龙2024 AIGC创新创业新趋势专场也应运而生,旨在深入探讨AIGC的创业新动向。活动现场,西云算力CTO梁峰带来的主题演讲《面向应用,打造全系列全场景的智算基础设施》更是吸引了无数眼球,他的独到见解和前瞻性思维为与会者描绘了一幅智算基础设施的宏伟蓝图。
西云算力四大支柱:构筑AI算力的新高度
西云算力CTO 梁峰
在演讲中西云算力CTO梁峰为我们揭秘了公司在AI算力领域的最新进展。他详细介绍了公司的四大核心产品,包括计算、存储、网络及社区四大部分。
首先,梁峰重点强调了计算产品在公司战略中的地位。他表示,西云算力以GPU裸金属、云虚拟机和云容器等关键技术为基础,构建了一个功能全面的算力平台。这一平台为AI行业的训练和推理提供了坚实的支撑,尤其是他们打造的GPU算力集群,结合了深度优化的网络技术,确保了高效能的处理能力,成为了西云算力在计算集群方面的优秀产品。
紧接着,梁峰转向了存储产品。他特别指出,在AI训练过程中,高速并行的存储服务显得尤为关键,直接影响模型训练的性能表现。因此,西云算力推出了X-GPFS等高速存储解决方案,以满足用户在数据处理和分析方面的迫切需求。同时,为了满足不同场景的需求,公司还提供了全闪存储服务和对象存储,为客户提供了更加灵活和全面的存储选择。
当然,网络产品也是西云算力不可或缺的一部分。梁峰介绍,西云提供的公网带宽、VPN专网等网络服务,不仅保证了AI训练和应用中大数据传输的稳定性和安全性,更体现了公司对网络技术的深入理解和应用。在集群内部,西云算力基于InfiniBand/RoCE组建和调优的RDMA网络,有效解决了集群通信的拥塞等问题,进一步提升了GPU算力资源的利用效率。
最后,梁峰透露了西云算力与知名技术社区CSDN的合作计划。他们即将联合推出一个名为“尧米社区”的开发者社区,这个社区将成为AI从业者交流、学习和分享的重要平台。通过这个社区,西云算力期望能够推动AI技术的普及和应用,为整个AI行业的蓬勃发展贡献自己的力量。
丹摩智算平台:面向应用,打造全系列全场景的智算基础设施
西云算力面向开发者,推出了丹摩智算平台一期,后续,西云算力还将完善丹摩平台,打造一套面向应用的全系列、全场景的计算基础设施,旨在为用户提供高效、稳定的AI计算能力。
梁峰表示,丹摩智算平台主要分为几个层次。首先是基础设施层,这一层主要面向AI打造了一个AIDC(AI数据中心)。今年1月,西云算力交付使用了宁夏首个全自然风冷的30千瓦高功率机柜的AI数据中心产品。这种高密机柜设计不仅节省了空间,还提高了传输效率,同时实现了节能。与传统的数据中心相比,该数据中心采用了自然风冷等结构,使得能源效率提高了70%。
在基础设施之上,西云算力组建了一个大规模的算力集群。这个集群采用了先进的GPU芯片和RDMA网络技术,以确保集群的通信性能和效率达到最优状态。这不仅提升了算力的使用率,还降低了通信能源的使用。
在应用层面,丹摩智算平台提供了智渲、智训和智推三个核心模块。智渲模块专注于渲染市场,提供高效的渲染能力和优秀的用户体验。智训模块则为用户提供了一个全方位的训练平台,包括容器化服务、训练工具链等,以降低模型开发的门槛。智推模块则面向AI推理场景,为应用开发者提供高效的开发能力和便捷的工具使用。
智算中心:AI时代的“最强大脑”
会议期间,IT168记者有幸采访到了梁峰,梁峰强调,智算中心作为支撑人工智能应用的关键基础设施,远非简单的硬件设备堆叠,而是一个集高技术含量与全方位服务于一体的复杂系统,可以说是AI时代的“最强大脑”。其构建融合了顶尖的硬件基础设施、高效的软件平台以及多层次的服务能力,共同为AI的快速发展提供强有力的支撑。
智算中心的建设是一个持续优化的过程。为了应对日益增长的客户需求和技术挑战,研发团队必须不断投入研发力量,提升各层面的技术能力。这种持续的研发投入和技术创新,正是智算中心能够保持领先地位的关键。
相较于传统计算中心,智算中心在技术研发方面的投入更大、要求更高。这主要是因为智算中心不仅需要解决硬件和软件方面的技术难题,还需要应对AI应用带来的新挑战。但正是这种不断追求卓越的精神,使得智算中心能够为用户提供更加高效、稳定、灵活的算力服务,推动AI行业的持续创新和发展。
西云算力以其前瞻性的视野和坚实的技术基础,通过丹摩智算平台为用户提供了一站式的智算解决方案。从高性能的计算集群到灵活的网络服务,再到丰富的应用场景支持,西云算力正助力AI行业迈向更加广阔的未来。而其在生态建设和技术创新方面的持续努力,也必将为AI的普及和应用注入新的活力。