《未来呼啸而来》中提出:未来的创新将不是单向式、重度垂直的。若干个重要领域的创新需求之间,会突然产生“叠加效应”,新的技术将以“叠加式创新”的方式,呼啸而来,改变我们的生活。
AI和大模型,正是这种带来巨大改变的指数级技术,同时也引发计算产业发生了翻天覆地的变化。
在2023年之前,通用计算产业一直处于波澜不惊的“慢速”创新节奏当中,以通用芯片迭代为主导的挤牙膏式的升级,每年仅能为计算产业带来大概10%的增量。而被大模型引爆的智算产业,两年内的需求几乎已经翻了一番。
新华三集团高级副总裁、云与计算存储产品线总裁徐润安表示,“智算时代最大的变化就是百花齐放,在基础设施层面,CPU和GPU都在发生裂变,从计算到存储新一轮的技术革新,带来了百花齐放的状态。”
可以想象,百花齐放的技术架构革新,带了更大的复杂性和不确定性,这会让“变化”来得更剧烈,但同时也孕育着新机会。
在变化中不断“进化”,这是新华三在智算时代,给出的答案。
时代之变
要做到在变化中进化,首先要抓住行业发展的大势。这也是在10月24日,新华三的智算新品以“乘势·进化·臻于智境”为题进行发布的意义所在。
当前最大的“势”,无疑是大模型技术引发的AI“风暴”。在应用端,人脸识别、自然语言、智能推荐等AI应用已经成为现实;在企业端,越来越多的企业将AI视为数智化转型的下一站,利用AI助力决策、重塑商业模式与生态系统、重建客户体验的例子比比皆是。
在应用全面AI化的背景下,则是AI算力的激增。IDC的数据显示:全球算力需求将以每年50%的速度增长,而AI应用驱动算力需求增长速度更快,预计到2030年,AI算力需求将比当前呈现上百倍的增长。同时,智能算力已经开始渗透到百行百业的方方面面。
徐润安表示,“智算需求的指数级增长,在潜移默化的影响着我们的生活。比如在广告业,AI互动的触达率比人工提高了80%;在高校,AI技术几乎成为所有科研项目必备的选项,未来AI应用会越来越广泛,反过来又会推动智算需求的增加。”
新华三集团高级副总裁
云与计算存储产品线总裁徐润安
智算应势而起,形成了一个与通用算力截然不同的赛道,异构算力是智算时代最典型的特征,这就是所谓的百花齐放的基础设施架构。
异构算力通常由CPU、GPU、FPGA、ASIC等不同的算力处理体系组成,这些不同类型的处理器各自具有独特的优势,能够满足不同场景中的应用需求。通过将它们组合在一起,可以实现计算资源的优化分配和高效利用,进而实现计算效力最大化。换言之,要发挥智算的最大价值,就必然要走通异构算力体系的路。
面对百花齐放的“时代之变”,徐润安坦言,最大的挑战就是要构建开放的平台,能够适应和兼容各种技术体系。同时还要通过智算平台,能够把这些技术传递给上层应用,赋能百行百业。“这既是新华三云与计算存储产品线的使命,也是我们要乘势、进化到达的一个更高境界。”徐润安说。
主动进化
达尔文在《进化论》中提到的:“自然选择是进化的动力。”新华三智算产品的进化,当然也是为了撬动客户的选择而来的。
新华三集团云与计算存储产品线副总裁刘宏程说:“我们预计,智算行业未来5年都会保持30%以上的增长率,训练的需求还远未到峰值,同时随着推理场景的逐步打开,需求仍会进一步释放。”
在此过程中,智算基础设施的发展脉络必然会沿着一条“可进化”的主线演进,开放、灵活、多元注定是客户选择智算产品的主要方向。
因此,新华三全新发布的H3C UniServer G7系列服务器,主打的就是多元异构的算力平台。它采用了先进的模块化设计,CPU/GPU/存储等子系统均可随需升级,以应对不同行业客户,在各种复杂计算场景下的多元化需求。
刘宏程表示,“当然伴随智算技术的革新,功耗过高导致的绿色节能瓶颈问题也非常明显,新华三服务器也做了一套集成式的冷板散热方案,把功耗降到最低。”践行ALL in GREEN战略,新华三G7产品家族也在液冷技术上多维进化,助力可持续发展目标。
刘宏程也提出,“智算带来的是从底层基础设施,到中间软件管理支撑的全方位变革。”这意味着要真正实现“内生智能”,硬件与软件不应该是割裂的。所以,新华三也推出了自研数据中心操作系统磐宁OS。通过高可靠、强性能、易维护的优势,可以满足云计算、数据库、大数据、人工智能等业务要求,目前已广泛应用于金融、政企、运营商等行业中。
在多元算力的丰富性上,新华三秉持训练和推理“两手都要硬”。比如AI算力旗舰 H3C UniServer R5500 G7支持万亿参数大模型训练,已覆盖超过15种主流开源大模型的训练;而AI训推一体引擎 H3C UniServer R5300 G7可同时搭载8块双宽GPU或16块单宽GPU,拥有广泛的模型兼容性,兼容超过200个主流AI模型。
我们谈AI基础设施,其实并不是泛指算力基础设施,还应该包含存储基础设施,这其实也是客户需要扭转的认知。
新华三集团副总裁、存储产品线总经理兼首席产品经理关天舒说,“存储是最底层的数据底座,既决定了智算系统的整体效能,更是确保客户数据安全性的‘重镇’。传统意义上客户选择存储阵列无论从对非结构化数据支持,还是扩展性上都不适合智算的要求,这需要结合客户的场景,结合算力和存储做全方位验证,给客户一个交钥匙工程。”
事实上,新华三早在三年前就认识到AI发展的趋势,同步规划了下一代存储软件平台的研发和设计,集结了近千名的研发人员,经历了三年的技术攻关,才让新一代AI数据存储平台H3C UniStor Polaris X20000得以问世。
据了解,Polaris X20000系列通过系统、体验、价值三方面重构。比如通过存储软件栈全面重构,可以满足智算应用海量小文件高性能并发和百TB级带宽需求;面向AI智算多样性数据处理,在AI大模型训练全流程中数据免搬迁并性能无损;同时,智算存储平台的可靠性从“数据级可靠”提升至“服务级可靠”,全方位满足智算场景客户的需求。
“从新华三的角度,在做好存储不变的稳定性和性价比的同时,我们更要看到客户真正的需求,把客户要的东西做好,来改变存储产品的形态,这是新华三在未来几年,持续不断去努力的方向。”关天舒说。
被动的改变叫颠覆,主动的改变才叫进化,新华三显然很好的诠释了进化的意义。
乘势而上
我们说,百花齐放的异构算力体系,是当下最大的挑战。
在异构算力体系建设过程中,涉及大量计算单元内部的信息交互,也形成了庞大的生态系统,除了多种类型的专用芯片之外,各种形态的交换机、光模块/线缆等连接介质,以及各服务提供商交付的算力运营、算力调度、算法交易平台相互交织,为算力体系的构建带来了巨大的复杂性。
“特别是要做好GPU之间的互通,没有开放标准的网络是无法做到的,同时各个厂商GPU的混合调度,没有好的AI服务器硬件框架和算力调度平台,也是无法实现的。”新华三集团云与计算存储产品线、云与大数据产品线首席产品经理王锋说。
这就是新华三之所以提出“算力×联接”概念的原因。通过算力方案与联接方案做调优和配合,通过端网协同、网算一体等技术带来智算效率的大幅提升,两者的深度融合带来的不是简单的叠加效果,而是倍增的效益。
换言之,“算力×联接”解决的不单纯是计算或联接的问题,而是通过计算和联接协调统一,让智算的价值最大化,而这也正是傲飞算力平台存在的价值。如今,傲飞算力平台也迎来升级,全面提升有效性、可靠性、稳定性及易用性,以高性能算力基础设施为依托,助力行业客户像用电一样,更普惠、更便捷的使用算力,加速AGI落地。
王锋表示,“傲飞算力平台是把新华三将‘算力×联接’的乘数效应发挥到极致的核心。我们也希望算力能够像水一样随取随用,希望每个人和企业都能在日常工作中就近获取低时延的高效算力。”
供给侧理论告诉我们,经济的平稳发展取决于经济中需求和供给的相对平衡。在百行百业智能化转型的背景下,AI应用的多姿多彩,市场规模的不断扩大,带来了对智算的巨大需求。
算力供给的程度,无疑决定了迈向智能化时代的速度,新华三智算战略及产品体系的不断进化,正是推动智算时代进步的底层逻辑。