人工智能 频道

西云算力CTO梁峰:以算力效率革命重塑AI未来

  【IT168】在人工智能技术狂飙突进的当下,算力已成为驱动AI发展的核心“燃料”,而如何让算力更高效、更普惠,则是行业竞争的关键命题。作为国内领先的算力服务商,西云算力凭借其自研引擎技术与开源生态布局,正在探索一条独特的路径。

西云算力CTO 梁峰

  近日,西云算力CTO梁峰接受IT168记者专访,从技术优化到行业落地,深度解析了西云算力如何通过支持DeepSeek等大模型,推动AI基础设施的变革。

  算力效率革命:从硬件适配到场景化调优

  “算力利用率(MFU)的提升,本质上是技术与场景的深度耦合。”梁峰在谈及西云算力的技术策略时强调。在支持DeepSeek模型的训练与推理过程中,西云算力选择了一条“兼容并优化”的道路。

  面对市面上多样化的硬件环境,无论是英伟达H系列的高性能显卡,还是存量庞大的A800等A系列显卡,乃至国产硬件,西云算力都通过精细的参数调优与自研引擎适配,力求最大化利用每一份算力资源。梁峰举例说:“DeepSeek满血版对算力需求极高,在H系列显卡上表现尤为出色。但考虑到A系列显卡的广泛市场应用,我们通过调整各种参数、优化引擎等方案,确保不同硬件都能发挥出良好的性能。另外,DeepSeek开源了不少性能优化方案,我们也会在集成后观察效果。如果客户对于模型质量要求不是特别高,对成本更加看重,我们也会提供蒸馏模型对应的高性价比方案。除了技术考量,也需要结合客户需求的场景,给到客户更加合理的选择。”这一策略不仅有效缓解了当前算力短缺的问题,还为客户提供了更为经济高效的部署方案。

  谈及场景化调优,梁峰进一步阐述道:“场景化调优的核心在于精准把握应用场景的特定需求。比如,数学逻辑处理与艺术创作,这两类场景对参数的要求截然不同。我们需要根据场景的具体需求,对参数进行精细调校。另一方面,不同场景对输入输出的token数也有不同要求。有的场景可能需要处理长达1000字的输入,并生成超过1万字的输出。在这种情况下,西云算力的策略是相应增大相关参数设置,尽管这可能会牺牲一些并发性能和每秒输出指标。但反过来,对于那些对输入输出要求不那么严格的场景,可以通过调整参数,提升并发能力和每秒处理速度。”

  丹摩智算平台如何用DeepSeek开源模型撬动垂直AI市场

  梁峰提到,vLLM、SGLang等开源推理引擎已成为支撑DeepSeek高效运行的核心工具,而DeepEP、DeepGEMM、PD分离等官方优化方案的快速集成,进一步降低了延迟与成本。 “开源不仅是技术共享,更是生态共建。”梁峰在谈及DeepSeek的开源策略时表示。西云算力正积极通过丹摩智算平台与DeepSeek开源模型的结合,降低AI使用门槛,并推动技术向医疗、游戏等垂直领域渗透。

  丹摩智算平台目前汇聚了众多开发者用户,其核心价值在于“开箱即用”。梁峰透露,平台会3月上线DeepSeek的API服务,支持开发者直接调用“满血版”或轻量版模型,同时提供硬件兼容性调优与成本优化方案。“过去,闭源大模型的定价让中小企业望而却步;而DeepSeek的开源让我们能将推理成本大大降低。”这一变化直接推动了AI在客服、营销等场景的规模化落地。

  对于DeepSeek未来技术的爆发点,梁峰提到了医疗与游戏两大领域。在医疗场景中,DeepSeek已展现出辅助诊断、治疗方案推荐的潜力。“例如,医生可通过模型快速获取最新医学指南,减少因经验不足导致的误诊。尽管医疗合规性要求严格,但简单疾病的初筛与患者教育已具备落地条件。”而在游戏行业,DeepSeek的剧情生成与文案创作能力正在被重新定义。“开发者输入一段世界观设定,模型即可输出完整的剧情框架,甚至细化到角色对话——这在过去需要数周的人力投入。”

  采访最后,梁峰特别强调了DeepSeek 在AI Agent(智能体)的突破性意义。“传统大模型停留在‘问答’层面,而基于DeepSeek开发的Agent能直接完成行动。”他以某通信客服场景为例:过去,AI只能告知用户“关闭套餐需执行12345步骤”;如今,通过Agent技术,用户可直接在对话中完成身份验证、套餐关闭、评价反馈等全流程操作。“这不仅是效率的提升,更是用户体验的重构。”西云算力正在与多家企业合作探索,计划将Agent能力嵌入工业故障诊断、金融合规审核等复杂流程中。

0
相关文章