西云算力CTO梁峰：以算力效率革命重塑AI未来-人工智能专区

西云算力CTO梁峰：以算力效率革命重塑AI未来

作者：卢敏编辑：卢敏 2025-03-13 16:44 IT168网站原创

　　【IT168】在人工智能技术狂飙突进的当下，算力已成为驱动AI发展的核心“燃料”，而如何让算力更高效、更普惠，则是行业竞争的关键命题。作为国内领先的算力服务商，西云算力凭借其自研引擎技术与开源生态布局，正在探索一条独特的路径。

西云算力CTO 梁峰

　　近日，西云算力CTO梁峰接受IT168记者专访，从技术优化到行业落地，深度解析了西云算力如何通过支持DeepSeek等大模型，推动AI基础设施的变革。

　　算力效率革命：从硬件适配到场景化调优

　　“算力利用率（MFU）的提升，本质上是技术与场景的深度耦合。”梁峰在谈及西云算力的技术策略时强调。在支持DeepSeek模型的训练与推理过程中，西云算力选择了一条“兼容并优化”的道路。

　　面对市面上多样化的硬件环境，无论是英伟达H系列的高性能显卡，还是存量庞大的A800等A系列显卡，乃至国产硬件，西云算力都通过精细的参数调优与自研引擎适配，力求最大化利用每一份算力资源。梁峰举例说：“DeepSeek满血版对算力需求极高，在H系列显卡上表现尤为出色。但考虑到A系列显卡的广泛市场应用，我们通过调整各种参数、优化引擎等方案，确保不同硬件都能发挥出良好的性能。另外，DeepSeek开源了不少性能优化方案，我们也会在集成后观察效果。如果客户对于模型质量要求不是特别高，对成本更加看重，我们也会提供蒸馏模型对应的高性价比方案。除了技术考量，也需要结合客户需求的场景，给到客户更加合理的选择。”这一策略不仅有效缓解了当前算力短缺的问题，还为客户提供了更为经济高效的部署方案。

　　谈及场景化调优，梁峰进一步阐述道：“场景化调优的核心在于精准把握应用场景的特定需求。比如，数学逻辑处理与艺术创作，这两类场景对参数的要求截然不同。我们需要根据场景的具体需求，对参数进行精细调校。另一方面，不同场景对输入输出的token数也有不同要求。有的场景可能需要处理长达1000字的输入，并生成超过1万字的输出。在这种情况下，西云算力的策略是相应增大相关参数设置，尽管这可能会牺牲一些并发性能和每秒输出指标。但反过来，对于那些对输入输出要求不那么严格的场景，可以通过调整参数，提升并发能力和每秒处理速度。”

　　丹摩智算平台如何用DeepSeek开源模型撬动垂直AI市场

　　梁峰提到，vLLM、SGLang等开源推理引擎已成为支撑DeepSeek高效运行的核心工具，而DeepEP、DeepGEMM、PD分离等官方优化方案的快速集成，进一步降低了延迟与成本。 “开源不仅是技术共享，更是生态共建。”梁峰在谈及DeepSeek的开源策略时表示。西云算力正积极通过丹摩智算平台与DeepSeek开源模型的结合，降低AI使用门槛，并推动技术向医疗、游戏等垂直领域渗透。

　　丹摩智算平台目前汇聚了众多开发者用户，其核心价值在于“开箱即用”。梁峰透露，平台会3月上线DeepSeek的API服务，支持开发者直接调用“满血版”或轻量版模型，同时提供硬件兼容性调优与成本优化方案。“过去，闭源大模型的定价让中小企业望而却步；而DeepSeek的开源让我们能将推理成本大大降低。”这一变化直接推动了AI在客服、营销等场景的规模化落地。

　　对于DeepSeek未来技术的爆发点，梁峰提到了医疗与游戏两大领域。在医疗场景中，DeepSeek已展现出辅助诊断、治疗方案推荐的潜力。“例如，医生可通过模型快速获取最新医学指南，减少因经验不足导致的误诊。尽管医疗合规性要求严格，但简单疾病的初筛与患者教育已具备落地条件。”而在游戏行业，DeepSeek的剧情生成与文案创作能力正在被重新定义。“开发者输入一段世界观设定，模型即可输出完整的剧情框架，甚至细化到角色对话——这在过去需要数周的人力投入。”

　　采访最后，梁峰特别强调了DeepSeek 在AI Agent（智能体）的突破性意义。“传统大模型停留在‘问答’层面，而基于DeepSeek开发的Agent能直接完成行动。”他以某通信客服场景为例：过去，AI只能告知用户“关闭套餐需执行12345步骤”；如今，通过Agent技术，用户可直接在对话中完成身份验证、套餐关闭、评价反馈等全流程操作。“这不仅是效率的提升，更是用户体验的重构。”西云算力正在与多家企业合作探索，计划将Agent能力嵌入工业故障诊断、金融合规审核等复杂流程中。

关注我们