人工智能 频道

2025年度IT168技术卓越奖名单:人工智能类

      技术卓越奖:深度求索DeepSeek

  一句话点评:被权威机构评价为算力生态关键推动者,通过FP8格式标准革新和TileLang编程框架及预置SGLang、vLLM等推理框架内核,带动国产芯片设计优化。

  技术卓越奖:深度求索DeepSeek

  产品介绍:DeepSeek是深度求索(DeepSeek)公司发布的大模型,包含日常场景推理版本DeepSeek-V3.2和长思考增强版本DeepSeek-V3.2-Speciale。该模型获得十五五政策重点支持,通过国家算力互联网实现算力互联互通,并参与数据要素开发利用政策试点。其采用CUDA/TileLang双版本GPU算子架构,支持160K超长上下文处理能力,寒武纪、昇腾、海光等国产芯片厂商实现Day 0适配,通过华为云、魔搭等平台完成适配。模型引入TileLang编程语言构建硬件调度层,并采用自研UE8M0 FP8新型数据格式。

        2025年9月29日发布的实验版本DeepSeek-V3.2-Exp将API服务价格下调超50%,输入(缓存命中/未命中)价格分别降至0.2元/百万tokens和2元/百万tokens,输出价格降至3元/百万tokens。同年12月1日,正式版DeepSeek-V3.2和临时API开放的Speciale版本完成全平台更新。基于该架构开发的开源数学专用模型DeepSeekMath-V2于11月27日发布,在国际数学奥林匹克竞赛评测中取得金牌成绩。同年12月,该模型逐步接入腾讯生态,与腾讯混元2.0共同应用于元宝、ima等AI应用。

  获奖理由:DeepSeek-V3.2采用自研UE8M0 FP8新型数据格式,通过8位全指数位分配机制实现存储效率提升。该格式通过分块缩放保持FP8表示范围,成为首个将FP8混合精度训练应用于开源超大规模模型的技术方案。  

0
相关文章