DeepSeek联合北大发布DSpark推测解码技术,开源全栈工具库DeepSpec
6月27日,DeepSeek团队联合北京大学正式发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,距离其6月中旬完成500亿元融资仅十余天。
此次发布并非模型版本升级,而是在现有DeepSeek-V4-Pro与DeepSeek-V4-Flash架构基础上,新增轻量级、高精度的推测解码(Speculative Decoding)模块,聚焦于推理效率提升与工程化落地优化。
随论文同步开源的DeepSpec,是一个面向推测解码的全栈开源工具库,涵盖数据预处理、草稿模型实现、分布式训练脚本及标准化评估流程,采用宽松的MIT许可证。当前已集成DSpark、DFlash与Eagle3三种主流推测解码方案,支持快速复现与定制化扩展。
尤为引人关注的是,DeepSeek创始人梁文锋位列该论文作者首位。在公司完成重磅融资的关键阶段,创始人仍深度参与核心算法研究与论文撰写,展现出罕见的技术领导力与工程坚守,在当前AI创业生态中实属难得。
