DeepSeek联合北大发布DSpark框架:大模型推理速度提升60%–85%

百科 2026-06-29 11:44:52 5

6月27日,联合理速DeepSeek团队与北京大学联合发布《DSpark》研究论文,发布该成果聚焦于推测解码(Speculative Decoding)领域,框架提出了一种革新性的大模度提方法以大幅加速大语言模型的推理过程。

针对现有并行“草稿生成”技术中因Token间关联性薄弱导致拒绝率升高及验证算力浪费的型推问题,DSpark创新性地引入了半自回归架构。升–通过在并行生成主干中嵌入轻量级顺序模块,联合理速该框架有效强化了Token间的发布依赖关系,从而显著提升了草稿生成的框架质量。

此外,大模度提DSpark构建了“基于置信度的型推动态验证机制”。该机制能够根据请求的升–成功概率及系统实时负载,自适应地调整验证长度,联合理速进而最小化无效计算开销。发布离线测试数据显示,框架该方法大幅增加了可接受的生成长度;而在DeepSeek-V4线上部署中,相较于基线模型,推理速度实现了60%–85%的显著提升,并有效缓解了高并发场景下的吞吐量衰减问题。

为促进行业技术演进,论文已同步开源模型检查点及训练框架DeepSpec,旨在推动社区在相关方向的深入研究。

本文地址:https://www.dr-wine.com/html/87e399909.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

为了嫁50亿富豪,狠心抛弃同居5年的周一围,现今童蕾后悔了吗?

省钱,我只服梁文锋

图灵量子创始人金贤敏:如果能源和算力没突破,人类只能在地球上如蝼蚁般生活

拆解易立竞访谈:如何托举花几亿都扶不起的向佐

拉加德警告:AI可能引爆下一场金融危机

下周一起,北京尾号限行轮换!

张海宇:不撕标签,只塑角色

一条普通打底裤,撕裂了性别与时代的尊严战场?

友情链接