当行业在讨论谁的模型更聪明时,DeepSeek仍然把目光投向更现实的问题:如何让模型更快。
6月27日,DeepSeek官方在Github低调更新了一篇最新论文,介绍其推理加速框架DSpark,试图解决大语言模型在高并发场景下的推理效率瓶颈。 从作者署名来看,这篇论文由DeepSeek与北京大学联合发布,DeepSeek创始人梁文锋也位列作者名单。在论文中,团队开源了DSpark模型权重,并同步发布了面向推测解码、由算法驱动的训练代码仓库DeepSpec。
6月27日,DeepSeek官方在Github低调更新了一篇最新论文,介绍其推理加速框架DSpark,试图解决大语言模型在高并发场景下的推理效率瓶颈。 从作者署名来看,这篇论文由DeepSeek与北京大学联合发布,DeepSeek创始人梁文锋也位列作者名单。在论文中,团队开源了DSpark模型权重,并同步发布了面向推测解码、由算法驱动的训练代码仓库DeepSpec。
