零一万物正式宣布开源Yi-Coder系列模型,这是Yi系列模型家族中的编程助手,专为编码任务而设计。

打开网易新闻 查看精彩图片

Yi-Coder不仅是个强大的编程助手,还支持52种编程语言,无论你是前端、后端、还是数据分析,统统搞得定!

打开网易新闻 查看精彩图片

Yi-Coder 模型

Yi-Coder是专门为编码任务设计的AI模型,提供了1.5B和9B两种参数版本。特别是9B版本,在多个代码生成、理解、调试和补全任务中表现出了优异的性能。

打开网易新闻 查看精彩图片

Yi-Coder的核心特点

  • 小参数,强性能:Yi-Coder虽小,但在代码生成、理解、调试和补全任务中的表现非常优异,适用于移动端和本地环境部署,灵活易用,且在多个评测中表现超越同类10B以下的模型。

  • 128K长序列建模:Yi-Coder能够处理长达128K tokens的上下文内容,捕捉复杂项目中的长期依赖关系,非常适合处理复杂项目级代码的生成与理解任务。

  • 支持52种编程语言Yi-Coder覆盖了从Java、Python、C++到Verilog、Cobol等52种语言,不仅生成代码快,还能跨文件补全代码,满足多语言编程需求,适应多种开发环境。

模型成绩

在多个基准测试中,Yi-Coder的表现名列前茅,尤其是在LiveCodeBench的测试中,Yi-Coder-9B-Chat达到了23.4%的通过率,成为10B以下模型中唯一通过率超20%的选手。

打开网易新闻 查看精彩图片

根据零一万物的官方测试,Yi-Coder-9B-ChatHumanEvalMBPP基准测试中的通过率分别达到了85.4%和73.8%,在复杂代码任务中展现了强大的理解与生成能力。此外,Yi-Coder在CRUXEval-O评测中的准确率也首次突破了50%,在开源Coder模型中取得了领先成绩。

打开网易新闻 查看精彩图片

代码编辑与补全表现

Yi-Coder不仅在生成代码方面表现出色,在代码编辑与补全能力上也展现了极强的实力。在CodeEditorBench基准测试中,它在代码调试、优化、翻译等多个领域中均优于DeepSeek-Coder-33B-Instruct和CodeQwen1.5-7B。

尤其是在跨文件代码补全任务中,Yi-Coder能够有效处理复杂代码库中的依赖关系,凭借强大的长序列建模能力,在有无检索上下文的两种情况下均表现优异,进一步验证了它在复杂项目中的实用性。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

长序列建模与数学推理

Yi-Coder在处理128K长序列的“Needle in the code”测试中表现完美,展示了其卓越的长序列理解能力。

打开网易新闻 查看精彩图片

在数学推理任务中,Yi-Coder的代码辅助(PAL)解题能力表现也非常强劲,准确率达到了70.3%,超过了DeepSeek-Coder 33B的65.8%。

打开网易新闻 查看精彩图片

试想一下,未来的编程世界,每个人都能通过AI轻松实现自己的创意。不论是开发应用、创建网站,还是进行数据分析,只要你会描述想法,AI就能帮你完成编程。