ollama v0.6.3正式发布！Gemma 3长上下文推理速度飙升，还有这些硬核优化！

moonfdd

2025-03-30 00:11 ·北京 ·优质互联网领域创作者

引言：

Ollama 团队刚刚推送了 v0.6.3 版本，这次更新聚焦Gemma 3 性能优化和用户体验提升，不仅解决了多个关键错误，还让长文本推理速度直接起飞！无论是开发者还是AI爱好者，这次更新都值得你立刻升级！

核心更新亮点：

1.Gemma 3 长上下文性能暴增

• 新增滑动窗口注意力（Sliding Window Attention）优化，长文本推理速度更快，内存分配更高效，尤其适合处理超长文档或代码。

2.加载速度提升

• Gemma 3 模型加载时间大幅缩短，告别漫长等待！

3.智能模板适配

•ollama create命令现在能自动识别并适配 Gemma 3 的 Safetensors 格式，无需手动配置，开箱即用！

4.关键Bug修复

• 修复talloc->buffer_id和sched->hash_set.size报错问题，运行稳定性再升级。
•ollama show -v现在能正确显示布尔值（true/false），调试更直观。

开发者必看：

•兼容性提示：ollama create现在会明确返回不支持架构的名称，避免无效操作。
•推荐动作：运行ollama update或前往官网下载最新版，即刻体验性能飞跃！

用户评价：

“v0.6.3 的 Gemma 3 优化太顶了！之前处理 10K token 的代码总要卡顿，现在流畅得像换了台机器！”——某AI开发者

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。欢迎关注“福大大架构师每日一题”，让AI助力您的未来发展。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴