ollama v0.13.0 发布：DeepSeek-OCR、Cogito-V2.1 全新支持，性能工具 Bench 正式上线|bench|csv|deepseek|image|ocr|引擎|新模型

2025 年 11 月 19 日，Ollama 发布了v0.13.0版本，本次更新带来了多个重要的新特性与性能优化，包括全新的DeepSeek-OCR模型支持、Cogito-V2.1模型上线、全新的性能基准测试工具Bench，以及一系列引擎与系统优化。以下是详细更新内容介绍。

一、新增模型 1. DeepSeek-OCR

DeepSeek-OCR 使用光学二维映射 (optical 2D mapping)技术压缩长上下文，在减少视觉 token 的同时，提升 OCR 精度，特别适合文档处理场景，实用价值显著。

该模型已在 Ollama 上支持，可通过以下示例调用：

ollama run deepseek-ocr "/path/to/image\n<|grounding|>Given the layout of the image."
ollama run deepseek-ocr "/path/to/image\nFree OCR."
ollama run deepseek-ocr "/path/to/image\nParse the figure."
ollama run deepseek-ocr "/path/to/image\nExtract the text in the image."
ollama run deepseek-ocr "/path/to/image\n<|grounding|>Convert the document to markdown."

2. Cogito-V2.1

这是当前美国公司发布的最佳开源权重指令调优生成模型之一，专注于高质量指令跟随与文本生成。

二、基准测试工具（Bench Tool）

Ollama 的 GitHub 仓库新增了Bench工具，用于测试模型性能。该工具基于Go语言构建，支持可配置参数与多种输出格式。

构建方式

安装 Go 后，在 Ollama 仓库根目录执行：

go build -o ollama-bench bench.go
./bench -model gpt-oss:20b -epochs 6 -format csv

无需构建可直接运行：

go run bench.go -model gpt-oss:20b -epochs 3

功能特点

• 支持单次运行基准测试多个模型
• 支持文本与图片 Prompt
• 可配置生成参数（temperature、max tokens、seed 等）
• 输出格式支持benchstat与CSV
• 提供详细性能指标，包括prefill、generate、load、total四类耗时

命令示例

• 基本测试：

./bench -model gemma3 -epochs 6

• 多模型测试：

./bench -model gemma3,gemma3n -epochs 6 -max-tokens 100 -p "Write me a short story" | tee gemma.bench
benchstat -col /name gemma.bench

• 图片 Prompt：

./bench -model qwen3-vl -image photo.jpg -epochs 6 -max-tokens 100 -p "Describe this image"

• 高级测试：

./bench -model llama3 -epochs 10 -temperature 0.7 -max-tokens 500 -seed 42 -format csv -output results.csv

性能数据示例（Markdown 格式）

Model

Step

Count

Duration

nsPerToken

tokensPerSec

gpt-oss:20b

prefill

124

30.006458ms

gpt-oss:20b

generate

200

2.646843954s

gpt-oss:20b

load

121.674208ms

gpt-oss:20b

total

2.861047625s

三、引擎与系统优化更新

1.DeepSeek-OCR 支持
2.DeepSeek-V3.1 架构支持于 Ollama 引擎
3. 修复Ollama 0.12.11在 CUDA 上的性能问题
4. 修复 Linux 安装包缺失 Vulkan 库的问题
5. 提升容器 / cgroups 环境下的 CPU 与内存检测精度
6. 改进 AMD GPU VRAM 信息检测方式
7. 优化 KV Cache 性能，不再需要碎片化整理

四、版本变更概要

• 引入 DeepSeek-OCR 模型及相关架构支持
• 上线 Cogito-V2.1 模型
• 新增 Bench 基准测试工具，支持多模型与多格式性能输出
• 多项引擎优化（CUDA、Vulkan、GPU、KV Cache 等）
• 系统检测能力增强（VRAM、CPU、内存）

总结

Ollama v0.13.0 在模型多样化、性能评测、底层优化等方面都有大幅提升，其中DeepSeek-OCR为文档和图像处理带来更高效的解决方案，Bench 工具让开发者能够科学评估模型表现。对于需要高精度 OCR、跨模态输入、多环境部署的用户来说，这次更新值得关注与升级。

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。欢迎关注“福大大架构师每日一题”，发消息可获得面试资料，让AI助力您的未来发展。

ollama v0.13.0 发布：DeepSeek-OCR、Cogito-V2.1 全新支持，性能工具 Bench 正式上线

热搜

热门跟贴

热搜

热门跟贴

相关推荐

摆在桌面的客机引擎，航发模型新境界

F-22战斗机启动引擎，一股青烟喷涌而出

一分钟狂擦 8000 次，引擎为啥不炸？

画面炸裂！曝《AC黑旗重制版》采用《影》同款引擎

OpenAI打广告后，如何成为爆款？CMU提出AutoGEO解密流量密码

景不动人动，OST-Bench揭示多模态大模型在线时空理解短板

AI能否「圣地巡礼」？多模态大模型全新评估基准VIR-Bench来了

一流湾区新出发 两会大家谈 | 科创动能激活香港发展新引擎

一杯酒，毁掉十几年控糖心血？63岁糖尿病老病号亲述“致命一饮”

8.37亿AI大单，百度拿下

谁在决定AI手机的未来：模型、系统，还是生态？

MIT新方法让两颗芯片共享唯一“指纹”，重写硬件安全规则

刚下飞机行李就没了！杭州姑娘花10多万去南极旅游却崩溃：衣物全靠借

通过视觉安全提示与深度对齐实现大型视觉语言模型的安全对齐

当千亿参数撞上5毫米芯片

架构解耦是统一多模态模型所必须的吗？全新AIA损失：No

汽车行驶途中突然"断电" 车辆瞬间失去动力一家人吓傻

黑马图像模型被Nano Banana技术负责人点赞！

央行行长：中国股票市场在全球主要股市中表现较好

机构：霍尔木兹海峡航运几乎完全停滞

一流湾区新出发两会大家谈 | 科创动能激活香港发展新引擎