重磅更新！yolo v8.3.99发布：全球首个YOLOE开放词汇模型，支持文本/视觉提示！|yoloe|云计算费用|视觉|词汇模型

引言
“YOLO家族再添新成员！” Ultralytics官方最新发布的v8.3.99版本，正式推出YOLOE（YOLO Open-vocabulary Edition）模型，彻底打破传统目标检测的类别限制，支持开放词汇检测、分割、文本/视觉提示驱动任务！无论是自动驾驶、创意AI还是工业质检，YOLOE都能“见所未见”。

核心更新解读

1.YOLOE模型：开放词汇的终极武器

•无需预定义类别：直接通过**文本提示（如“一只戴墨镜的狗”）或视觉提示（参考图片）**检测任意目标。
•Prompt-Free模式：训练和推理均可脱离提示词，适应更广泛场景。
•SAVPE技术：全新空间感知视觉提示嵌入，让模型精准理解物体位置与语义。

2.⚙️ 开发者福音：兼容性与工具升级

•Docker支持JRE：新增Java运行时环境，解决Sony IMX模型导出兼容性问题。
•numpy版本锁定：避免依赖冲突，部署更稳定。

3.应用增强

•目标追踪优化：YOLO11示例代码升级，边缘案例处理+可视化效果全面提升。
•一键镜像同步：GitHub到DagsHub的仓库自动同步，开源协作更高效。

为什么YOLOE是革命性的？

传统YOLO需预先定义类别（如“猫、狗”），而YOLOE可动态响应任意文本或视觉输入：

•案例1：输入“路边损坏的消防栓”，直接定位城市中的破损设施。
•案例2：上传一张“复古电话”图片，模型自动搜索并分割相似物体。

️ 如何快速上手？

from ultralytics import YOLOE # 文本提示检测 model = YOLOE('yoloe-l.pt') results = model.predict('street.jpg', text_prompt=["骑自行车的人", "红色卡车"]) # 视觉提示分割 visual_prompt = 'reference_dog.jpg' results = model.predict('park.jpg', visual_prompt=visual_prompt)

生态与社区