阶跃开源了 GELab-Zero,让 AI 操作你的手机和电脑
说法是「端侧多模态 GUI Agent Model」,4B 参数
(这个定语有点长...)

看了下 Model Card
协议是 Apache 2.0
基座是 Qwen3-VL-4B-Instruct
也就是 Qwen3 里的那个端侧模型

核心能力(官方说法):
- 能识别 UI 元素、执行点击/输入/滑动/等待这些操作
- 能跨 App 处理任务,比如外卖、出行、购物、社交等场景
- 能“零样本适应”,能适应没见过的 App

支持 Ollama 快速启动,自动处理 ADB 连接和依赖安装,还有任务录制回放功能,相关链接在这

Hugging Face:
huggingface.co/stepfun-ai/GELab-Zero-4B-preview

GitHub:
stepfun-ai/gelab-zero

打开网易新闻 查看精彩图片