人群分析有个老难题:既要数清多少人,又要标出每个人在哪。传统方法分两路走,一路用检测框找人,一路用回归算总数,各干各的。
这篇工作直接上全卷积网络,端到端解决。输入一张图,输出两个东西:像素级的分割掩码,加上全局密度图。分割告诉你"这儿有个人",密度图告诉你"这一片很挤"。
打开网易新闻 查看精彩图片
关键设计是共享编码器。底层卷积抽特征,上面分叉两路:一路做语义分割,一路做密度回归。两任务互相借力,分割帮密度定位,密度帮分割排除假目标。
打开网易新闻 查看精彩图片
实验在三个公开数据集上跑过。UCF-QNRF那种超密集场景,计数误差压到主流水平以下;分割精度用F1量,比两阶段方法高出一截。更实在的是速度,单张图前向传播几十毫秒,能塞进实时系统。
打开网易新闻 查看精彩图片
作者把代码和模型放出来了。做安防的、搞城市规划的,可以直接拿来用。人群计数这行,终于从"能跑"进化到"好使"了。
热门跟贴