一、项目背景与行业痛点

选煤厂在生产过程中,原煤从井下或露天矿场运输至洗选系统时,不可避免地会混入一定比例的超限大块物料(如超大煤块、矸石、铁器、木料、橡胶等杂物)。这些大块物料一旦进入破碎机、筛分机、溜槽、输送带转载点等关键设备,极易造成堵塞、卡滞,甚至导致设备损坏、生产中断,严重时还会引发安全事故。传统的人工巡检方式存在检测滞后、劳动强度大、危险系数高、夜班视觉疲劳等问题,难以满足现代化选煤厂对连续、高效、安全生产的需求。因此,亟需引入基于人工智能的视觉分析技术,实现对输送带上的大块料实时、精准、非接触式检测与报警。

选煤厂大块料检测
打开网易新闻 查看精彩图片
选煤厂大块料检测

二、解决方案总体架构

本方案采用“端-边-云”协同架构,在选煤厂关键输煤皮带转载点、溜槽入口、破碎机前等位置部署高清防爆摄像机,采集实时视频流,通过边缘计算节点运行深度学习目标检测模型,对每一帧图像中的大块料进行识别、定位与分割。检测结果实时上传至集中管理平台,并联动现场声光报警、设备急停或调速控制,同时生成统计报表与趋势分析。

系统总体架构包含四层:

1. 感知层:工业防爆摄像机、补光灯、速度传感器等。

2. 边缘计算层:嵌入式AI计算盒或工控机,部署轻量化卷积神经网络模型,实现实时推理。

3. 平台层:选煤厂集控中心服务器,存储历史数据,提供可视化看板、报警规则配置、模型远程更新等功能。

4. 应用层:中控大屏、移动APP、现场声光报警器、PLC控制系统(用于设备联锁)。

三、实现原理

3.1 图像采集与预处理

在选煤厂输煤皮带上方2.5~3.5米处安装高清网络摄像机,镜头垂直于皮带表面。为保证光照均匀,采用LED防爆补光灯,并根据环境亮度自动调节。视频流以H.265编码格式传输至边缘设备,帧率设定为15~25fps,分辨率1920×1080。

预处理步骤包括:

去噪:高斯滤波减少粉尘引起的噪声。

对比度增强:自适应直方图均衡化应对煤尘覆盖或反光。

ROI区域提取:仅保留皮带有效区域,忽略两侧托辊及背景,降低计算量。

3.2 深度学习目标检测算法

本方案采用改进的YOLOv8模型作为核心检测器。YOLO系列(You Only Look Once)具有单阶段、端到端、实时性高的特点。针对选煤厂大块料检测的特殊需求,对原始模型进行了以下优化:

特征提取网络:引入RepVGG结构,在训练时使用多分支拓扑,推理时重参数化为单路3×3卷积,既保证了模型表达能力,又提高了推理速度

注意力机制:在骨干网络末端添加CBAM(Convolutional Block Attention Module),使模型更加关注大块料的边缘和纹理特征,抑制皮带纹路、水渍、阴影等背景干扰。

多尺度检测:增加一个针对超大目标的检测头(感受野160×160像素以上),因为大块料在图像中可能占据较大比例,避免被分割成多个局部区域而漏检。

轻量化设计:采用通道剪枝和INT8量化,将模型体积压缩至原大小的1/4,满足边缘设备实时运行要求。

模型输入尺寸为640×640像素,输出包括:

边界框(x_center, y_center, width, height)

置信度(0~1)

类别(煤块、矸石、铁器、木料、其他)

3.3 像素尺寸过滤与超限判断

本方案采用基于像素大小的判断逻辑,无需进行物理尺寸换算,直接以物料在图像中占用的像素面积或边长作为报警依据。

3.3.1 固定区域标定

在摄像机安装完成后,现场进行一次性的固定区域标定。选煤厂工艺人员根据下游破碎机、筛分机或溜槽的实际通过能力,确定“不允许进入设备的最大物料物理尺寸”。例如,某齿辊破碎机允许的最大入料粒度为300mm。此时,在皮带上方固定高度处放置一个边长为300mm的立方体标定块,摄像头采集该标定块的图像,自动计算其边界框所占像素尺寸(例如长边占150像素,面积占8000像素²)。该像素值即为后续判断的固定阈值。

由于摄像机安装高度、角度、焦距一旦固定,视野范围不再改变,因此同一位置下物料距离镜头的物距基本恒定(皮带表面高度变化在几十毫米内,相对于2.5~3.5米的物距可忽略不计)。因此,像素尺寸与物理尺寸呈近似线性正比关系,用像素阈值代替物理阈值是可行且稳定的。

3.3.2 像素过滤规则

对于模型检测出的每一个目标边界框,系统提取以下两个像素指标中的至少一个进行判断:

像素长边:边界框的宽度与高度中的较大值(max(width, height))。

像素面积:边界框的宽度×高度(width × height)。

用户可在配置界面灵活选择判断方式及阈值。例如:

规则A:若像素长边 ≥ 150像素,判定为大块料。

规则B:若像素面积 ≥ 8000像素²,判定为大块料。

规则C:同时满足长边≥120像素且面积≥6000像素²(组合条件)。

对于选煤厂常见的非规则块料,推荐优先采用“像素长边”规则,因为它更接近筛分工艺中“粒度”的定义。对于片状物料(长而扁),可辅以面积规则避免漏报。

3.3.3 无需物理尺寸换算的优势

传统方案需要将像素尺寸转换为毫米,这依赖于精确的物距测量、相机内参标定、料层厚度修正等复杂步骤,且皮带负载变化时物料堆高变化会引入较大误差。本方案直接采用像素阈值,具有以下突出优点:

部署简单:一次性标定,无需每次开机重新校准。

计算高效:省去三角测距、激光轮廓重建等耗时操作,纯像素比较仅需几个CPU周期。

稳定性高:不受皮带料层厚度波动、相机微小震动、镜头轻微污损的影响,因为这些因素对同一位置的所有物料同等衰减,相对关系保持稳定。

工艺直观:选煤厂技术人员可以直接通过观看监控画面,大致判断多大像素的物料需要报警,设置门槛非常方便。

3.3.4 特殊情形处理

物料部分超出ROI边界:若检测框触碰到图像边缘,该目标不参与报警判断,因为像素尺寸不完整。

多个目标粘连:通过非极大值抑制(NMS)和轮廓分析进行分割,分别计算每个独立块的像素尺寸。

皮带空载或薄料层:此时物料紧贴皮带表面,物距最大,相同物理尺寸的物料像素稍小。为避免漏报,阈值可适当降低5%~10%,或根据皮带速度传感器反馈动态微调。

3.4 运动补偿与跟踪

为避免同一大块料在多帧中重复报警,采用SORT(Simple Online and Realtime Tracking)算法对检测目标进行跟踪。每个目标分配唯一ID,记录其进入ROI到离开的全过程。当跟踪时长超过1秒且像素尺寸持续超限,才产生一次有效报警,有效抑制抖动和短暂遮挡引起的误报。

四、实现流程图

下面以流程图形式描述系统运行全过程:

该流程从采集到报警全链路延迟可控制在120ms以内(不含PLC执行时间),其中像素判断步骤几乎不增加额外耗时,满足选煤厂实时控制要求。

五、实现流程细化讲解(分阶段详述)

为了便于开发人员和现场工程师理解系统运行全过程,下面将整个检测流程拆解为 六个阶段,每个阶段说明输入、输出、关键处理步骤、异常处理机制以及所涉及的技术参数。

第一阶段:视频采集与解码

输入:选煤厂现场工业防爆摄像机输出的原始视频流(H.265 / H.264 编码,RTSP 协议)。

输出:内存中的原始 YUV 或 RGB 图像帧(分辨率 1920×1080,帧率 15~25 fps)。

详细步骤

一、摄像机配置

设置固定码率(CBR)模式,避免场景剧烈变化时码率波动导致丢帧。推荐码率 4~8 Mbps。

关闭摄像机自带的运动检测、宽动态(WDR)等可能引入额外延迟的功能,仅保留基础曝光和增益控制。

配置 GOP(Group of Pictures)结构为 1 秒一个关键帧(如 25fps 下 GOP=25),以减少解码时等待关键帧的延迟。

二、边缘设备拉流

使用 GStreamer 或 FFmpeg 建立 RTSP 客户端,设置接收缓冲区为 2 秒,防止网络抖动。

启用 TCP 传输模式(而非 UDP),避免丢包导致的马赛克。

每 5 秒监测一次流状态,若断流则自动重连,并记录日志。

三、硬件解码

利用边缘设备(如 NVIDIA Jetson Orin NX)内置的视频解码器(NVJPGDecoder / V4L2)进行零拷贝解码,直接输出到 GPU 显存。

解码后图像格式转换为 RGB 平面(planar),方便后续深度学习模型输入。

四、异常处理:

若连续 10 秒无法解码出完整帧,触发“摄像头离线”报警并通知集控中心。

若解码错误率超过 5%,自动切换备用 RTSP 流(如果摄像机支持双码流)。

第二阶段:图像预处理与 ROI 提取

输入:原始 RGB 图像(1920×1080)。

输出:经过裁剪和增强后的子图像(640×640),以及原始图像中的 ROI 映射关系。

详细步骤

一、ROI 区域定义

在系统首次部署时,由人工通过 Web 界面框选皮带有效区域(例如:x: 200~1720 像素,y: 300~800 像素)。该区域应仅包含皮带及物料,排除两侧托辊、支架、墙壁等干扰背景。

ROI 信息保存为配置文件,每次启动时加载。

二、尺寸缩放

将 ROI 区域图像从 1920×1080 缩放到 640×640(模型输入尺寸)。缩放算法使用双线性插值,兼顾速度与质量。

缩放比例(scale_x, scale_y)记录下来,用于后续将检测框坐标映射回原始图像。

选煤厂大块料检测
打开网易新闻 查看精彩图片
选煤厂大块料检测

三、图像增强

去噪:应用快速导向滤波(Fast Guided Filter),在保持边缘的前提下抑制粉尘引起的散粒噪声。

对比度增强:自适应直方图均衡化(CLAHE),参数 clipLimit=2.0, tileGridSize=(8,8),有效改善煤尘覆盖区域细节。

光照归一化:计算图像全局均值和标准差,将像素值线性变换到 [0,255] 范围,减少不同班次光照差异的影响。

四、归一化与张量转换

将像素值从 [0,255] 缩放到 [0,1] 区间。

转换为模型要求的 NCHW 格式(Batch=1, Channel=3, Height=640, Width=640),送入 GPU 显存。

五、性能优化:

使用 CUDA 核函数实现 CLAHE 和缩放,避免 CPU-GPU 数据拷贝。

整个预处理阶段耗时控制在 5~8 毫秒以内。

第三阶段:深度学习模型推理

输入:640×640×3 的浮点张量(位于 GPU 显存)。

输出:原始检测结果列表,每个结果包含(类别ID,置信度,边界框 x_center, y_center, width, height),坐标范围为 0~640。

详细步骤

一、模型加载

采用改进后的 YOLOv8 模型,已通过 TensorRT 进行 FP16 或 INT8 量化加速。

模型推理引擎在系统启动时加载一次,常驻 GPU 显存。

二、前向推理

调用 TensorRT 的 enqueueV3() 异步执行推理。

设置推理流(CUDA Stream),与预处理、后处理流水线并行。

推理耗时:FP16 下约 8~12 毫秒,INT8 下约 5~8 毫秒。

三、输出解析

模型输出三个特征图层(对应 80×80、40×40、20×20 网格),每个网格预测多个锚框。

对每个锚框应用 Sigmoid 激活函数得到置信度。

使用非极大值抑制(NMS)去除冗余框,NMS 的 IoU 阈值设为 0.45,置信度阈值设为 0.25(低阈值避免漏检,后续用跟踪过滤误报)。

四、坐标映射

将检测框坐标从 640×640 空间映射回原始 1920×1080 图像的 ROI 空间。

再进一步映射到原始全图坐标,用于后续在抓图中标注。

五、异常处理:

若某帧推理时间超过 50 毫秒(通常不会发生),则跳过该帧,继续处理下一帧,避免积压。

记录每帧推理耗时,若连续 100 帧平均耗时 > 30 毫秒,触发“性能下降”预警,提示检查设备散热或清理缓存。

第四阶段:像素尺寸过滤与报警判断

输入:模型输出的所有检测框(每个框包含类别、置信度、在原始图像中的像素坐标及宽高)。

输出:通过像素阈值过滤后的大块料候选列表。

详细步骤

一、固定阈值标定(一次性操作)

系统安装完成后,现场人员将一块已知物理尺寸的标准块(例如边长为 300mm 的立方体)放置在皮带上,位于摄像头视野中央。

点击 Web 界面“标定”按钮,系统自动识别该块(或由人工框选),计算其边界框的像素长边(max(width, height))和像素面积。

将该像素值保存为“大块料报警阈值”。例如测得长边 = 152 像素,则设定阈值为 ≥150 像素。

支持分别设置煤块、矸石、铁器、木料的不同阈值(例如铁器阈值为 100 像素,因为铁器危害更大)。

二、每帧过滤

对于每个检测框,提取 pixel_long_side = max(bbox_width, bbox_height)。

根据检测到的类别,获取该类对应的像素阈值 T_class。

如果 pixel_long_side >= T_class,则将该检测框加入“候选报警列表”。否则丢弃。

三、边界处理

若检测框触碰图像边缘(即 x_min <= 5 或 x_max >= 原始宽度-5 或类似),则直接丢弃,不参与报警判断。因为尺寸不完整,无法可靠比较。

四、多条件组合(可选)

系统允许配置同时满足长边和面积条件。例如:长边 ≥150 面积 ≥8000 像素²。

也支持“或”关系。默认推荐仅使用长边,简单直观。

性能:该阶段仅涉及整数比较和简单逻辑,每帧耗时 < 0.1 毫秒,可忽略不计。

第五阶段:目标跟踪与重复报警抑制

输入:当前帧的候选报警列表(每个目标包含检测框位置、类别、像素尺寸)。

输出:确认需要报警的目标(每个目标产生一个唯一报警事件,而非每帧重复报警)。

详细步骤

一、跟踪器初始化

使用 SORT(Simple Online and Realtime Tracking)算法,基于卡尔曼滤波和匈牙利匹配。

状态向量:[x_center, y_center, width, height, vx, vy, vw, vh]。

匹配阈值:IoU ≥ 0.3。

二、逐帧更新

对于每一帧,将候选报警列表中的检测框与现有轨迹进行匹配。

匹配成功:更新对应轨迹的状态,并累加该目标连续出现的帧数 hit_count。

匹配失败:初始化一条新轨迹,hit_count = 1。

对于未匹配到的轨迹,若连续 3 帧未出现,则删除该轨迹。

三、报警触发条件

当一个轨迹的 hit_count 达到 HIT_THRESHOLD(默认 15 帧,对应 1 秒,因为帧率 15fps)时,检查该轨迹是否已经上报过报警。

若未上报过,则生成一个唯一的报警事件(分配报警 ID),并记录该轨迹的第一次出现时间、最大像素尺寸、类别。

对于已经上报过报警的轨迹,不再重复触发(直到该目标离开画面后重新出现)。

四、跟踪框平滑

使用卡尔曼滤波的预测值作为显示用的跟踪框,减少检测框抖动。

五、异常处理:

若同一轨迹的像素尺寸在跟踪过程中持续变化(如因物料旋转),取最大值作为报警尺寸。

对于长时间(如超过 5 秒)停留在画面中的静止大块料(可能卡在皮带上),每 30 秒重复报警一次,提醒人工处理。

第六阶段:报警联动与数据存储

输入:确认后的报警事件(包含时间戳、皮带编号、类别、像素尺寸、跟踪轨迹、抓图、短视频片段)。

输出:现场声光报警、PLC 控制指令、数据库记录、Web 界面推送。

详细步骤

一、现场联动

声光报警器:通过 Modbus RTU 或干接点信号触发。根据不同类别可配置不同声光模式(如铁器:急促蜂鸣+红色爆闪;普通大块料:间断蜂鸣+黄色闪烁)。

PLC 联锁:通过 OPC UA 或 Modbus TCP 向皮带 PLC 发送信号。可选动作包括:

仅报警,不停机(下游设备允许通过)。

上游皮带减速(由 2.5m/s 降至 0.5m/s),避免堆积。

上游皮带紧急停机(最严重情况)。

为保证安全,PLC 联锁信号采用“常闭”设计:AI 系统持续输出心跳信号,心跳丢失则 PLC 自动停机,实现故障安全。

二、数据记录

结构化数据:报警记录写入时序数据库(如 InfluxDB),包含字段:alarm_id, timestamp, belt_id, category, pixel_size, confidence, duration, action_taken。

三、非结构化数据:

报警时刻的原始图像(1920×1080 JPEG,质量 85%)保存至 NAS 或云存储。

报警前后各 3 秒的短视频(H.264 编码,15fps)保存为 MP4 文件。

保留策略:图像和视频保留 90 天,报警记录保留 1 年。

四、可视化推送

Web 界面(基于 WebSocket)实时显示当前皮带画面,并用红色框叠加显示大块料跟踪框。

弹窗提示报警信息,并播放报警音效。

移动 APP 同步推送通知(可选)。

实时视频
打开网易新闻 查看精彩图片
实时视频

五、统计分析

每班结束后自动生成报表:报警次数、各类别占比、平均像素尺寸、最长持续时间、上游皮带停机的次数及时长。

提供趋势图:大块料出现频率随时间变化,辅助发现上游工艺恶化趋势。

性能要求:从目标进入 ROI 到 PLC 发出停机信号,全链路延迟 ≤ 200 毫秒(其中视频采集 40ms,预处理+推理 20ms,跟踪+过滤 5ms,通信 135ms)。对于带速 2.5m/s 的皮带,200ms 对应物料移动 0.5 米,足够在进入破碎机前完成停机。

全流程时序示例(以一次实际报警事件为例)

全流程时序
打开网易新闻 查看精彩图片
全流程时序

该时序表明,从目标进入画面到皮带停止总耗时约 1.25 秒,其中大部分时间是等待跟踪确认(1 秒),实际检测计算仅占约 75ms。跟踪确认时间可根据现场需要调整(如敏感场景可缩短为 0.5 秒)。

五、关键技术特点

5.1 高鲁棒性环境适应能力

选煤厂现场具有高粉尘、低照度、水雾、震动等特点。本方案在算法层面采取了多重措施:

数据增强:训练时模拟粉尘遮挡、光照变化、运动模糊、雨雾等退化图像,提升模型泛化能力。

图像恢复:使用基于Retinex理论的低光照增强算法,夜间或阴天也能清晰识别物料轮廓。

抗震动算法:利用光流法估计相机微小位移,对检测框位置进行运动补偿。

5.2 实时性与轻量化并存

通过模型剪枝、算子融合、INT8量化,YOLOv8在NVIDIA Jetson Orin NX边缘设备上推理速度达到60fps以上,而整系统仅需处理15~25fps即可覆盖皮带输送速度(通常2~4m/s)。实际部署中采用流水线并行:采集线程、预处理线程、推理线程、后处理线程各司其职,GPU利用率保持在70%左右。

5.3 极简的像素阈值判断逻辑

相比传统需要复杂物理尺寸重建的方案,本方案采用固定区域像素比较,具有部署快、计算省、稳定性高的显著优势。现场工程师仅需观看监控画面中一块已知尺寸的参照物(如300mm标定块),记录其像素大小,即可完成阈值设置,无需任何相机标定或测距知识。

5.4 多类异物识别能力

除了检测超规格煤块,模型同时能识别铁器(锚杆、钢丝绳头)、木料(道木、板皮)、橡胶(轮胎、胶带碎块)等。针对不同异物,系统可配置差异化像素阈值和处理策略:铁器因其高危险性,可设置更敏感的像素阈值(如≥100像素即报警并急停);木料可仅报警并跟踪,由人工确认。

5.5 自学习与模型迭代

系统内置难例挖掘模块,自动将置信度介于0.4~0.7之间的疑似目标、误报目标、漏报目标上传至云端训练平台。每周一次增量训练,更新边缘模型,使检测性能随着部署时间推移不断优化。

5.6 与选煤厂现有系统无缝集成

支持Modbus TCP、OPC UA、MQTT等多种工业协议,可与皮带综合保护装置、PLC、集控系统直接交互。提供RESTful API,便于第三方MES系统调用检测结果。

六、解决的实际问题

6.1 防止设备损坏与生产中断

选煤厂核心设备如齿辊破碎机、冲击式破碎机、振动筛对入料粒度有严格要求。一旦混入超大块矸石或铁器,轻则卡阻造成皮带打滑、电机过载,重则导致破碎齿断裂、筛板撕裂、轴端变形。更换破碎齿需要停机4~8小时,单次直接损失数万元至数十万元,间接影响原煤洗选计划。本系统在大块料进入破碎机之前即发出报警并联动上游皮带停机,将事故消灭在萌芽状态。

6.2 降低人工巡检安全风险

传统方式需要巡检工定时站在皮带旁观察,存在机械卷入、煤尘爆炸、滑倒摔伤等隐患。尤其在夜班或恶劣天气下,人工注意力难以持续集中。AI系统实现7×24小时不间断监测,将工人从危险、枯燥的重复劳动中解放出来,符合“少人则安、无人则安”的安全生产理念。

6.3 提高生产效率与产品质量

当系统检测到大块料报警并短暂停机后,工人只需清理该块料即可快速恢复生产,相比人工发现时设备已卡死的情况,处理时间从数小时缩短至几分钟。同时,通过统计各皮带的大块料出现频率,可以反向追溯上游采煤、运输环节的工艺缺陷(如炮采爆破粒度控制差、转载点无篦子等),推动源头治理。

6.4 支撑智能化选煤厂建设

智能化选煤厂标准要求关键设备具备状态自感知、故障自诊断能力。大块料检测AI系统是智能化的重要组成模块,其产生的数据可与生产执行系统、设备管理系统融合,实现:

预测性维护:频繁出现大块料的破碎机,提示检查齿板磨损。

工艺优化:分析不同班次、不同采区的大块料规律,调整筛分参数。

数字孪生:实时映射皮带物料粒度分布。

6.5 减少环保与能耗问题

大块料卡堵导致设备空转、频繁启停,会显著增加电能消耗和机械磨损。AI系统减少了无效运转,每套皮带年节电可达数万千瓦时。同时,避免因设备卡死而人工清理时产生的洒落煤尘,降低无组织排放。

七、典型部署案例与效果

以某大型炼焦煤选煤厂为例,在主洗车间103#原煤皮带机头溜槽处部署本系统。该皮带带宽1.2米,带速2.5m/s,处理能力600吨/小时。摄像机安装高度3.0米,标定时将300mm标准块放在皮带上测得像素长边为152像素,因此设置报警阈值为像素长边≥150像素。

输煤数据可视化
打开网易新闻 查看精彩图片
输煤数据可视化

部署前三个月内发生大块料卡堵事故4次,累计停机23小时。部署后连续运行6个月,系统共准确报警大块料事件47次(包括矸石38次、铁器5次、木料4次),其中35次在进入破碎机前成功联锁停机并由人工清除,避免了设备损伤;另外12次为超限煤块,下游破碎机可勉强通过,仅做报警记录。未出现漏报导致的卡堵事故,误报率低于1次/72小时(误报多因煤流中瞬时水雾反光导致检测框短暂超过阈值,后经跟踪逻辑过滤)。系统平均检测延迟约110ms,GPU占用率65%,稳定运行无死机。该案例充分证明了基于像素阈值判断方案的有效性与可靠性。

八、未来演进方向

随着多模态感知与生成式AI的发展,本方案可进一步升级:

动态像素阈值:根据皮带瞬时负荷(如通过速度传感器和称重数据)自动微调阈值,适应料层厚度变化。

基于Transformer的视频行为识别:不仅检测静态大块料,还能识别物料堆积成拱、溜槽堵塞的前兆运动模式。

大语言模型辅助决策:系统自动生成故障分析报告,并推荐上游工艺改进措施。

联邦学习:在保护各厂数据隐私的前提下,多个选煤厂联合训练更强大的基础模型。

九、结语

选煤厂大块料检测AI智能分析解决方案,深度结合了计算机视觉、边缘计算、工业自动化控制等技术,针对恶劣工况下的实时检测难题提出了系统化的工程路径。其核心创新在于采用固定区域的像素大小作为过滤依据,摒弃了复杂的物理尺寸重建过程,在保证检测精度的同时极大简化了部署和维护成本。实践证明,该方案能够显著降低设备故障率、提高生产安全性、减少人工依赖,是选煤厂迈向智能化、无人化的重要技术支撑。随着AI芯片成本进一步降低及模型轻量化技术成熟,该方案将具备更广泛的推广价值,为煤炭行业的高质量发展注入新动能。