中伟视界：选煤厂大块料检测AI智能分析解决方案|中伟视界|传感器|信号|物料|皮带|选煤厂|速度

一、项目背景与行业痛点

选煤厂在生产过程中，原煤从井下或露天矿场运输至洗选系统时，不可避免地会混入一定比例的超限大块物料（如超大煤块、矸石、铁器、木料、橡胶等杂物）。这些大块物料一旦进入破碎机、筛分机、溜槽、输送带转载点等关键设备，极易造成堵塞、卡滞，甚至导致设备损坏、生产中断，严重时还会引发安全事故。传统的人工巡检方式存在检测滞后、劳动强度大、危险系数高、夜班视觉疲劳等问题，难以满足现代化选煤厂对连续、高效、安全生产的需求。因此，亟需引入基于人工智能的视觉分析技术，实现对输送带上的大块料实时、精准、非接触式检测与报警。

二、解决方案总体架构

本方案采用“端-边-云”协同架构，在选煤厂关键输煤皮带转载点、溜槽入口、破碎机前等位置部署高清防爆摄像机，采集实时视频流，通过边缘计算节点运行深度学习目标检测模型，对每一帧图像中的大块料进行识别、定位与分割。检测结果实时上传至集中管理平台，并联动现场声光报警、设备急停或调速控制，同时生成统计报表与趋势分析。

系统总体架构包含四层：

1. 感知层：工业防爆摄像机、补光灯、速度传感器等。

2. 边缘计算层：嵌入式AI计算盒或工控机，部署轻量化卷积神经网络模型，实现实时推理。

3. 平台层：选煤厂集控中心服务器，存储历史数据，提供可视化看板、报警规则配置、模型远程更新等功能。

4. 应用层：中控大屏、移动APP、现场声光报警器、PLC控制系统（用于设备联锁）。

三、实现原理

3.1 图像采集与预处理

在选煤厂输煤皮带上方2.5～3.5米处安装高清网络摄像机，镜头垂直于皮带表面。为保证光照均匀，采用LED防爆补光灯，并根据环境亮度自动调节。视频流以H.265编码格式传输至边缘设备，帧率设定为15～25fps，分辨率1920×1080。

预处理步骤包括：

去噪：高斯滤波减少粉尘引起的噪声。

对比度增强：自适应直方图均衡化应对煤尘覆盖或反光。

ROI区域提取：仅保留皮带有效区域，忽略两侧托辊及背景，降低计算量。

3.2 深度学习目标检测算法

本方案采用改进的YOLOv8模型作为核心检测器。YOLO系列（You Only Look Once）具有单阶段、端到端、实时性高的特点。针对选煤厂大块料检测的特殊需求，对原始模型进行了以下优化：

特征提取网络：引入RepVGG结构，在训练时使用多分支拓扑，推理时重参数化为单路3×3卷积，既保证了模型表达能力，又提高了推理速度。

注意力机制：在骨干网络末端添加CBAM（Convolutional Block Attention Module），使模型更加关注大块料的边缘和纹理特征，抑制皮带纹路、水渍、阴影等背景干扰。

多尺度检测：增加一个针对超大目标的检测头（感受野160×160像素以上），因为大块料在图像中可能占据较大比例，避免被分割成多个局部区域而漏检。

轻量化设计：采用通道剪枝和INT8量化，将模型体积压缩至原大小的1/4，满足边缘设备实时运行要求。

模型输入尺寸为640×640像素，输出包括：

边界框（x_center, y_center, width, height）

置信度（0～1）

类别（煤块、矸石、铁器、木料、其他）

3.3 像素尺寸过滤与超限判断

本方案采用基于像素大小的判断逻辑，无需进行物理尺寸换算，直接以物料在图像中占用的像素面积或边长作为报警依据。

3.3.1 固定区域标定

在摄像机安装完成后，现场进行一次性的固定区域标定。选煤厂工艺人员根据下游破碎机、筛分机或溜槽的实际通过能力，确定“不允许进入设备的最大物料物理尺寸”。例如，某齿辊破碎机允许的最大入料粒度为300mm。此时，在皮带上方固定高度处放置一个边长为300mm的立方体标定块，摄像头采集该标定块的图像，自动计算其边界框所占像素尺寸（例如长边占150像素，面积占8000像素²）。该像素值即为后续判断的固定阈值。

由于摄像机安装高度、角度、焦距一旦固定，视野范围不再改变，因此同一位置下物料距离镜头的物距基本恒定（皮带表面高度变化在几十毫米内，相对于2.5～3.5米的物距可忽略不计）。因此，像素尺寸与物理尺寸呈近似线性正比关系，用像素阈值代替物理阈值是可行且稳定的。

3.3.2 像素过滤规则

对于模型检测出的每一个目标边界框，系统提取以下两个像素指标中的至少一个进行判断：

像素长边：边界框的宽度与高度中的较大值（max(width, height)）。

像素面积：边界框的宽度×高度（width × height）。

用户可在配置界面灵活选择判断方式及阈值。例如：

规则A：若像素长边 ≥ 150像素，判定为大块料。

规则B：若像素面积 ≥ 8000像素²，判定为大块料。

规则C：同时满足长边≥120像素且面积≥6000像素²（组合条件）。

对于选煤厂常见的非规则块料，推荐优先采用“像素长边”规则，因为它更接近筛分工艺中“粒度”的定义。对于片状物料（长而扁），可辅以面积规则避免漏报。

3.3.3 无需物理尺寸换算的优势

传统方案需要将像素尺寸转换为毫米，这依赖于精确的物距测量、相机内参标定、料层厚度修正等复杂步骤，且皮带负载变化时物料堆高变化会引入较大误差。本方案直接采用像素阈值，具有以下突出优点：

部署简单：一次性标定，无需每次开机重新校准。

计算高效：省去三角测距、激光轮廓重建等耗时操作，纯像素比较仅需几个CPU周期。

稳定性高：不受皮带料层厚度波动、相机微小震动、镜头轻微污损的影响，因为这些因素对同一位置的所有物料同等衰减，相对关系保持稳定。

工艺直观：选煤厂技术人员可以直接通过观看监控画面，大致判断多大像素的物料需要报警，设置门槛非常方便。

3.3.4 特殊情形处理

物料部分超出ROI边界：若检测框触碰到图像边缘，该目标不参与报警判断，因为像素尺寸不完整。

多个目标粘连：通过非极大值抑制（NMS）和轮廓分析进行分割，分别计算每个独立块的像素尺寸。

皮带空载或薄料层：此时物料紧贴皮带表面，物距最大，相同物理尺寸的物料像素稍小。为避免漏报，阈值可适当降低5%～10%，或根据皮带速度传感器反馈动态微调。

3.4 运动补偿与跟踪

为避免同一大块料在多帧中重复报警，采用SORT（Simple Online and Realtime Tracking）算法对检测目标进行跟踪。每个目标分配唯一ID，记录其进入ROI到离开的全过程。当跟踪时长超过1秒且像素尺寸持续超限，才产生一次有效报警，有效抑制抖动和短暂遮挡引起的误报。

四、实现流程图

下面以流程图形式描述系统运行全过程：

该流程从采集到报警全链路延迟可控制在120ms以内（不含PLC执行时间），其中像素判断步骤几乎不增加额外耗时，满足选煤厂实时控制要求。

五、实现流程细化讲解（分阶段详述）

为了便于开发人员和现场工程师理解系统运行全过程，下面将整个检测流程拆解为 六个阶段，每个阶段说明输入、输出、关键处理步骤、异常处理机制以及所涉及的技术参数。

第一阶段：视频采集与解码

输入：选煤厂现场工业防爆摄像机输出的原始视频流（H.265 / H.264 编码，RTSP 协议）。

输出：内存中的原始 YUV 或 RGB 图像帧（分辨率 1920×1080，帧率 15～25 fps）。

详细步骤：

一、摄像机配置

设置固定码率（CBR）模式，避免场景剧烈变化时码率波动导致丢帧。推荐码率 4～8 Mbps。

关闭摄像机自带的运动检测、宽动态（WDR）等可能引入额外延迟的功能，仅保留基础曝光和增益控制。

配置 GOP（Group of Pictures）结构为 1 秒一个关键帧（如 25fps 下 GOP=25），以减少解码时等待关键帧的延迟。

二、边缘设备拉流

使用 GStreamer 或 FFmpeg 建立 RTSP 客户端，设置接收缓冲区为 2 秒，防止网络抖动。

启用 TCP 传输模式（而非 UDP），避免丢包导致的马赛克。

每 5 秒监测一次流状态，若断流则自动重连，并记录日志。

三、硬件解码

利用边缘设备（如 NVIDIA Jetson Orin NX）内置的视频解码器（NVJPGDecoder / V4L2）进行零拷贝解码，直接输出到 GPU 显存。

解码后图像格式转换为 RGB 平面（planar），方便后续深度学习模型输入。

四、异常处理：

若连续 10 秒无法解码出完整帧，触发“摄像头离线”报警并通知集控中心。

若解码错误率超过 5%，自动切换备用 RTSP 流（如果摄像机支持双码流）。

第二阶段：图像预处理与 ROI 提取

输入：原始 RGB 图像（1920×1080）。

输出：经过裁剪和增强后的子图像（640×640），以及原始图像中的 ROI 映射关系。

详细步骤：

一、ROI 区域定义

在系统首次部署时，由人工通过 Web 界面框选皮带有效区域（例如：x: 200～1720 像素，y: 300～800 像素）。该区域应仅包含皮带及物料，排除两侧托辊、支架、墙壁等干扰背景。

ROI 信息保存为配置文件，每次启动时加载。

二、尺寸缩放

将 ROI 区域图像从 1920×1080 缩放到 640×640（模型输入尺寸）。缩放算法使用双线性插值，兼顾速度与质量。

缩放比例（scale_x, scale_y）记录下来，用于后续将检测框坐标映射回原始图像。

三、图像增强

去噪：应用快速导向滤波（Fast Guided Filter），在保持边缘的前提下抑制粉尘引起的散粒噪声。

对比度增强：自适应直方图均衡化（CLAHE），参数 clipLimit=2.0, tileGridSize=(8,8)，有效改善煤尘覆盖区域细节。

光照归一化：计算图像全局均值和标准差，将像素值线性变换到 [0,255] 范围，减少不同班次光照差异的影响。

四、归一化与张量转换

将像素值从 [0,255] 缩放到 [0,1] 区间。

转换为模型要求的 NCHW 格式（Batch=1, Channel=3, Height=640, Width=640），送入 GPU 显存。

五、性能优化：

使用 CUDA 核函数实现 CLAHE 和缩放，避免 CPU-GPU 数据拷贝。

整个预处理阶段耗时控制在 5～8 毫秒以内。

第三阶段：深度学习模型推理

输入：640×640×3 的浮点张量（位于 GPU 显存）。

输出：原始检测结果列表，每个结果包含（类别ID，置信度，边界框 x_center, y_center, width, height），坐标范围为 0～640。

详细步骤：

一、模型加载

采用改进后的 YOLOv8 模型，已通过 TensorRT 进行 FP16 或 INT8 量化加速。

模型推理引擎在系统启动时加载一次，常驻 GPU 显存。

二、前向推理

调用 TensorRT 的 enqueueV3() 异步执行推理。

设置推理流（CUDA Stream），与预处理、后处理流水线并行。

推理耗时：FP16 下约 8～12 毫秒，INT8 下约 5～8 毫秒。

三、输出解析

模型输出三个特征图层（对应 80×80、40×40、20×20 网格），每个网格预测多个锚框。

对每个锚框应用 Sigmoid 激活函数得到置信度。

使用非极大值抑制（NMS）去除冗余框，NMS 的 IoU 阈值设为 0.45，置信度阈值设为 0.25（低阈值避免漏检，后续用跟踪过滤误报）。

四、坐标映射

将检测框坐标从 640×640 空间映射回原始 1920×1080 图像的 ROI 空间。

再进一步映射到原始全图坐标，用于后续在抓图中标注。

五、异常处理：

若某帧推理时间超过 50 毫秒（通常不会发生），则跳过该帧，继续处理下一帧，避免积压。

记录每帧推理耗时，若连续 100 帧平均耗时 > 30 毫秒，触发“性能下降”预警，提示检查设备散热或清理缓存。

第四阶段：像素尺寸过滤与报警判断

输入：模型输出的所有检测框（每个框包含类别、置信度、在原始图像中的像素坐标及宽高）。

输出：通过像素阈值过滤后的大块料候选列表。

详细步骤：

一、固定阈值标定（一次性操作）

系统安装完成后，现场人员将一块已知物理尺寸的标准块（例如边长为 300mm 的立方体）放置在皮带上，位于摄像头视野中央。

点击 Web 界面“标定”按钮，系统自动识别该块（或由人工框选），计算其边界框的像素长边（max(width, height)）和像素面积。

将该像素值保存为“大块料报警阈值”。例如测得长边 = 152 像素，则设定阈值为 ≥150 像素。

支持分别设置煤块、矸石、铁器、木料的不同阈值（例如铁器阈值为 100 像素，因为铁器危害更大）。

二、每帧过滤

对于每个检测框，提取 pixel_long_side = max(bbox_width, bbox_height)。

根据检测到的类别，获取该类对应的像素阈值 T_class。

如果 pixel_long_side >= T_class，则将该检测框加入“候选报警列表”。否则丢弃。

三、边界处理

若检测框触碰图像边缘（即 x_min <= 5 或 x_max >= 原始宽度-5 或类似），则直接丢弃，不参与报警判断。因为尺寸不完整，无法可靠比较。

四、多条件组合（可选）

系统允许配置同时满足长边和面积条件。例如：长边 ≥150 且面积 ≥8000 像素²。

也支持“或”关系。默认推荐仅使用长边，简单直观。

性能：该阶段仅涉及整数比较和简单逻辑，每帧耗时 < 0.1 毫秒，可忽略不计。

第五阶段：目标跟踪与重复报警抑制

输入：当前帧的候选报警列表（每个目标包含检测框位置、类别、像素尺寸）。

输出：确认需要报警的目标（每个目标产生一个唯一报警事件，而非每帧重复报警）。

详细步骤：

一、跟踪器初始化

使用 SORT（Simple Online and Realtime Tracking）算法，基于卡尔曼滤波和匈牙利匹配。

状态向量：[x_center, y_center, width, height, vx, vy, vw, vh]。

匹配阈值：IoU ≥ 0.3。

二、逐帧更新

对于每一帧，将候选报警列表中的检测框与现有轨迹进行匹配。

匹配成功：更新对应轨迹的状态，并累加该目标连续出现的帧数 hit_count。

匹配失败：初始化一条新轨迹，hit_count = 1。

对于未匹配到的轨迹，若连续 3 帧未出现，则删除该轨迹。

三、报警触发条件

当一个轨迹的 hit_count 达到 HIT_THRESHOLD（默认 15 帧，对应 1 秒，因为帧率 15fps）时，检查该轨迹是否已经上报过报警。

若未上报过，则生成一个唯一的报警事件（分配报警 ID），并记录该轨迹的第一次出现时间、最大像素尺寸、类别。

对于已经上报过报警的轨迹，不再重复触发（直到该目标离开画面后重新出现）。

四、跟踪框平滑

使用卡尔曼滤波的预测值作为显示用的跟踪框，减少检测框抖动。

五、异常处理：

若同一轨迹的像素尺寸在跟踪过程中持续变化（如因物料旋转），取最大值作为报警尺寸。

对于长时间（如超过 5 秒）停留在画面中的静止大块料（可能卡在皮带上），每 30 秒重复报警一次，提醒人工处理。

第六阶段：报警联动与数据存储

输入：确认后的报警事件（包含时间戳、皮带编号、类别、像素尺寸、跟踪轨迹、抓图、短视频片段）。

输出：现场声光报警、PLC 控制指令、数据库记录、Web 界面推送。

详细步骤：

一、现场联动

声光报警器：通过 Modbus RTU 或干接点信号触发。根据不同类别可配置不同声光模式（如铁器：急促蜂鸣+红色爆闪；普通大块料：间断蜂鸣+黄色闪烁）。

PLC 联锁：通过 OPC UA 或 Modbus TCP 向皮带 PLC 发送信号。可选动作包括：

仅报警，不停机（下游设备允许通过）。

上游皮带减速（由 2.5m/s 降至 0.5m/s），避免堆积。

上游皮带紧急停机（最严重情况）。

为保证安全，PLC 联锁信号采用“常闭”设计：AI 系统持续输出心跳信号，心跳丢失则 PLC 自动停机，实现故障安全。

二、数据记录

结构化数据：报警记录写入时序数据库（如 InfluxDB），包含字段：alarm_id, timestamp, belt_id, category, pixel_size, confidence, duration, action_taken。

三、非结构化数据：

报警时刻的原始图像（1920×1080 JPEG，质量 85%）保存至 NAS 或云存储。

报警前后各 3 秒的短视频（H.264 编码，15fps）保存为 MP4 文件。

保留策略：图像和视频保留 90 天，报警记录保留 1 年。

四、可视化推送

Web 界面（基于 WebSocket）实时显示当前皮带画面，并用红色框叠加显示大块料跟踪框。

弹窗提示报警信息，并播放报警音效。

移动 APP 同步推送通知（可选）。

五、统计分析

每班结束后自动生成报表：报警次数、各类别占比、平均像素尺寸、最长持续时间、上游皮带停机的次数及时长。

提供趋势图：大块料出现频率随时间变化，辅助发现上游工艺恶化趋势。

性能要求：从目标进入 ROI 到 PLC 发出停机信号，全链路延迟 ≤ 200 毫秒（其中视频采集 40ms，预处理+推理 20ms，跟踪+过滤 5ms，通信 135ms）。对于带速 2.5m/s 的皮带，200ms 对应物料移动 0.5 米，足够在进入破碎机前完成停机。

全流程时序示例（以一次实际报警事件为例）

该时序表明，从目标进入画面到皮带停止总耗时约 1.25 秒，其中大部分时间是等待跟踪确认（1 秒），实际检测计算仅占约 75ms。跟踪确认时间可根据现场需要调整（如敏感场景可缩短为 0.5 秒）。

五、关键技术特点

5.1 高鲁棒性环境适应能力

选煤厂现场具有高粉尘、低照度、水雾、震动等特点。本方案在算法层面采取了多重措施：

数据增强：训练时模拟粉尘遮挡、光照变化、运动模糊、雨雾等退化图像，提升模型泛化能力。

图像恢复：使用基于Retinex理论的低光照增强算法，夜间或阴天也能清晰识别物料轮廓。

抗震动算法：利用光流法估计相机微小位移，对检测框位置进行运动补偿。

5.2 实时性与轻量化并存

通过模型剪枝、算子融合、INT8量化，YOLOv8在NVIDIA Jetson Orin NX边缘设备上推理速度达到60fps以上，而整系统仅需处理15～25fps即可覆盖皮带输送速度（通常2～4m/s）。实际部署中采用流水线并行：采集线程、预处理线程、推理线程、后处理线程各司其职，GPU利用率保持在70%左右。

5.3 极简的像素阈值判断逻辑

相比传统需要复杂物理尺寸重建的方案，本方案采用固定区域像素比较，具有部署快、计算省、稳定性高的显著优势。现场工程师仅需观看监控画面中一块已知尺寸的参照物（如300mm标定块），记录其像素大小，即可完成阈值设置，无需任何相机标定或测距知识。

5.4 多类异物识别能力

除了检测超规格煤块，模型同时能识别铁器（锚杆、钢丝绳头）、木料（道木、板皮）、橡胶（轮胎、胶带碎块）等。针对不同异物，系统可配置差异化像素阈值和处理策略：铁器因其高危险性，可设置更敏感的像素阈值（如≥100像素即报警并急停）；木料可仅报警并跟踪，由人工确认。

5.5 自学习与模型迭代

系统内置难例挖掘模块，自动将置信度介于0.4～0.7之间的疑似目标、误报目标、漏报目标上传至云端训练平台。每周一次增量训练，更新边缘模型，使检测性能随着部署时间推移不断优化。

5.6 与选煤厂现有系统无缝集成

支持Modbus TCP、OPC UA、MQTT等多种工业协议，可与皮带综合保护装置、PLC、集控系统直接交互。提供RESTful API，便于第三方MES系统调用检测结果。

六、解决的实际问题

6.1 防止设备损坏与生产中断

选煤厂核心设备如齿辊破碎机、冲击式破碎机、振动筛对入料粒度有严格要求。一旦混入超大块矸石或铁器，轻则卡阻造成皮带打滑、电机过载，重则导致破碎齿断裂、筛板撕裂、轴端变形。更换破碎齿需要停机4～8小时，单次直接损失数万元至数十万元，间接影响原煤洗选计划。本系统在大块料进入破碎机之前即发出报警并联动上游皮带停机，将事故消灭在萌芽状态。

6.2 降低人工巡检安全风险

传统方式需要巡检工定时站在皮带旁观察，存在机械卷入、煤尘爆炸、滑倒摔伤等隐患。尤其在夜班或恶劣天气下，人工注意力难以持续集中。AI系统实现7×24小时不间断监测，将工人从危险、枯燥的重复劳动中解放出来，符合“少人则安、无人则安”的安全生产理念。

6.3 提高生产效率与产品质量

当系统检测到大块料报警并短暂停机后，工人只需清理该块料即可快速恢复生产，相比人工发现时设备已卡死的情况，处理时间从数小时缩短至几分钟。同时，通过统计各皮带的大块料出现频率，可以反向追溯上游采煤、运输环节的工艺缺陷（如炮采爆破粒度控制差、转载点无篦子等），推动源头治理。

6.4 支撑智能化选煤厂建设

智能化选煤厂标准要求关键设备具备状态自感知、故障自诊断能力。大块料检测AI系统是智能化的重要组成模块，其产生的数据可与生产执行系统、设备管理系统融合，实现：

预测性维护：频繁出现大块料的破碎机，提示检查齿板磨损。

工艺优化：分析不同班次、不同采区的大块料规律，调整筛分参数。

数字孪生：实时映射皮带物料粒度分布。

6.5 减少环保与能耗问题

大块料卡堵导致设备空转、频繁启停，会显著增加电能消耗和机械磨损。AI系统减少了无效运转，每套皮带年节电可达数万千瓦时。同时，避免因设备卡死而人工清理时产生的洒落煤尘，降低无组织排放。

七、典型部署案例与效果

以某大型炼焦煤选煤厂为例，在主洗车间103#原煤皮带机头溜槽处部署本系统。该皮带带宽1.2米，带速2.5m/s，处理能力600吨/小时。摄像机安装高度3.0米，标定时将300mm标准块放在皮带上测得像素长边为152像素，因此设置报警阈值为像素长边≥150像素。

部署前三个月内发生大块料卡堵事故4次，累计停机23小时。部署后连续运行6个月，系统共准确报警大块料事件47次（包括矸石38次、铁器5次、木料4次），其中35次在进入破碎机前成功联锁停机并由人工清除，避免了设备损伤；另外12次为超限煤块，下游破碎机可勉强通过，仅做报警记录。未出现漏报导致的卡堵事故，误报率低于1次/72小时（误报多因煤流中瞬时水雾反光导致检测框短暂超过阈值，后经跟踪逻辑过滤）。系统平均检测延迟约110ms，GPU占用率65%，稳定运行无死机。该案例充分证明了基于像素阈值判断方案的有效性与可靠性。

八、未来演进方向

随着多模态感知与生成式AI的发展，本方案可进一步升级：

动态像素阈值：根据皮带瞬时负荷（如通过速度传感器和称重数据）自动微调阈值，适应料层厚度变化。

基于Transformer的视频行为识别：不仅检测静态大块料，还能识别物料堆积成拱、溜槽堵塞的前兆运动模式。

大语言模型辅助决策：系统自动生成故障分析报告，并推荐上游工艺改进措施。

联邦学习：在保护各厂数据隐私的前提下，多个选煤厂联合训练更强大的基础模型。

九、结语

选煤厂大块料检测AI智能分析解决方案，深度结合了计算机视觉、边缘计算、工业自动化控制等技术，针对恶劣工况下的实时检测难题提出了系统化的工程路径。其核心创新在于采用固定区域的像素大小作为过滤依据，摒弃了复杂的物理尺寸重建过程，在保证检测精度的同时极大简化了部署和维护成本。实践证明，该方案能够显著降低设备故障率、提高生产安全性、减少人工依赖，是选煤厂迈向智能化、无人化的重要技术支撑。随着AI芯片成本进一步降低及模型轻量化技术成熟，该方案将具备更广泛的推广价值，为煤炭行业的高质量发展注入新动能。