Prometheus主要实现采集、存储、查询设备数据指标、告警等功能;Grafana通过Prometheus的API以仪表板的形展示数据,同时在线提供了大量监测数据展示模版。然而,实际运维中我们不仅需要实时监测数据,还需要了解设备的物理位置、拓扑、链路、业务、配置......,传统方法需要关联查询多个系统或文档才能全面了解设备相关数据。

nVisual 作为可视化运维管理工具,提供了 Prometheus 和 Grafana 所不具备的档案、分析和规划能力。因此,通过集成 Prometheus、Grafana 和 nVisual 三个系统,可以实现统一入口查看所有被监测对象的数据。这将有助于故障根因分析、快速故障诊断,提升运维服务质量,降低运维成本

具体解决方案如下:

1利用grafana集成Prometheu创建监控仪表板模版

关于Prometheu与grafana集成、Grafana制作仪表板,请访问:

https://prometheus.io 和 https://grafana.com

打开网易新闻 查看精彩图片

2在nVisual中将设备类型与Grafana仪表板模版关联

nVisual有一个自定义监控视图的组件,右侧工具栏的"实时监测"按纽 ,这个按纽可以通过后台数据库表:monitor来定义按纽集成的模版视图路径,表定义如下:

打开网易新闻 查看精彩图片

3集成Alertmanager

将Alertmanager告警信息通过webhook推送至nVisual的事件管理,进行告警与数字孪生对象的关联,实现统一告警,配置如下:

打开网易新闻 查看精彩图片

4Prometheus与nVisual集成后的效果

当告警发生生,通过告警事件自动关联到机柜设备视图,点击告警设备,右侧工具栏显示设备运行状态实时数据,通过点击不同的右侧工具栏按纽,可以分别查看设备详细视图、自定义属性信息、实时监测数据、拓扑、链路、业务映射......

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片


示例地址

通过链接可访问此在线监测示例:

https://cloud.nvisual.com/share.html?shareLink=W7F78h2zP54mVhIwvNx7&v=1725377215673/?ref=CSDN