国网某控股集团公司是国家电网公司全资子公司和金融资产投资管理平台。集团持有财务公司、财险、寿险、保险经纪、保险资管、信托、证券、期货、公募基金、产业基金、融资租赁、保理、投资、碳金融等金融或类金融牌照。

项目现状

随着国家电网公司进一步深化产融结合,优化金融业务布局的发展导向,集团着力深化业数融合,积极探索现代数字技术,为业务赋能、为管理赋效。伴随不断发展的信息化、数字化建设,作为支撑的IT基础设施管理运维的重要性不断增大,也为集团运营团队带来了新的挑战。

设备类型:交换机、防火墙、负载均衡等。

设备品牌:华为、华三、思科、锐捷、迪普、迈普、F5等

网络场景:内外网隔离,内外网各150台设备

项目期望

考虑到集团当前的网络架构和未来信息化建设的情况,需要一款可不断扩展、不断更新的监控运维产品来保障内外网IT设备的可用性和稳定性,从而支撑业务的连续。

  • 分别管理内外网两套IT设备,实现对不同品牌、型号设备的纳管,且支持对新设备的兼容;
  • 改善运维工具各自为战的现状,将不同类型的设备集中管理,当网络出现异常时可以直接定位故障节点,缩短排查时间,降低因设备故障引起的业务瓶颈;
  • 具备IT设备和网络架构自动扫描、发现的能力,能够通过直观的网络拓扑图呈现网络中各设备、设备间连接关系的实时状态;
  • 提供智能告警策略和多种告警通知方式,改善管理人员无法第一时间获取异常信息的问题,在排障处置时责任到人;
  • 产品在兼顾易用性的同时有丰富的功能,可以实现对内外网流量的深层次监控分析和回溯。

智和信通方案

根据集团的网络现状和使用场景,智和信通采取为其采取内外网分别部署的方案,对完全隔离的两张网内的设备进行管理,在保障网络安全的前提下实现集团对IT设备的纳管需求。

多品牌型号设备统一纳管、差异监控

通过可扩展的设备监控模型,将华为、华三、思科、锐捷、迪普、迈普、F5等品牌的交换机、防火墙、负载均衡等设备,并通过自定义的方式,量化其监控指标进行差异化监控管理。

  • 交换机:状态、响应时间、运行时间、电源状态、CPU使用率、内存使用率、网口状态、接收/发送流量、发送/丢包率、接收/发送带宽使用率等;
  • 防火墙:响应时间、CPU使用率、内存使用率、网口状态、接收/发送流量、发送/丢包率、接收/发送带宽使用率等;
  • 负载均衡:状态、响应时间、运行时间、CPU使用率、内存使用率等;

自动发现设备、资源、链路,生成网络拓扑

通过智能自动发现技术,网络中的设备仅需输入IP段即可一键扫描出来,并识别设备类型和厂商型号,搜索设备资源,如:CPU、内存、网口等,自动匹配故障、性能监控任务,实现对设备的实时监控。同时,获取发现设备间的连接关系,以图形化、具象化的拓扑形式进行展示。

当设备、资源、链路出现异常告警时,通过不同颜色展示其故障等级,帮助运维人员实时了解网络架构及全网运行状态,快速定位异常。

打开网易新闻 查看精彩图片

全网性能动态感知,实时、历史性能分析

实时监测并感知全网设备性能情况,多维度处理、分析、展示,包括实时性能监测、历史态势呈现和设备性能对比。通过曲线图、柱状图或表格等形象化地展示,按天、星期、月查看性能指标变化。运维人员能随时把握设备性能变化态势,防患于未然。

智能告警管理和多渠道告警通知

通过自定义配置告警阈值,主动地从众多的事件和状态中,系统将零散的状态信息,总结成当前状态,并进行状态分析对异常状态进行告警。第一时间获取准确的告警信息,快速标示已执行操作的告警,迅速定位告警设备。

提供界面颜色、提示声、光效闪烁、信息列表、Email、短信、钉钉、企业微信、个人微信等多种通知渠道,告警通知无延迟,告警渠道全覆盖。告警可以向上逐步追溯,按照从全局→网络→设备→资源的管理习惯来组织故障显示。

设备异常trap和syslog转告警

接收设备主动发送的各类事件与日志消息,集中存储、解析处理后,将错误、告警、攻击行为等异常信息转化为告警,及时地通知用户进行处置。通过统一界面集中管理事件与日志,提高其完整性和可追溯性,帮助用户快速定位问题并采取相应的解决措施。

告警收敛降噪和统一故障分析

方案通过统一的故障中心,将各个模块中的监控信息统一采集、分析,实现整个网络中各种事件信息、设备故障、流量异常等告警,以智能化手段进行标准化的分析、压缩、并归关联等,实时传达告警信息,保证落实到指定人员进行处理。

按照时间、资源、性能类型等多种维度将告警数据以图表等形式展现,实现所有告警的统一管理分析,从变化趋势、告警关联、排障处置等多方面、多视角洞察告警态势。

直达应用、服务层级的全网流量透视分析

通过基于sFlow、IPFIX、NetStream流量专用协议,从设备、接口、IP、服务、应用、会话等层级的实时流量监控和历史流量分析,识别带宽消耗较大的应用程序、服务、协议或IP地址,对已发生的流量行为进行回溯分析,迅速定位异常流量。通过强大的可视化能力对有效信息进行呈现,从流量利用方面为网络和业务稳定提供支撑。

应用价值

在部署智和网管平台后,集团实现了实现对不同品牌、型号设备的纳管,同时依托于智和信通强大的扩展模型库,通过Web界面配置策略即可实现新设备和新管控需求,最快几小时即可完成一款新设备的适配,新设备可无成本接续纳管,使得新设备的接入变得更加简单、快捷,极大地提升了设备管理的灵活性和效率。

在设备统一纳管的同时,充分考虑到用户应用场景的多样性和不同设备之间的差异化管理需求,根据设备的使用环境、工作负载以及性能要求,进行差异化监控策略配置。一旦指标超过预设的阈值,平台立即触发告警,提醒运维人员进行处理。并基于历史数据和实时监测信息,自动分析设备运行状态,预测潜在故障,实现由被动响应向主动预防的转变。不仅减少了非计划停机时间,还显著降低了维护成本,提升了整体IT服务的稳定性和可靠性。

同时,智和信通全面加强与用户的沟通合作,定期收集用户反馈,不断优化监控策略和服务流程。通过构建用户与平台之间的双向互动机制,得以更加深入地理解用户需求,为用户提供更加贴合实际的运维解决方案