0 引言

在“互联网+电力改革”期间,我国电力企业通过充分利用信息技术、通信技术、电力输配送自动化技术等资源,建立了相对完整的电力企业信息化管理系统,实现了电力企业的现代化转型。在此背景下,本文主要对电力企业的信息化集成方式展开分析。

1 电力企业信息化集成方式

我国电力企业在“互联网+”改革时期建立了电力信息管理系统,实现了电力信息集成,从其发展过程看,主要包括单点集成、中间件集成、分布通讯集成,由于电力信息化集成相对复杂,前期发展中的集成相对简单,并未实现“有效、合理的集成方式”。在进入“大数据”技术应用时期后,电力企业的信息化集成方式逐渐增多,出现了存储级集成方式、数据级集成方式、应用级集成方式、界面级集成方式和用户集成方式等[1,2,3,4,5]。笔者通过比较新的电力企业信息化集成方式发现,在主要功能、主要技术手段应用、被集成系统支持、技术架构需求方面,不同的集成方式均存在不同的特征,而且与业务变化、信息资源、技术路线、数据库支持等密切关联,所以需要选择一些有利于实现高效信息化集成的方式。

2 电力企业信息化集成原则

电力企业有很多信息化集成方式,从当前集成的关键技术应用需求方向看,需要重点关注一些重点集成原则。比如,考虑基于J2EE技术路线、基于SOA的应用集成、基于BI的数据分析、基于IEC61970/CIM的信息模型、基于IEC61970的实时数据集成、基于ETL的数据整合和基于EII的数据交换等。再如,利用“抓大放小、突出主线”的思路,尽可能考虑“整体规划、分布实施、滚动发展”,并且将“数据集成、数据分析、电力企业门户”等作为应用方向。

3 电力企业信息化集成的关键技术

目前,我国电力企业经过多年的努力创建了“多业务系统”,实现了“管理信息系统”“营销系统”“办公自动化系统”,可以为电力技术的研发设计、电力基础设施建设、电力生产制造、电力市场营销、电力运营管理等提供相对初级的信息监测与信息分析服务。并且,在运营管理环节的售后服务与电力配网抢修等方面均建立了可以高效实施的信息化管理平台及应用系统。由于当前的数据集成系统多应用于各分立系统,在全面的分立系统联动方面,信息化集成应用相对不足。所以本文结合数据集成系统平台对电力企业信息化集成关键技术展开探讨。

3.1 数据集成系统框架设计

在电力企业信息化集成关键技术中,主要针对多项问题实施处理,包括了数据获取、数据抽取、数据整合、数据分析等环节。若从整体上对各类数据功能进行系统性管理,使其在整体上实现数据的一体化集成应用,则需要对数据模式的异构缺陷进行分析,进而通过业务系统数据集成需求,设计数据集成系统框架[6,7,8,9,10]。比如,通过领域模型管理,按照其定制和演化方式,使实体与模式之间建立关系等,也就是需要借助数据集成系统操作完成对电力企业所有信息的一体式自动化管理。具体数据集成系统框架设计如图1所示。

搭建的数据集成系统框架,在“数据获取”方面就能够通过“爬虫程序”编辑对采集到的“查询表单”进行优化处理,进而实现“爬取”本地数据库的目标。在“数据抽取”方面则可以利用“包装器”设置,根据用户感兴趣的数据,在精准定位的限定条件上,使半结构化、非结构化数据获得“抽取”与“转换”,进而按照结构化数据完成“数据存储”,而且,其中的页面数据标注也能够针对同一领域的不同站点数据进行统一处理。在“数据整合”方面则只需要根据“重复记录检测”与“数据融合”方式针对同一实体同类信息进行重复记录检测和合并处理,进而实现结构化数据。在“数据分析”方面则能够利用“数据获取”“数据抽取”“数据整合”实现的结构化数据,利用云计算或中心数据处理方法,实现对所有结构化数据的综合分析,并根据预测结果将其通过多路径方式分发到数据应用终端等。

3.2 以“数据获取”关键技术为例

“数据获取”或“数据采集”在数据集成系统框架中十分重要,不仅要实现有效获取,也需要达到动态化的实时获取以及精准化获取。当前的获取过程中,主要会采用一些关键性技术,如“基于高频率查询词采集率模型”,就能够根据“高频率列表”进行一些“评估计算”,从而根据“新数据获取率”选择一些词汇。简单讲,就是针对“关键词”进行频率统计与分析,若其与新数据库中的相关“范例词汇”存在对应或重复,就可以直接进行采集和获取。

目前,对于同一文本属性的采样,通常会应用多个特征自动构造训练样本,在训练方法层面多以多元线性回归法为主,能够构建出相对完善的“基于高频率查询词采集率模型”,而且根据“模型迭代”与“数据覆盖”可以在其应用中以自动化更新的方式逐步提升其应用效用。在电力企业数据集成中的“数据获取”可以分为两个阶段加以实现。第一阶段主要通过“基于高频率的查询词采新率模型构建”实现;第二阶段则通过“网站数据库获取”完成。

从图2可以看出,整个“数据获取”过程中的第一阶段与第二阶段存在关联性,而与第一阶段的“样本”或“范例”设置方案相比,第二阶段中的“网站数据库获取”则利用了第一阶段的“模型”,能够在其基础上对网站数据库中的数据进行获取。比如,在提交“查询列表”后,就能够选择有效数据的查询词,此时就能够通过网站Web数据库对比或者查询的方式,在“结果页面”实现对存储在本地数据库数据的“数据抽取”。在提升“数据获取”效率方面,则可以利用Map/Reduce进行操作。需要注意的是,在当前应用该“模式”获取数据的过程中,仍然存在URL分配调度方面的负载均衡问题,因此需要在该方面提供一些负载均衡解决方案。

3.3 以“数据抽取”和“重复记录检测”为例

与“数据获取”关键技术相比,构建“数据抽取包装器”和“重复记录检测”相对简单。比如,使用“基于自底向上方法”就能够构建“数据抽取包装器”,具体抽取过程中则可以借助“页面提取”与“语义标注”加以实现。在现阶段的领域模型演化与更新中,可以利用支持向量机方法(SVM)完成实体模式关系动态更新,而实体间的关系则可以根据数据与目标页面的视觉信息加以实现。目前,采用的“健壮性评估方法”“构建方法”可以提升“数据抽取包装器”的健壮性,并且在“重复记录检测”环节可实现无监督学习的自动化重复记录检测。

4 结语

电力作为一种可持续能源,在当代社会发挥着重要的作用。当前我国正处于总体经济体系建设新时期,在“系统性改革与配套性改革相结合”的思路下,我国电力行业将发生前所未有的巨变。结合以上分析,笔者建议加强电力企业信息化集成关键技术的分类研究,为其后续的专业分工与基于质量体系管理标准的技术输出打下基础。