文|安德烈的笔记

编辑|安德烈的笔记

影响居民用电量因素

对影响居民用电量因素的分析可分为短期和长期两个过程。

短期内影响用电量变化的原因是在一定家庭电器水平下的电器使用率的变化,比如电力价格、天气的变化都会造成电器使用率的变化;影响长期用电量的因素就是家用电器的拥有量。

家庭收入、旧种类电器的淘汰、新种类电器的使用和替代能源间的竞争是致使长期家用电器拥有量发生变化的原因。

不论短期和长期的用电量预测,家用电器水平都是决定用电量的决定因素。

所以,有必要建立模型对家用电器拥有量与用电量的关系作量化的分析。

打开网易新闻 查看精彩图片

每种家用电器都有其不同的使用特性,包括其能源使用效率、使用功率和使用时间等。

它们对总用电量的影响也不同。

随着家用电器种类的增多,忽略掉任何一种电器都会对最终的用电量预测产生影响。

但将所有家用电器都作为输入变量在线性模型中又是不可能的,这是因为,首先,各输入变量之间具有相关性,而线性模型要求变量间是不相关的。

打开网易新闻 查看精彩图片

其次,家用电器水平与用电量的关系也不是线性关系,家用电器使用特性的不同会使其与用电量之间成非线性关系,这就需要建立非线性映射关系来解决这个问题。

由于人工智能方法的特点是根据特征量或条件的输入得到一个映射的结果,只要能选择合适的输入特征矢量,利用人工智能方法就可以得到非常满意的预测结果。

人工智能方法的这一特点很好地与居民用电量预测的计算特点相适应,因而适合于居民用电量的预测。

本文利用人工神经网络(ANN)方法,将影响居民用电量的因素作为特征量输入,利用神经网络具有广泛映射能力的特点,预测出居民需用电量。

打开网易新闻 查看精彩图片

人工神经网络及其学习算法

利用家用电器拥有量预测居民电力需求的本质是建立起一个抽象的函数映射关系,神经网络的出现为解决这类预测问题提供了有力的支持,神经网络是由许多具有简单运算功能的神经元相互连接而成的网络,具有很强的适应能力、学习能力和容错能力。

在处理一些难以用传统方法表达或传统方法解决起来耗时的问题十分有效。

打开网易新闻 查看精彩图片

神经网络在求解实际问题时将知识和经验分布储存在网络的连接权重上,对于特定的输入模式,神经网络通过前向计算,产生出一个输出模式,相应的预测结果就被计算出来,这就是神经网络计算的基本原理。

神经网络结构

打开网易新闻 查看精彩图片

图1多层感知器结构图

本文采用多层感知器模型。

多层感知器是一种典型的前馈神经网络,它一般由输入层、隐层和输出层组成,结构如图1所示。

其中:x1,x2,…,xn为输入特征矢量X的各分量,y1,y2,…,ym为输出矢量Y的各分量,根据不同的问题,神经网络采用不同维数的输入特征矢量、输出矢量以及隐层数。

打开网易新闻 查看精彩图片

所要求的隐层神经元个数非常庞大,使得神经网络学习效率低下,并容易使权重的学习陷入局部最优。

因为本文采用的输入矢量与输出量之间的关系并不复杂,所以一个隐层数就可以满足训练精度的要求。

而隐层神经元个数的选择相对来说比较繁琐。

可以考虑通过试算法,即通过设定不同的隐层神经元个数来迭代10000次,以寻找相对最优的神经元个数。

打开网易新闻 查看精彩图片

输入输出特征矢量的选择和输入特征矢量提取

对特征矢量的选取,人们总是希望得到有效的特征,使识别的准确度得到提高,或者为达到同样的准确度所需的特征数目较少。

利用特征有效性的信息度量以及特征矢量在不同定义下的距离,可以得到在一定特征矢量下的误识概率,通过对误识概率的比较,可以评价特征矢量的优劣。

打开网易新闻 查看精彩图片

对于输入特征矢量的选择,本文选择对居民用电量起关键影响的家庭电器拥有量作为输入特征,这些特征量包括家庭对如下12种电器的拥有量:洗衣机、电风扇、电冰箱、冰柜、电视机、娱乐电器、微波炉、空调器、电炊具、淋浴热水器、脱排油烟机和吸尘器。

人工神经网络权重的学习

形成神经网络结构以后,在利用它来预测动态元件的输出之前,必须对其权重进行训练,神经网络权重学习方法很多,最简单有效的是BP算法。

打开网易新闻 查看精彩图片

其中,N为学习样本数,Ti为理想输出,yi为神经网络实际输出,则系统指标Remp为样本预测的平均误差。

其中,Δω(k+1)和Δω(k)分别为第k+1步和第k步第l层中第i个神经元对应的权重修正矢量,η和a分别为算法的学习因子和记忆因子,η越大,则每步权重改变的幅度越大,学习的速度就越快,但计算也就越不稳定,容易产生振荡效应,但η太小,每步计算权重的修正量又太小,计算时间变长。

实际应用中,首先将η取一较大的值,并在权重收敛过程中逐渐减小。

打开网易新闻 查看精彩图片

需要指出的是,采用反向传播(BP)算法进行神经网络权重学习十分耗时,由于BP算法是沿着目标值的负梯度方向寻优,因此当解靠近矢量空间中的局部最优点时,梯度矢量会越来越小,因此训练更加缓慢并很容易陷入局部最小点。

采用遗传算法和神经网络相结合的混和人工智能方法可以有效地解决这一问题。

算例

利用上述人工智能方法对山东省青岛市1999年居民用电量进行预测,结果如下。

打开网易新闻 查看精彩图片

训练样本

要利用神经网络进行预测分析,必须要有足够的训练样本,本文利用山东省青岛市按不同收入阶层的1992—1998年和全国1994—1998年的居民主要家庭电器拥有量和平均用电量的历史数据作为训练样本。

训练样本数为100。

初始训练结果表明,最低收入阶层的预测效果并不好,这是因为最低收入阶层与其它收入阶层的电力消费方式有较大差异引起的,所以在训练样本时,将最低收入阶层数据除去,将中等收入阶层和高收入阶层的数据作为训练样本。

得出的神经网络只适用于中、高收入阶层的电量预测。

训练样本数为63个。

打开网易新闻 查看精彩图片

隐层神经元的确定

通过试算法,根据迭代10000次后的预测误差的比较,得出较为满意的隐层神经元数目。

试算过程如下表所示。

表1不同隐层神经元个数时的预测误差

打开网易新闻 查看精彩图片

由上表看出,最优的隐层神经元数应该在20、40和100左右。

但当隐层神经元数为20和40时,神经网络迭代到10000次就陷入了局部最优,而隐层神经元数为100的神经网络还有继续优化的趋势。

所以最终选定隐层神经元数为94个。

打开网易新闻 查看精彩图片

神经网络居民用电需求预测结果

利用单隐层,隐层神经元数为94的神经网络结构进行训练,待神经网络训练收敛以后,在PentiumⅢATX600MHz128MBPC机用该神经网络对山东省青岛市1999年和全国1999年的平均居民用电量进行预测,结果如表2所示

表21999年山东省青岛市和全国不同收入组居民用电量预测结果(单位:kWh)

打开网易新闻 查看精彩图片

表中列出的前5个组是青岛市1999年的实际值和预测值,后5组是全国1999年的实际值和预测值,表中数据是按收入由低到高顺序排列的。

从表2可见,利用人工智能方法对居民用电量进行预测具有相当的计算精度,样本的训练误差在5%以内,预测的相对误差大多保持在10%以内。

(唯有第4组超过了预测精度范围,不排除统计误差上的原因)。

而且计算速度也非常快,上述10种类型的居民用电量进行预测的时间仅为0.0103秒。

打开网易新闻 查看精彩图片

当最低收入阶层的用电量占总用电量的比例不大时,用此神经网络预测出的人均年用电量与实际人均年用电量的误差不会很大。

以1997年全国各省的家用电器拥有量为输入,预测出各省的人均年用电量如下3表:

表31997年各省市人均年用电量预测数据 (单位:kWh)

打开网易新闻 查看精彩图片

由于目前统计年鉴上只有人均年用电支出,因此即便是预测出用电量也无法校验预测的准确性。

但是考虑到用电量与用电支出的相关性,可以作出用电量与用电支出的回归方程,如果方程的拟和系数很高,则说明预测值是可信的。

方程MON=C(1)+C(2)·ELE中,MON为各省市的人均年用电支出,ELE为用神经网络预测的各省市人均年用电量。

用e-views软件回归的结果如下

拟和系数为1,说明两者为强相关关系。

预测结果是可信的。

打开网易新闻 查看精彩图片

用神经网络进行居民用电量预测的优、缺点

运用神经网络进行居民用电量的预测有以下优点:

①对输入变量的要求没有线性或非线性计量经济学模型严格,它不要求输入变量之间一定是不相关。

这是因为:神经网络是通过学习来实现非线性映射和函数逼近的,各变量之间的关系通过学习而隐含于网络中。

如果数据间存在着某种关系,网络就可以学习到。

而对于无关的数据,网络会最终将其影响消除。

表4回归计算结果

打开网易新闻 查看精彩图片

②因为不存在模型的参数估计问题,横截面数据和时间序列数据可以一并作为输入数据,而不需要考虑是否会影响模型预测的准确性。

③虽然有些统计分析方法,比如因子法可以消除输入变量之间的相关性,但用因子法得出的互不相关的变量与原变量之间是空间映射的关系,其模型的解释性很差,不能说明因子的具体物理意义所在。

因此就不能具体分析某种家用电器对用电量的影响。

而用神经网络则可以通过改变某一输入量的大小,来观测其对平均用电量的影响。

打开网易新闻 查看精彩图片

④从经验上看,家用电器的拥有量与用电量之间更符合非线性的关系,而人为设定非线性模型缺乏科学的依据,神经网络通过自学习后具有非线性映射能力及对任意函数的逼近能力,且其建模方法简单,相对其它模型的预测精度有所提高。

⑤用训练后的神经网络可以做不同电器拥有水平的变化对用电量的影响程度。

测定出未来主要家用电器拥有量的上升对用电量的影响。

通过模拟计算,下表给出几种主要家用电器的拥有率增加10%后,用电量的增长情况,其中用电量的增长值是10个预测数据的平均值。