新建风电场短期风电预测方法

时间:2022-09-30 10:00:29

新建风电场短期风电预测方法

长久以来,人类社会以化石燃料作为主要能源。化石能源长期地开采使用,也带来了资源枯竭、大气污染和气候变暖等一系列问题。风能作为传统化石能源的一种替代能源,具有分布地域广、储量丰富和可再生等特点,在满足人们对能源需求的同时,也能实现人类社会的可持续性发展。但风力发电具有和传统发电方式不同的特点,例如风能具有季节性、间接性、随机波动等,这都决定了风力发电相关技术更加复杂。其中对风电功率的预测,直接影响到风电并网安全性和电力市场竞争力。风电功率的准确预测对风力发电企业非常重要,是电力调度中的重点、难点问题,也是研究当中的热点问题。风电功率预测可以按时间尺度、空间尺度、预测形式等多个角度进行分类,按照不同的预测模型主要可分为物理模型、统计模型和人工智能方法三类。物理模型方法通过将风力、风向角以及电机可调参数等影响因素,抽象为相应的数学模型,在风场中通过传感器实时监控相关参数,实现电机功率的实时预测。统计模型方法利用统计学知识,将历史采集数据进行识别、拟合和趋势分析,最终对风电功率做出预测。人工智能方法则是以数据为驱动,通过深度神经网络对数据的学习,提取数据内部的关联性和高维特征,并据此对风电功率短期情况给出预测结果。风电功率预测本质上是建立风厂内各因素的相互关系,其预测精准度必须建立在足够多的历史数据上。而新建风电场往往缺少风场内相关信息,难以为风电功率的预测提供支撑。

基于对抗神经网络的风电数据生成数据清洗

由于风电本身的不稳定性,以及非预计停机、弃风限电、天气异常等原因,风场采集的数据中往往会存在大量的异常点,这些异常点将对正常情况下的风电功率预测产生影响。本文用变点分组法原理、最小二乘法原理和四分位法来处理原始数据,从而实现异常点的剔除,另外使用临近值补全的方法对缺失值进行一个填补。这样处理得到的数据更有利于风电功率的预测。

风电数据生成

生成对抗网络属于非监督式学习方法,是深度学习领域的一个重要生成模型。其内部主要包含生成器和判别器两个网络,生成器神经网络负责利用已有数据样本生成新的样本,而判别器神经网络则负责将生成样本从真实样本中尽可能分辨出来。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出样本是否真实。因为有些风电场历史数据量较小,可以利用生成器网络产生的样本,进行数据样本的扩充。并且对抗神经网络是基于非监督式学习,所以不需要准备非常多的数据。利用风电场已有的风电数据来训练对抗生成网络,其中的生成模型网络可以模拟真实数据的概率分布,并输出合成样本。而判别网络需要学习区分这个生成的风电数据是否来自真实的数据分布,经过多轮不断地对抗,从而使合成数据也能够达到真实数据的效果。用于合成风电数据的对抗生成网络框架设计如图1所示。在GAN神经网络训练时使用到的对抗损失函数可以下式来表示。行业曲线开放度创新度生态度互交度持续度可替代度影响力可实现度行业关联度真实度杨乘胜,男,硕士,安徽芜湖,高级工程师,南京华盾电力信息安全测评有限公司,研究方向:电力系统及其自动化。在式(1)中,z代表随机变量,pz(z)代表z的数据分布,Pdata(x)代表真实样本的分布,D和G分别代表判别器和生成器,minGmaxDV(D,G)在于最大化判别器D的价值函数而最小化生成器G的价值函数。在GAN神经网络整个训练过程中,一个随机变量会输入生成器G并输出合成数据,之后由判断器D确定它是否为真数据。整个训练过程需要最大化判别器的概率logD(x),即让所有的数据都被认为来自真实的数据集,相对的要最小化生成器的概率log(1-D(G(z))),使得合成数据愈加接近真实数据的分布。网络采取的是向后传播的方式来调整内部参数,使得网络能够结合预测值和真实值之间的误差,学习到风电数据的高维特征。

基于遗传算法的风电预测

遗传算法的理论基础是达尔文的进化论,它通过模拟自然界中竞争的方式产生优胜劣汰的分化。在使用遗传算法时,将潜在的解集设定为初始的种群,并通过遗传算法的自然选择原理进行不断地进化,最终得出一个最优个体作为整体的一个最优解。遗传算法的构造过程可以按照以下方式进行:(1)确定决策变量及其各种约束条件,即确定出个体的表现型X和问题的解空间。(2)建立优化模型,即确定出目标函数的类型及其数学描述形式或量化方法。(3)确定个体适应度的量化评价方法,即确定出由目标函数值f(X)到个体适应度F(X)的转换规则。(4)设计遗传算子,即确定出选择运算、交叉运算、变异运算等遗传算子的具体操作方法。(5)选择运算,选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。(6)交叉运算:将交叉算子作用于群体。遗传算法中起核心作用的就是交叉算子。(7)变异运算:将变异算子作用于群体。即是对群体中的个体串的某些基因座上的基因值作变动,群体P(t)经过选择、交叉、变异运算之后得到下一代群体P(t+1)。遗传算法用于风电功率预测有以下优点:它是以问题集的串集进行预测的,而不是以某个节点为依据进行的预测,这更有利于得到一个全局择优的结果,减少陷入局部最优解的风险。且遗传算法不是采用确定性规则,而是用概率变签规则来进行预测的,能够做到模糊自适应,并且具有自组织、自适应和自学习能力。遗传算法以上的特征都保证了风电效率的预测能有很好的精度。在遗传算法中,如果某个体i的适应度fi种群大小为NP,则i被选择的概率通过公式(2)计算:

实验结果和分析

评价标准和对照算法为了对风电模型的预测结果进行评估,我们选用了平均绝对百分比误差和均方根百分比误差作为评估的手段。其公式如下所示:上述公式中N为预测的点数,y(k)真实数据,y~(k)模型产生的预测数据。这两个公式主要用来评估预测值的实时误差和时间段内总体误差率,能够很好地反映出模型的单点和整体的预测效果。为验证本文提出的GAN神经网络扩充样本以及后续遗传算法对于短期风电功率预测性能,我们将长短期记忆网络(LSTM)作为对比参照算法。LSTM是一种时间循环神经网络,适合于处理和预测时间序列中间隔和延迟非常长的情况,在风电功率短期预测上已被证实是有效的方法。

仿真实验设计与结果分析

仿真实验使用的数据来自西班牙SotaventoGalicia风场,由风场中的实时传感器每10min对相关数据进行采取,其中包括风向角、风速、发电功率等信息。本文使用SotaventoGalicia风场2022年3月1日至3月15日采集的数据作为训练数据,其中包含了共2130个训练样本。并将3月16日至3月20日共426条数据进行保留,作为训练后模型的测试数据集。另外使用GAN神经网络对训练数据进行扩充,共得到510个合成数据样本,扩充的训练数据集包含了2640个数据样本。本文在pytorch深度学习框架中实现GAN神经网络并进行训练,用Python语言实现遗传算法,实验计算机硬件配置为NVDIAGTA2060T显卡和IntelCorei78700KCPU。训练中将GAN神经网络参数epoch设置为300,batchsize设置为18,学习率设置为0.001;遗传算法基本参数设置为种群数量为20,终止代数为40,交叉概率为0.45,变异概率为0.01。为了验证本文的GAN神经网络合成数据和遗传算法的风电功率预测性能,本文共设计了3个对比实验,第一个将扩充训练数据集的2640个样本数据作为遗传算法的输入,并且对3月16日到20日的短期风电功率进行预测。另外两个对比实验仅仅只用到原始训练数据集的2130个训练样本,分别用于遗传算法和LSTM并对16日至20日的风电功率进行预测,实验结果如图3所示。通过上面的仿真结果对比,可以发现在未使用GAN神经网络扩充训练数据集的情况下,遗传算法依然优于LSTM的预测性能,预测结果更加接近于真实值。而在3个对比仿真实验中,本文提出的GAN神经网络和遗传算法的组合,取得了最优异的预测结果。相对于未使用扩充训练数据的遗传算法的预测结果,GAN神经网络和遗传算法的预测结果更加精准且在整体趋势上更贴合真实数据。这个结果说明利用GAN神经网络合成的数据样本,可以用来训练预测模型,且有助于提高最终的预测精确度。另外,为了研究不同数量训练样本情况下,各类算法的预测性能的区别以及GAN神经网络扩充数据集对预测性能的提升效果,本文将SotaventoGalicia风场2022年3月1日至3月15日采集的2130个训练样本,其中的20%,50%,70%和全部样本选取出来,形成4个不同样本数量的训练数据集。这4个训练数据集用于训练遗传算法和LSTM,并对之后200个时间点风电功率进行预测。而本文提出的GAN神经网络和遗传算法的组合方法,首先将使用GAN神经网络对训练数据集进行扩充,合成数据量基本为原样本数量的25%,之后合成数据和原始训练数据合成为扩充训练数据集,用于遗传算法并对之后200个时间点风电功率进行预测。实验中使用均方根百分比误差对各模型的预测结果性能进行评价,评价结果如表1所示。从表1的实验结果看,在不同数量训练样本情况下,遗传算法的预测性能依然优于LSTM算法。基于GAN神经网络扩充数据集的方法,在样本数量较小时也能取得较好的预测结果。随着样本训练集大小的不断增加,各个模型的均方百分比误差都在逐渐减小,这是因为不断增加的样本给模型预测,提供了更多的信息和特征。GAN神经网络合成数据的提升效果也慢慢降低,但是依然对预测准确度有一定程度地提升效果,比如在样本只有总样本20%和70%的时候,GAN神经网络生成数据集的提升效果分别为16.2%和8.12%,这可能是在数据量较小时模型获得的信息更加匮乏,合成数据可能起到更大的作用。

技术总结

本文提出了基于GAN神经网络和遗传算法进行短期风电功率预测,用来解决某些风电场缺少历史数据而难以预测发电功率的问题。根据仿真实验结果,我们可以得出以下结论:当样本数据集较小的时候,我们可以利用GAN神经网络对抗生成数据,并将生成数据用于模型的训练和预测当中。它有助于提高预测的准确率,减少样本量过少带来的影响;GAN神经网络和遗传算法的组合,在缺少样本的情况下,也可以有效地进行短期风电功率的预测,相对于LSTM算法取得较好的一个预测结果。在进一步的工作中,将充分探索GAN神经网络和其他算法的组合,在小样本风电功率预测上取得更精准的结果。

作者:杨乘胜