-
风速预报在风力发电、空气污染预报等很多方面都有着广泛的应用[1-2],其重要性不言而喻.然而,由于风兼具波动性和间歇性的特征,使得获取准确的风速预报成为一个引人关注的难题[3].
针对风速预报的研究,近几十年发展的模型大致可分为2类,分别是统计模型和物理模型[4].统计模型通常利用历史观测资料建立模型,常用算法包括自回归滑动平均模型(ARMA)[5]、支持向量机(SVM)[6]、人工神经网络(ANN)[7]等.统计模型多依赖于历史观测资料的质量和数量,相比之下,物理模型依托于流体力学,对风场的物理机制有明确的解释,风速预报时效更长,常用物理模式有MM5[8]和WRF[9]等.但物理模型的预报结果往往存在着一定的不确定性.这种不确定性可能是由水平分辨率设置的不同带来的,也可能来自物理参数化选择的差异. Al Yahyai等人[10]的研究表明,区域风速易受地形影响,而水平分辨率对模式地形的描述存在直接影响;Wagenbrenner等人[11]认为,提高模式分辨率对复杂地形的风速模拟效果有显著改进;此外,Zhang Dalin等人[12]指出,物理参数化方案的选择,尤其是计算大气湍流的边界层参数化方案,也会对风速模拟造成较大影响;而Iorio等人[13]发现,物理模式的分辨率和物理参数化之间存在相互作用,它们会共同决定模式预报的准确性.
针对物理模式的不确定性问题,最有效的途径之一是集合预报方法,其基本思路是:找出数值预报模式可能存在的所有解(即多个集合成员),估算误差分布的范围.当集合成员足够多时,真实风速就可能被包含在集合预报中.例如Deppe等人[14]考虑了6种边界层参数化方案下模拟结果的集合平均,风速预报效果得到了显著提高;Bossavy等人[15]用51个成员的集合平均进行预报,发现集合预报可以更好地捕捉到风速短时间内陡增或陡降的现象.
以上研究均是将集合预报成员进行算术集合平均,近年来随着研究的不断深入,很多研究表明,某些权重选择的优化算法对风速集合预报有重要贡献.例如,Liu等人[16]利用粒子群(PSO)和遗传算法(GA)来选择最优NWP模式参数,很大地提高了风能预报能力;Dong等人[17]选择布谷鸟搜索算法(CS)对滤波后的不同风速序列进行权重选择来提高风速预报能力.本文利用的FPA算法,是Yang[18]于2012年提出的一种基于花授粉行为的仿生学智能优化算法. Yang对FPA算法性能的测试显示,对于解决最优化问题,FPA算法要强于GA算法和PSO算法.理论上权重系数应从[0, 1]之间进行取值,而Xiao等人[19]的试验表明,当权重系数扩展到[-2, 2],扰动粒子群(CPSO)和GA优化算法的性能都得到了提高.由此Xiao等人[19]提出了NNCT理论,即将权重系数的范围扩展到可设负值,当预报序列趋势与实际趋势相反时,权重系数为负;反之,权重系数为正.基于FPA算法和NNCT理论各自的优势,本文首先选择不同水平分辨率和边界层物理参数化方案组合而成一个WRF集合预报系统,并联合NNCT理论和FPA优化算法,对该集合预报成员的风速预报权重进行分配,以最终达到提高风速预报精度的目的.
HTML
-
山东省位于中国东部沿海,中部为鲁中山区,地势高突,山地海拔约500 m,东部为山东半岛,濒临渤海、黄海,该省的风能资源非常丰富.为了检验新模型对不同地形、不同天气背景下风速的预报性能,本文选取2个代表站,一个是沙沟风电场站(118°31.83′E,36°5.45′N),位于鲁中山区;另一个是威海风电场站(122°17.61′E,37°23.47′N),位于山东海滨地带.利用2站风能观测塔70 m高度的风速资料进行模式验证,观测时间从2014年3月5日至3月14日,时间间隔为15 min.该期间以平稳小风天气为主,但受不同地形影响,2个代表站的风速日变化特征不同.其中威海风电场站受海陆热力影响较大,风力日变化显著,中午风速接近8 m/s,其他时间风力较小;而沙沟风电场站受山地影响,夜间风速反而较大.观测期间,8日山东经历了一次弱天气过程,局部地区有小雨,威海、沙沟风电场站为阴天,风向均为西南风;11日-13日期间,受强冷空气南下影响,11日威海、沙沟均出现阵雨和小雨天气,此后2站大部分时间维持10~16 m/s的西北大风.
-
12个集合成员分别是WRF模式3种水平分辨率和4种边界层物理参数化方案的设置组合而成的. 3种水平分辨率分别为27 km、9 km和3 km,分别对应的模拟范围是D1(100°-135°E,30°-46°N),D2(110°-130°E,32°-40°N),D3(113°-125°E,34°-38°N).其中,D1,D2和D3区域不采用嵌套而是分别进行模拟,用以单独判断不同水平分辨率对模式风速预报的影响. 4种边界层参数化方案分别为YSU方案、MYJ方案、ACM2和UW方案.此外,陆面过程采用Noah方案,短波辐射采用Dudhia方案,长波辐射采用RRTM方案,云微物理采用WSM5方案和积云对流采用Grell 3D方案.通常,当网格尺度小于5 km时,积云对流已经不再是完整的次网格过程.因此当水平分辨率设置为3 km时,关闭积云对流参数化方案.
模式由全球预报系统模式(GFS)提供初始场和侧边界条件.静态地形数据来自美国地质勘探局(USGS),水平分辨率采用30″.模拟时段为2014年3月5日-3月14日,每次启动只预报24 h,每15 min输出一次风速预报结果,即每天有96次风速预报输出.当用到风电场站点观测资料进行检验时,采用反距离权重法将WRF的格点预报结果插值到相应站点以方便比较.
-
FPA算法是Yang[18]于2012年提出的元启发式算法,模拟开花植物的授粉过程.花授粉过程有2个途径——异花授粉和自花授粉.在异花授粉中,花粉通过传播者(昆虫或动物)长距离传播到其他花朵上,这些传播者的飞行步长遵循莱维飞行分布.异花授粉又被称为全局授粉.自花授粉是一朵花的繁殖,被视为局地授粉.局部授粉和全局授粉受转移概率p的控制,p∈[0, 1]. FPA算法主要公式如下:
1) 异花授粉过程:
式中:xiiter代表了在迭代次数iter下的花粉i;xibest表示最优解;γ为控制迭代步长的比例因子;L为莱维飞行模式,莱维分布代表了花粉传播的强度:
式中:Γ(λ)是标准伽马函数;S代表步长,分布因子λ∈[0.3,1.99].
2) 自花授粉过程:
式中:xjiter和xkiter是经过第iter次迭代,来自同一品种不同花的花粉,ε∈[0, 1].
3) 转移概率p是异花授粉到自花授粉的转换系数,当p取0.8时,算法适用于大部分实际情况.
-
基于前文对WRF集合成员的构建、FPA算法和NNCT理论的介绍,我们提出了FPA-NNCT-WRF-E风速集合预报模型.新模型计算的主要流程见图 1.
1) 步骤1:
利用WRF模式不同分辨率和边界层参数化方案设置组合得到的风速预报结果,产生12个集合成员.集合模式可以表示为:
式中:OutputMEM-i是第i个集合成员的风速数值预报结果;wi(i= 1,2…12)是集合成员i的权重系数.
2) 步骤2:
利用FPA算法进行最优wi的计算.首先,需要确定最优化问题的目标函数.目标函数(Target function)的计算公式如下所示:
式中:Obs是观测值;N为时效24 h预报结果的次数.由于WRF模式每隔15 min输出一次结果,即每小时输出4次,则24小时时效预报中N=24×4=96次.
然后引入NNCT理论,将权重系数范围的设置扩展到[-2, 2]之间.权重选择过程可以被写成如下形式:
当目标函数达到最小值或迭代次数达到最大值时,权重选择过程将被停止.本文中,迭代次数最高设置为1 000次.
3) 步骤3:
在步骤1、步骤2的基础上,对每个WRF预报集合成员进行加权平均,将这样重构后的集合值作为最终的风速预测结果.
1.1. 研究区域与观测数据
1.2. 风速集合预报成员的构建
1.3. FPA权重优化算法
1.4. FPA-NNCT-WRF-E风速集合预报模型
-
为了检验新模型的预报准确率,采用3种误差计算公式:
平均绝对误差(MAE):
均方根误差(RMSE):
相对百分比误差(MAPE):
式中:yi代表观测值,
${{{\hat y}_i}}$ 代表预报值,这3种误差值越小,代表模式的准确率越高. -
集合预报最常用的方法是取各集合成员的算术平均.由于算术平均可以将无法预报的随机信息滤掉,故算术集合平均通常比单个预报更为准确.本文把12个WRF集合成员的算术平均M-WRF-E作为基准模型,将FPA-WRF-E和FPA-NNCT-WRF-E模型的预报效果与之对比,以此检验新模型对风速的预报能力是否有改进.
2.1. 误差检验
2.2. 基准模型
-
设计一组合理的集合成员是集合预报的基础,因此,本文选取威海和沙沟2个风电场作为滨海和山地代表站,并以MAE作为误差检验标准,对12个WRF集合成员24 h时效预报中的表现进行检验.
从10天的逐日误差分析来看,不同水平分辨率的集合成员间预报效果差异有统计学意义.以2014年3月14日为例,图 2分别表示这一日WRF集合成员MEM-2,MEM-6,MEM-10的风速模拟结果,MEM-2,MEM-6和MEM-10分别选择了3 km、9 km和27 km的水平分辨率,但边界层参数化方案均选用了MYJ方案.这一天内有弱冷空气过境,风速持续增大.在这种大尺度天气背景下,代表不同地形的风电场预报结果对水平分辨率仍具有不同的敏感性.威海风电场的预报结果显示,3 km和9 km的水平分辨率优于27 km分辨率(图 2(a));沙沟风电场的预报结果显示,9 km和27 km的水平分辨率优于3 km分辨率(图 2(b)).
统计显示,在12个集合成员中,27 km分辨率的风速预报结果在威海风电场有6次取得了MAE的最小值,而9 km和3 km分辨率分别有3次和2次取得MAE最小值.与此同时,27 km、9 km和3 km分辨率在沙沟风电场分别有3次、5次和3次取得了MAE的最小值.表明对于威海风电场而言,27 km分辨率的预报结果准确率更高;对于沙沟风电场而言,9 km分辨率预报效果更好.一般认为,水平分辨率越高,预报效果越好.但10天的试验结果证明,采用不同的水平分辨率,其预报结果存在很大的不确定性,并不是对模式设置较高分辨率总能得到最好的预报效果.
此外,不同参数化方案的集合成员间预报效果差异有统计学意义.以2014年3月8日为例,图 3表示MEM-9,MEM-10,MEM-11和MEM-12的风速模拟结果,MEM-9,MEM-10,MEM-11和MEM-12分别选择了YSU,MYJ,UW和ACM2的边界层参数化方案,但水平分辨率均选择27 km.这日,受极地涡旋底部的东北气流控制,局部地区出现小雨,威海和沙沟地区为阴天.威海风电场的预报结果显示,MYJ方案相对其他方案有明显优势(图 3(a));而沙沟风电场的预报结果表明ACM2方案相对于其他方案略有优势(图 3(b)).
经统计显示,YSU,MYJ,UW和ACM2方案在威海风电场分别有5次、3次、2次和1次取得MAE的最小值. YSU,MYJ,UW和ACM2方案在沙沟风电场分别有2次、3次、5次和1次取得MAE的最小值.这表明YSU方案可能更适用于威海风电场,UW方案可能更适用于沙沟风电场.由于参数化方案的复杂的设计,每种方案都有其优点和适用性,很难针对所有天气和地形情况而选择一种确定性的边界层参数化方案.
-
把12个WRF集合成员的算术平均M-WRF-E作为基准模型,FPA-WRF-E为单纯利用FPA算法分配权重系数的集合模型,FPA-NNCT-WRF-E为利用NNCT改进后的FPA算法分配权重系数的集合模型,利用MAE,RMSE和MAPE 3种误差检验标准,进行这2个加权集合模型与基准模型的比较.此外,还对M-WRF-E,FPA-WRF-E和FPA-NNCT-WRF-E分别进行了偏差-方差检验.
图 4给出了2个风电场站的逐日误差分析结果.对于威海风电场站,与基准模型M-WRF-E相比,FPA-WRF-E模型的平均MAE,RMSE和MAPE的逐日误差均稳定减小,平均MAE和RMSE从1.66 m/s,2.04 m/s减小到1.25 m/s,1.53 m/s,MAPE从40%减小到33%. MAE,RMSE和MAPE的误差减小率依次为25%,25%和18%.而FPA-NNCT-WRF-E模型比基准模型的逐日误差减小更多,平均MAE,RMSE分别减小到0.89 m/s,1.11 m/s,MAPE减小到25%,MAE,RMSE和MAPE的误差减小率依次为46%,46%和38%.对于沙沟风电场站,与基准模型M-WRF-E相比,FPA-WRF-E模型的平均MAE,RMSE和MAPE的平均MAE,RMSE从1.78 m/s,2.25 m/s减小到1.43 m/s,1.84 m/s,MAPE从32%减小到27%,MAE,RMSE和MAPE的误差减小率依次为20%,18%和18%. FPA-NNCT-WRF-E模型平均MAE,RMSE减小到1.11 m/s,1.44 m/s,MAPE减小到20%. MAE,RMSE和MAPE的误差减小率依次为38%,36%和38%,与威海风电场站一样,FPA-NNCT-WRF-E模型的风速预报比FPA-WRF-E模型改进效果更好.
总的来说,与基准模型相比,FPA-WRF-E模型将不同下垫面风电场风速预报结果的MAE减小了20%~25%,FPA-NNCT-WRF-E模型的风速预报误差更减小了38%~46%.对平坦和粗糙2类截然不同的下垫面地形站点,FPA-NNCT-WRF-E模型的风速预报均有较大改进,可以预见新模型在各类下垫面站点也同样有优势.
3.1. 集合成员间的比较
3.2. FPA集合模型与基准模型的比较
-
1) 针对WRF模式不同水平分辨率和边界层参数化设置引起的不确定性,选择不同的方案进行组合来构建集合预报成员.
2) 结合NNCT理论和传统的FPA算法,提出FPA-NNCT权重优化算法,用以确定各集合成员的权重系数,构建了一种新的FPA-NNCT-WRF-E风速预报模型,将重构后的集合值作为最终的风速预报.
3) 利用滨海和山地2种不同下垫面特性的风速测站对新模型进行验证,与基准模型M-WRF-E相比,新模型的风速预报结果的MAE减少了38%以上,RMSE减少了36%以上,MAPE减少了38%,其预报准确性得到了提高.