Message Board

Dear readers, authors and reviewers,you can add a message on this page. We will reply to you as soon as possible!

2025 Volume 47 Issue 5
Article Contents

JIN Baoming, ZENG Hongyuan, LU Wangming, et al. Research on Flood Forecasting Model for Mountainous Basin Based on LSTM[J]. Journal of Southwest University Natural Science Edition, 2025, 47(5): 177-187. doi: 10.13718/j.cnki.xdzk.2025.05.015
Citation: JIN Baoming, ZENG Hongyuan, LU Wangming, et al. Research on Flood Forecasting Model for Mountainous Basin Based on LSTM[J]. Journal of Southwest University Natural Science Edition, 2025, 47(5): 177-187. doi: 10.13718/j.cnki.xdzk.2025.05.015

Research on Flood Forecasting Model for Mountainous Basin Based on LSTM

More Information
  • Received Date: 03/11/2024
    Available Online: 20/05/2025
  • MSC: TV124

  • The flood in mountainous basin has the characteristics of strong suddenness and short forecast period. Rapid and accurate flood forecasting is always the key issue in the work of flood control. Based on the long-term and short-term memory deep learning neural network technology, this paper selects 30 rainstorm and flood processes in Chongyang River Basin from 1997 to 2022, including 21 floods as the training set, takes the hourly rainfall of six rainfall stations in the upper reaches such as Wubian and the previous flow of control section of Wuyishan station as the model input, and the corresponding flood flow of this section as the model output, and uses the root mean square error minimum criterion to analyze and determine the number of LSTM hidden layer units and network iteration rounds. At the same time, a full connection layer is set behind the LSTM layer, and the full connection layer is dropout processed to establish the LSTM neural network model with time series memory function for mountain basin. The model was used to test the remaining 9 floods and compared with the LMBP model. The results show that the LSTM model has higher prediction accuracy than the LMBP model in terms of flood process, peak discharge and peak time. It is suitable for flood prediction in mountainous basins.

  • 加载中
  • [1] HOCHREITER S, SCHMIDHUBER J. Long Short-Term Memory[J]. Neural Computation, 1997, 9(8): 1735-1780. doi: 10.1162/neco.1997.9.8.1735

    CrossRef Google Scholar

    [2] 吴剑. 基于长短时记忆网络的山丘区中小河流洪水预报研究[D]. 大连: 大连理工大学, 2021.

    Google Scholar

    [3] 冯钧, 潘飞. 一种LSTM-BP多模型组合水文预报方法[J]. 计算机与现代化, 2018(7): 82-85, 92. doi: 10.3969/j.issn.1006-2475.2018.07.017

    CrossRef Google Scholar

    [4] TIAN Y, XU Y P, YANG Z L, et al. Integration of a Parsimonious Hydrological Model with Recurrent Neural Networks for Improved Streamflow Forecasting[J]. Water, 2018, 10(11): 1655. doi: 10.3390/w10111655

    CrossRef Google Scholar

    [5] KRATZERT F, KLOTZ D, BRENNER C, et al. Rainfall-Runoff Modelling Using Long Short-Term Memory (LSTM) Networks[J]. Hydrology and Earth System Sciences, 2018, 22(11): 6005-6022. doi: 10.5194/hess-22-6005-2018

    CrossRef Google Scholar

    [6] LE X H, HO H V, LEE G, et al. Application of Long Short-Term Memory (LSTM) Neural Network for Flood Forecasting[J]. Water, 2019, 11(7): 1387. doi: 10.3390/w11071387

    CrossRef Google Scholar

    [7] 殷兆凯, 廖卫红, 王若佳, 等. 基于长短时记忆神经网络(LSTM)的降雨径流模拟及预报[J]. 南水北调与水利科技, 2019, 17(6): 1-9, 27.

    Google Scholar

    [8] ZHOU Y, GUO S, CHANG F, et al. Hydrological Forecasting Using Artificial Intelligence Techniques[J]. Journal of Water Resources Research, 2019, 8(1): 1-12. doi: 10.12677/JWRR.2019.81001

    CrossRef Google Scholar

    [9] 张森, 颜志俊, 徐春晓, 等. 基于MPGA-LSTM月径流预测模型及应用[J]. 水电能源科学, 2020, 38(5): 38-41, 75.

    Google Scholar

    [10] 崔巍, 顾冉浩, 陈奔月, 等. BP与LSTM神经网络在福建小流域水文预报中的应用对比[J]. 人民珠江, 2020, 41(2): 74-84.

    Google Scholar

    [11] DING Y K, ZHU Y L, FENG J, et al. Interpretable Spatio-Temporal Attention LSTM Model for Flood Forecasting[J]. Neurocomputing, 2020, 403: 348-359. doi: 10.1016/j.neucom.2020.04.110

    CrossRef Google Scholar

    [12] 刘扬, 王立虎. 基于改进EMD-LSTM的洪水预测方法研究[J]. 水利水电技术(中英文), 2022, 53(1): 35-44.

    Google Scholar

    [13] 李志超, 张怡雯, 邬强, 等. 基于分级优化与LSTM方法的中小流域洪水预报研究[J]. 水利水电技术(中英文), 2022, 53(8): 41-49.

    Google Scholar

    [14] 罗朝林, 张波, 孟庆魁, 等. 基于长短时记忆神经网络的水库洪水预报[J]. 人民珠江, 2022, 43(12): 128-134.

    Google Scholar

    [15] 王逸阳. LSTM与多头注意力机制视角下的洪水预报模型研究[D]. 郑州: 华北水利水电大学, 2023.

    Google Scholar

    [16] 李志超, 邬强, 胡彩虹, 等. 基于LSTM误差校正蓄满-超渗兼容模型的山洪预报研究[J]. 武汉大学学报(工学版), 2023, 56(10): 1161-1171.

    Google Scholar

    [17] 毕成琳, 刘匡, 向征, 等. 洪水预报区域化LSTM模型研究[J]. 水电能源科学, 2023, 41(12): 63-67.

    Google Scholar

    [18] 张锦堂, 任明磊, 李京兵, 等. 基于长短时记忆网络的山区中小流域降雨径流模拟[J]. 水电能源科学, 2024, 42(8): 33-37.

    Google Scholar

  • 加载中
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

Figures(6)  /  Tables(5)

Article Metrics

Article views(204) PDF downloads(19) Cited by(0)

Access History

Research on Flood Forecasting Model for Mountainous Basin Based on LSTM

Abstract: 

The flood in mountainous basin has the characteristics of strong suddenness and short forecast period. Rapid and accurate flood forecasting is always the key issue in the work of flood control. Based on the long-term and short-term memory deep learning neural network technology, this paper selects 30 rainstorm and flood processes in Chongyang River Basin from 1997 to 2022, including 21 floods as the training set, takes the hourly rainfall of six rainfall stations in the upper reaches such as Wubian and the previous flow of control section of Wuyishan station as the model input, and the corresponding flood flow of this section as the model output, and uses the root mean square error minimum criterion to analyze and determine the number of LSTM hidden layer units and network iteration rounds. At the same time, a full connection layer is set behind the LSTM layer, and the full connection layer is dropout processed to establish the LSTM neural network model with time series memory function for mountain basin. The model was used to test the remaining 9 floods and compared with the LMBP model. The results show that the LSTM model has higher prediction accuracy than the LMBP model in terms of flood process, peak discharge and peak time. It is suitable for flood prediction in mountainous basins.

  • 开放科学(资源服务)标识码(OSID):

  • 山区流域暴雨极易造成洪水灾害, 因此洪水预报工作至关重要。除了采用传统的预报方法外, 也可采用深度学习循环神经网络(Recurrent Neural Networks, RNN)洪水预报模型进行预报, 长短时记忆神经网络(Long Short Term Memory, LSTM)模型就是其中的一种。文献[1]在一般RNN理论的基础上, 提出了LSTM网络。近年来有不少学者开始把LSTM网络应用于水文序列的预测[2]。文献[3]将LSTM和BP两种模型相结合进行降雨径流预测, 预报精度符合要求。文献[4]比较了长短期记忆网络、一般循环网络、回声状态网络以及GR4J模型的日径流模拟效果, 结果表明LSTM模型在中小流域降雨径流预报中效果更好。文献[5]对比了LSTM与萨克拉门托模型的径流预测结果, 相对来说前者模拟效果更好。文献[6]采用LSTM网络研究受上游水库泄洪影响的Mekong河径流预测工作, 预测结果良好。文献[7]建立了LSTM洪水预报模型, 其表现出的效果比新安江模型好。文献[8]构建了三峡水库LSTM洪水预报模型, 其效果优于BPNN和动态神经网络模型。文献[9]构建了MPGA-LSTM径流预测模型, 对石砻站2013-2017年逐月径流过程进行预测, 精度达到甲级标准。文献[10]利用渡里站逐时降雨和流量数据构建BP和LSTM网络进行流量预报, 结果表明后者整体预报效果优于前者。文献[11]构建了考虑时空分布变化的SLA-LSTM模型, 效果优于卷积网络模型。文献[12]将经验模态分解方法和LSTM网络相结合, 使模型的模拟效果显著提升。文献[13]利用径向基函数(RBF)网络和降雨方差对洪水进行分级, 建立LSTM洪水预报误差校正模型, 对分级洪水预报结果进行校正, 效果较好。文献[14]针对不同预见期建立白盆珠流域LSTM模型, 并与新安江模型进行对比, 证明了LSTM网络具有较高的预报精度。文献[15]引入LSTM网络建立大汶河流域洪水预报模型, 预测结果较好。文献[16]建立AR和LSTM误差校正模型, 对预报流量进行误差校正, 结果表明LSTM模型效果优于AR模型, 可有效提高洪水预报精度。文献[17]构建了基于LSTM的区域化洪水预报模型, 模型能够较好地模拟实际洪水过程。文献[18]引入LSTM网络建立山区中小流域降雨径流模型, 结果表明LSTM网络对山区中小流域暴雨洪水非线性关系具有良好的拟合效果。总体而言, LSTM网络或耦合LSTM的相关模型在降雨径流和洪水预报方面表现突出, 但该类模型在山区中小河流源头流域的洪水预报应用研究相对不多。为此本文构建崇阳溪上游流域LSTM洪水预报模型, 为防洪工作服务。

1.   LSTM基本结构
  • LSTM单元结构如图 1所示, xt为输入, LSTM单元包括遗忘门、输入门和输出门。

    遗忘门为:

    式中: ft为t时刻遗忘门输出向量;σ(·)为sigmoid激活函数;ht-1t-1时刻的隐藏状态;WxfWhfxtht-1对应的遗忘门权值矩阵;bf为遗忘门的偏置矩阵。

    输入门为:

    其中:itt时刻输入门输出向量;tanh(·)为双曲正切激活函数;WxiWhixtht-1对应的输入门权值矩阵;bi为输入门的偏置矩阵;gtt时刻的单元状态候选向量;WxgWhgxtht-1对应的tanh层权值矩阵;bg为tanh层的偏置矩阵。

    单元状态

    式中:ctct-1分别为tt-1时刻的单元状态更新向量。

    输出门为:

    其中:ott时刻输出门输出向量;WxoWhoxtht-1对应的输出门权值矩阵;bo为输出门的偏置矩阵;htt时刻的隐藏状态。

2.   山区流域LSTM洪水预报模型构建
  • 选取崇阳溪上游流域为研究区域(图 2)。该流域位于福建省武夷山市, 属于建溪支流崇阳溪的源头。武夷山水文站控制流域面积为1 078 km2, 包括东溪和西溪两条支流, 流经地形多为山地丘陵, 地势坡降大, 属于典型的山区流域。雨季期间, 暴雨频发容易导致洪水灾害。

  • 收集了该流域1997年至2022年间30场暴雨洪水, 对其发生过程进行分析并建模, 其中训练集包括21场洪水、测试集包括9场洪水。在划分训练样本和测试样本的过程中, 均综合考虑了高、中、低不同量级的洪水过程以及不同峰型(如单峰、双峰)的洪水, 且样本数据具有代表性、可靠性、一致性、普遍适用性。测试集的9场洪水基本情况见表 1

  • 根据LSTM网络对时间序列的记忆能力, 在模型数据输入之前需要将不同序列数据在时间尺度下进行统一, 采用式(7)计算:

    式中:Xi(t)为t时刻第i个雨量站降雨过程Pi对应的模型输入数据;τi为其净雨到武夷山站的汇流时间。综合分析确定洋庄、吴边、大安、坑口、岭阳、岚谷各雨量站净雨到武夷山站的汇流时间分别为1h、1.5 h、2.5 h、3 h、4 h、3 h。调整后的数据序列统一到同一个时间尺度下, 以满足LSTM模型的输入要求。

  • 模型输入数据包括流量和雨量两种类型, 其来源和量纲不同, 数据值域相差较大。为了适应LSTM网络的学习, 论文采用(8)式所示Z-score标准化算法对数据进行标准化处理。

    式中:z为标准化处理后的数据;x为标准化处理前的数据;μ为均值;σ为标准差。经过处理后数据的均值为0, 标准差为1, 值域为[-1, 1], 以此构建向量输入LSTM网络模型。在LSTM网络模型训练结束后, 对输出的预测结果再经过反标准化处理得到实际的输出预测值。

  • 为衡量各雨量站的雨量在产汇流过程中的占比, 需要对该流域进行单元划分, 计算各控制站点子流域单元面积权重。根据泰森多边形法将流域划分为7个子单元, 各单元面积和权重占比见表 2

  • 以崇阳溪上游6个雨量站的时段雨量数据为基础、增加流域控制断面武夷山水文站前1 h的流量数据作为模型输入, 以该站对应流量数据为预测目标, 建立山区流域LSTM神经网络洪水预报模型。网络模型结构如图 3所示。

    输入层计算式为:

    式中:ab为去零化参数, 取a=0.5、b=2;λj为各雨量站子流域单元面积权重;μpjσpj分别为输入的各雨量站时段雨量序列均值、标准差;μqσq分别为武夷山水文站实测流量序列均值、标准差。t时刻模型输入层的输入包括:同步后的6个雨量站时段雨量Pj(t-τj);前1 h武夷山水文站记录的实测流量Q(t-1), 经该层预处理后转化为LSTM层的输入信息矩阵X(t)。

    LSTM层计算式为:

    t时刻LSTM层的输入包括:t-1时刻记忆单元输出的武夷山站流量信息矩阵h(t-1);t-1时刻记忆单元根据输入信息学习到的状态变量矩阵c(t-1);当前输入信息矩阵X(t)。经过输入门、遗忘门、输出门的激活函数运算, 舍弃使损失函数增大的负面信息, 记录对预测精度有正反馈的信息并更新单元状态, 以此生成当前流域出口断面流量信息矩阵h(t)。

    在LSTM层之后设置了一个包含10个单元的全连接层, 用于将LSTM层各单元训练学习得到的数据特征进行整合, 以达到最终需要输出维度为1的结果。全连接层计算式为:

    式中:yi(t)为全连接层各单元输出信息, 由LSTM层各单元输出的武夷山站流量信息矩阵h(k)整合而来;n为LSTM层单元数;Wykbyk为全连接层的权值矩阵和偏置值。

    在网络隐含层和输出层之间的全连接层进行dropout处理, 抛弃因子设置为10%, 该设置会在训练期间将全连接层10%的随机单元输出设置为零, 以便网络进行更稳健的特征学习, 从而增强模型的泛化能力并降低网络过拟合风险。dropout层计算式为:

    式中:Y(t)为dropout层输出信息, 由全连接层各单元输出信息整合而来, dropout层使用了由0和1组成的10×1随机数矩阵以抛弃冗余信息。

    t时刻, 经全连接层整合、dropout层随机数筛选后再由输出层去标准化, 最终获得预测流量值。输出层计算式为:

    式中:Q(t)为武夷山站预测流量值;μqσq含义同式(9)。

  • 通过分析训练集洪水流量均方根误差(RMSE)平均值随LSTM层隐含层单元数和网络迭代轮数组合变化而变化的情况, 以此判定两个参数的最优组合。模型学习速度取0.01。表 3为模型训练结束后, 训练集洪水的RMSE平均值随LSTM层隐含层单元数(hidden units)和网络迭代轮数(epochs)组合变化的趋势, 并绘制其三维曲面、二维等值线图, 详见图 4所示。

    根据表 2图 4可见, 当LSTM层隐含层单元数为8、网络迭代轮数为50次时, RMSE值较大, 网络由于参数迭代不足而未收敛;随着两个参数的增加, RMSE值逐步降低, 当隐含层单元数为32、迭代轮数为100次时, RMSE达到最小;随着两个参数继续增大, RMSE值又开始上升。整体趋势面图像呈现出两端高、中间低的“山谷”形态。故最终确定LSTM隐含层单元数为32、网络迭代轮数为100。

    根据选定的LSTM隐含层单元数和网络迭代轮数设置模型结构。在多次试算并反复调整参数后, 损失函数变化曲线趋于平稳, 网络训练结束, 至此完成LSTM神经网络洪水预报模型的构建。

  • 采用上述模型对选定的测试集9场暴雨洪水过程进行模拟验证, 得到9场洪水流量预报过程线图(图 5)。为了进行对比, 同样采用训练集样本构建流域LMBP神经网络洪水预报模型, 调试后的模型结构为7-8-1, 即输入层单元数为7、隐含层单元数为8、输出层单元数为1, 对选定的测试集9场暴雨洪水过程进行模拟, 结果见图 6

    采用绝对误差绝对值的平均值(取完绝对值后再平均, 下同)、相对误差绝对值的平均值、纳什效率系数3个评定指标对两个模型精度进行综合分析, 得到每场洪水流量过程预报误差见表 4, 洪峰流量相对误差和洪峰出现时间误差见表 5。其中相差时间是指洪峰出现预测时间减去实际出现时间。

    综合LSTM模型整个预报过程线来看, 除20080719洪水过程平均相对误差为10.4%外, 其他误差均小于10%, 模型确定性系数均大于0.920。与LMBP模型的结果比较, 9场洪水流量预报过程中, 有8场洪水相对误差的平均值小于LMBP模型的误差, 7场洪水的确定性系数大于后者的确定性系数。

    洪峰流量方面, 9场洪水的洪峰流量绝对误差总体较小, 平均值为58.6 m3/s, 误差最大值出现在19980614洪水主峰, 误差为175 m3/s, 高流量洪水的绝对误差大于中低流量洪水。9场洪水的洪峰流量相对误差都处在较为理想的范围, 平均值仅为3.7%, 误差最大值出现在20030625洪水主峰, 误差6.9%。LSTM模型在洪峰流量预测方面也相对占优, 误差较小, 精度略高于LMBP模型。

    洪峰出现时间方面, 9场洪水洪峰出现时间误差最大值为1 h, 最小值为0, 平均时间误差为23 min, 处于允许的时差范围。每场洪水预测洪峰出现时间相较实测值或早或晚, 但总体上偏晚居多。与LMBP模型相比, LSTM模型在洪峰出现时间预测方面性能更好, 精度更高。

    总体而言, 两种模型的精度均符合规范要求, 相对来说深度学习LSTM模型具有显著优势。

3.   结语
  • 针对崇阳溪源头山区流域地形地貌复杂的特点, 选取流域暴雨洪水过程, 采用均方根误差最小准则优化率定网络的LSTM隐含层单元数和网络迭代轮数, 在LSTM层之后设置了一个包含10个单元的全连接层, 并对全连接层进行dropout处理, 建立崇阳溪上游山区流域LSTM神经网络洪水预报模型。该网络适合用于模拟序列中具有时间间隔和延迟的数据关系, 以此生成流域出口断面流量过程信息。同时构建了该流域的LMBP模型进行比较, 主要结论如下:

    1) LSTM与LMBP模型的对比结果表明, 具有深度学习功能的LSTM模型预测精度较高, 其在洪水过程、洪峰流量和洪峰出现时间预测方面的精度高于人工神经网络LMBP模型, 模型的确定性系数也明显占有优势, 因此适用于山区源头流域的洪水预报。

    2) 通过考虑雨量站净雨到控制断面的汇流时间, 将不同序列数据在时间尺度下进行同步化处理后作为模型的输入, 预报效果相对更好。

    3) 在LSTM层之后设置全连接层并对全连接层进行dropout处理, 其在LSTM层隐含层单元数和网络迭代轮数的优化组合选择中具有较好的优势, 可以提高模型的泛化能力。

Figure (6)  Table (5) Reference (18)

Catalog

    /

    DownLoad:  Full-Size Img  PowerPoint
    Return
    Return