Research on Prediction of Farmland CO<sub>2</sub> Emission Concentration Based on an LSTM-XGBoost Hybrid Model

YAN Zhengang; YANG Fafa; WANG Yaodong

doi:10.13718/j.cnki.xdzk.2026.05.017

Aiming at the limitations of traditional models in predicting farmland CO₂ emission concentration, this study constructed four machine learning models, namely long short-term memory (LSTM), eXtreme Gradient Boosting (XGBoost), gated recurrent unit (GRU) and random forest (RF), and optimized their hyperparameters viaBayesian and random search methods. Results showed that LSTM excelledin capturing long-term temporal patterns (R²=0.86, MAPE=5.97), while XGBoost performed well in short-term nonlinear fitting (R²=0.84, MAPE=4.62). To overcome the limitations of a single model, this paper constructs a combined XGBoost model based on LSTM time series feature splicing. The model effectively balances the fitting performance of long-term trends and local fluctuations, and improves the overall prediction accuracy(R²=0.94, RMSE=22.81, MAPE=2.21).

HTML

开放科学（资源服务）标识码（OSID）：
在农田CO₂排放预测研究中，基于过程的生物地球化学模型，如农业技术转移决策支持系统(Decision Support System for Agrotechnology Transfer，DSSAT)、脱氮-分解模型(DeNitrification-DeComposition，DNDC)、环境政策综合气候模型(Environmental Policy Integrated Climate，EPIC)、农业生产系统模拟模型(Agricultural Production Systems sIMulator，APSIM)，虽取得一定成效，但存在参数需求高、建模复杂、计算资源消耗大及环境适应性差等局限^[1-2]。相比之下，机器学习方法因其强大的模式识别能力和良好的泛化性能，已成为农业碳排放预测的重要技术路径^[3]。机器学习能从高频、长期的农田CO₂排放浓度监测数据中挖掘复杂的非线性关联关系，并适应多变的环境和管理条件^[4]。种植前，农户可通过预测模型评估碳排放量，调整施肥、灌溉量和耕作措施等。因此，建立基于机器学习的CO₂排放浓度预测模型，不仅可弥补传统模型的不足，更可助力精准农业的发展与碳减排目标的实现，推动农业智能化、前瞻化管理迈向新阶段。

近年来，机器学习方法因其强大的非线性拟合与时序建模能力被应用于农田CO₂排放浓度预测。文献[5]采用极限梯度提升算法(eXtreme Gradient Boosting，XGBoost)模型提升农田碳交换预测精度，弥补传统模型对非线性关系处理的不足。文献[6]将长短期记忆网络(long short term memory，LSTM)与XGBoost应用于CO₂与CH₄排放趋势预测，验证了二者在处理复杂时序数据中的有效性。文献[7]进一步探索了XGBoost、卷积神经网络(Convolutional Neural Network，CNN)与LSTM模型融合在碳排放预测中的潜力，取得了优异结果。文献[8]构建的CNN-GRU模型与文献[9]提出的CNN-LSTM模型，通过将擅长局部特征提取的卷积神经网络与擅长时序依赖建模的循环神经网络相结合，能够有效克服单一模型的局限性，在不同领域证实了混合深度学习架构的优越性。这一设计思路为本文解决农田CO₂浓度多因子耦合时序预测问题提供了研究思路。总体来看，融合深度学习与树模型优势的组合模型成为主流趋势，尤其在非线性强、时序性显著的农业碳排放预测中表现出更高精度与稳定性。本文构建的基于LSTM时序特征拼接的XGBoost组合模型正是对该趋势的实践，可显著提升预测精度，为农田CO₂排放浓度建模提供了新路径与理论支撑。

4. 讨论与结论

4.1. 讨论

针对农田CO₂排放浓度预测中的建模问题，本文在对比现有单一模型性能的基础上，分析了基于LSTM时序特征拼接的XGBoost组合模型的有效性。文献[21]探讨了多种单个模型在农田CO₂排放预测中的研究，研究表明LSTM在所有单个预测模型中的表现最佳(R²=0.87)，稍高于本研究构建的LSTM预测模型(R²=0.86)，但低于本研究提出的基于LSTM-XGBoost组合模型的R²=0.94。文献[22]使用模糊基函数回归(Fuzzy Basis Function Regression，FBFR)、支持向量回归(Support Vector Regression，SVR)、CNN及前馈神经网络(Feedforward Neural Network，FNN)对玉米农田CO₂排放进行了预测，预测结果对比分析显示FNN的预测性能最佳，FNN预测性能的R²=0.918低于本研究提出的LSTM-XGBoost组合模型的R²=0.94，RMSE=67.75高于本研究LSTM-XGBoost组合模型的22.81。文献[23]利用反向传播神经网络(Back Propagation Neural Network，BP)对农田土壤CO₂排放进行预测，预测性能的R²=0.918 8，低于本研究的LSTM-XGBoost组合模型。通过对比分析，本研究的LSTM-XGBoost组合模型预测精度高、误差小，为农田CO₂排放浓度的预测提供了一种新的思路和方法。

4.2. 结论

本研究构建了LSTM、GRU、XGBoost和RF 4种单一机器学习模型，并分别对模型进行了随机搜索和贝叶斯优化。实验结果表明，LSTM在长期趋势捕捉方面优于GRU，XGBoost在短期非线性拟合方面优于RF。本研究通过实验验证了不同模型的差异化优势，同时也发现单一模型在面对农田CO₂排放浓度数据中的复杂时序与非线性交互特征时，仍然存在一定的预测局限性。针对单一模型的局限性，本研究提出并建立了基于LSTM时序特征拼接的XGBoost混合预测模型，该模型充分融合了LSTM在长期趋势建模与XGBoost在短期非线性特征拟合方面的优势。实验证明该组合模型在预测精度和稳定性方面表现卓越，R²提高至0.94，RMSE降低至22.81，MAPE仅为2.21，相较于传统单一模型及常规加权融合模型有显著提高，为农田CO₂排放浓度的精准预测提供了新的有效方法。

Figure (9) Table (9) Reference (23)

Name
	Name cannot be empty!
E-mail
	Mailbox cannot be empty! Mailbox cannot be empty!
Telephone
	Mobile number cannot be empty! Please enter a valid mobile number!
Title

Content
Verification Code

[1]	马晨光, 蔡焕杰, 卢亚军. 基于APSIM模型不同水氮处理下N₂O的排放研究[J]. 灌溉排水学报, 2020, 39(11): 120-129. Google Scholar
[2]	吴梦琴, 李成芳, 盛锋, 等. 基于DNDC模型评估湖北省不同稻作系统不同管理措施温室气体排放的周年变化[J]. 中国生态农业学报(中英文), 2021, 29(9): 1480-1492. Google Scholar
[3]	燕振刚, 李薇, Yan Tianhai, 等. BP神经网络算法在河西绿洲玉米生产碳排放评估中的应用及算法有效性研究[J]. 中国生态农业学报(中英文), 2018, 26(8): 1100-1106. Google Scholar
[4]	BRISCOE N J, MORRIS S D, MATHEWSON P D, et al. Mechanistic Forecasts of Species Responses to Climate Change: The Promise of Biophysical Ecology[J]. Global Change Biology, 2023, 29(6): 1451-1470. doi: 10.1111/gcb.16557 CrossRef Google Scholar
[5]	吴成秋, 曹召丹, 赵小二, 等. 基于水文气象因子的农田生态系统碳通量预测[J]. 湖北农业科学, 2024, 63(8): 267-280. Google Scholar
[6]	JOBARTEH B, NEETHIRAJAN S. Leveraging Satellite Data for Greenhouse Gas Mitigation in Canadian Poultry Farming[J]. Smart Agricultural Technology, 2025, 10: 100704. doi: 10.1016/j.atech.2024.100704 CrossRef Google Scholar
[7]	SEO J Y, LEE S I. CO₂ Emissions Associated with Groundwater Storage Depletion in South Korea: Estimation and Vulnerability Assessment Using Satellite Data and Data-Driven Models[J]. Remote Sensing, 2024, 16(17): 3122-3144. doi: 10.3390/rs16173122 CrossRef Google Scholar
[8]	张文栋, 刘子琨, 梁涛, 等. 基于CNN-LSTM的综合能源系统负荷预测模型[J]. 重庆邮电大学学报(自然科学版), 2023, 35(2): 254-262. Google Scholar
[9]	宋育苗, 于金霞. 基于CNN-GRU的移动APP流行度预测模型[J]. 重庆邮电大学学报(自然科学版), 2024, 36(4): 747-755. Google Scholar
[10]	JI X, WANG J C, YAN Z J. A Stock Price Prediction Method Based on Deep Learning Technology[J]. International Journal of Crowd Science, 2021, 5(1): 55-72. doi: 10.1108/IJCS-05-2020-0012 CrossRef Google Scholar
[11]	杨寒雨, 赵晓永, 王磊. 数据归一化方法综述[J]. 计算机工程与应用, 2023, 59(3): 13-22. Google Scholar
[12]	王兴浩. 基于贝叶斯优化的图神经网络架构搜索方法[D]. 长春: 吉林大学, 2022. Google Scholar
[13]	任建吉, 位慧慧, 邹卓霖, 等. 基于CNN-BiLSTM-Attention的超短期电力负荷预测[J]. 电力系统保护与控制, 2022, 50(8): 108-116. Google Scholar
[14]	赖晓蓥, 钱俊. ARIMA-LSTM-XGBoost加权组合模型在肺结核发病趋势预测的研究[J]. 现代预防医学, 2021, 48(1): 5-9. Google Scholar
[15]	代业明, 周琼. 基于改进Bi-LSTM和XGBoost的电力负荷组合预测方法[J]. 上海理工大学学报, 2022, 44(2): 138-147. Google Scholar
[16]	赵阳, 范文奕, 安佳坤, 等. 基于智能加权混合模型的新型电力系统电量预测方法[J]. 电测与仪表, 2022, 59(12): 56-63. Google Scholar
[17]	侯慧, 吴文杰, 魏瑞增, 等. 基于注意力机制的CNN-LSTM-XGBoost台风暴雨电力气象混合预测模型[J]. 智慧电力, 2024, 52(10): 96-102. Google Scholar
[18]	赵宏, 王乐, 王伟杰. 基于BiLSTM-CNN串行混合模型的文本情感分析[J]. 计算机应用, 2020, 40(1): 16-22. Google Scholar
[19]	王晓玲, 王成, 王佳俊, 等. 大坝渗压混合预测的STL分解-集成学习模型[J]. 水力发电学报, 2024, 43(9): 106-123. Google Scholar
[20]	赵明珠, 王丹, 方杰, 等. 基于LSTM神经网络的地铁车站温度预测[J]. 北京交通大学学报, 2020, 44(4): 94-101. Google Scholar
[21]	HAMRANI A, AKBARZADEH A, MADRAMOOTOO C A. Machine Learning for Predicting Greenhouse Gas Emissions from Agricultural Soils[J]. Science of the Total Environment, 2020, 741: 140338. Google Scholar
[22]	HARSÁNYI E, MIRZAEI M, ARSHAD S, et al. Assessment of Advanced Machine and Deep Learning Approaches for Predicting CO₂ Emissions from Agricultural Lands: Insights across Diverse Agroclimatic Zones[J]. Earth Systems and Environment, 2024, 8(4): 1109-1125. doi: 10.1007/s41748-024-00424-x CrossRef Google Scholar
[23]	FREITAS L P S, LOPES M L M, CARVALHO L B, et al. Forecasting the Spatiotemporal Variability of Soil CO₂ Emissions in Sugarcane Areas in Southeastern Brazil Using Artificial Neural Networks[J]. Environmental Monitoring and Assessment, 2018, 190(12): 741. doi: 10.1007/s10661-018-7118-0 CrossRef Google Scholar

Message Board

Research on Prediction of Farmland CO₂ Emission Concentration Based on an LSTM-XGBoost Hybrid Model

Abstract

References

Access History

通讯作者: 陈斌, bchen63@163.com

Article Metrics

Access History

Other Articles By Authors

Research on Prediction of Farmland CO₂ Emission Concentration Based on an LSTM-XGBoost Hybrid Model

HTML

1.1. 数据来源

1.2. 数据预处理

1.2.1. 数据集降频

1.2.2. 异常值处理

1.2.3. 数据归一化与标准化

1.3. 数据集构建

2.1. 单一模型选取与优化

2.2. 加权组合模型的构建

2.3. 基于LSTM时序特征拼接的XGBoost组合模型设计

3.1. 模型评价指标

3.2. GRU与LSTM模型对比分析

3.3. RF与XGBoost模型对比与分析

3.4. 基于LSTM与XGBoost的加权组合模型分析

3.5. LSTM时序特征拼接的XGBoost组合模型分析

4.1. 讨论

4.2. 结论

Catalog

Message Board

Research on Prediction of Farmland CO2 Emission Concentration Based on an LSTM-XGBoost Hybrid Model

Abstract

References

Access History

通讯作者: 陈斌, bchen63@163.com

Article Metrics

Access History

Other Articles By Authors

Research on Prediction of Farmland CO2 Emission Concentration Based on an LSTM-XGBoost Hybrid Model

HTML

1.1. 数据来源

1.2. 数据预处理

1.2.1. 数据集降频

1.2.2. 异常值处理

1.2.3. 数据归一化与标准化

1.3. 数据集构建

2.1. 单一模型选取与优化

2.2. 加权组合模型的构建

2.3. 基于LSTM时序特征拼接的XGBoost组合模型设计

3.1. 模型评价指标

3.2. GRU与LSTM模型对比分析

3.3. RF与XGBoost模型对比与分析

3.4. 基于LSTM与XGBoost的加权组合模型分析

3.5. LSTM时序特征拼接的XGBoost组合模型分析

4.1. 讨论

4.2. 结论

Catalog

Export File

Citation

Format

Content

Research on Prediction of Farmland CO₂ Emission Concentration Based on an LSTM-XGBoost Hybrid Model

Research on Prediction of Farmland CO₂ Emission Concentration Based on an LSTM-XGBoost Hybrid Model