A Prediction Method of Available Nitrogen Content in Orchard Soil Based on PLSR Optimized by Hybrid Seagull Optimization Algorithm

ZHANG Kun; LIU Xia; LI Yulin; TIAN Yang; LYU Qiang; WANG Kejian; XIE Rangjin; YI Shilai

doi:10.13718/j.cnki.xdzk.2026.02.007

2026 Volume 48 Issue 2

Article Contents

Previous Article Next Article

ZHANG Kun, LIU Xia, LI Yulin, et al. A Prediction Method of Available Nitrogen Content in Orchard Soil Based on PLSR Optimized by Hybrid Seagull Optimization Algorithm[J]. Journal of Southwest University Natural Science Edition, 2026, 48(2): 76-84. doi: 10.13718/j.cnki.xdzk.2026.02.007

Citation:

ZHANG Kun, LIU Xia, LI Yulin, et al. A Prediction Method of Available Nitrogen Content in Orchard Soil Based on PLSR Optimized by Hybrid Seagull Optimization Algorithm[J]. Journal of Southwest University Natural Science Edition, 2026, 48(2): 76-84. doi: 10.13718/j.cnki.xdzk.2026.02.007

A Prediction Method of Available Nitrogen Content in Orchard Soil Based on PLSR Optimized by Hybrid Seagull Optimization Algorithm

1.
Citrus Research Institute, Southwest University/National Citrus Engineering Research Center, Chongqing 400712, China
2.
College of Agriculture and Forestry Science and Technology, Chongqing Three Gorges Vocational College, Chongqing 404155, China
3.
National Agro-Tech Extension and Service Center, Beijing 100125, China

More Information

Corresponding author: YI Shilai
Received Date: 26/09/2025
Available Online: 20/02/2026
MSC: S158.2;TP181

Abstract

Nitrogen is one of the three essential elements for crop nutrition and also one of the key nutrient elements under focused monitoring in fertilization management. How to achieve rapid non-destructive monitoring of soil available nitrogen content plays a crucial role in accurate and efficient soil nitrogen application for crops. In this paper, five spectral preprocessing methods were used to remove noise from the spectrum, namely first derivative (D1), second derivative (D2), standard normal variable (SNV), smoothing gaussian (SG), and wavelet transform (WAVE). The modeling effects of different spectral preprocessing methods were compared; meanwhile, the competitive adaptive reweighted sampling (CARS) method was adopted to select characteristic bands with high correlation with soil available nitrogen content. Subsequently, prediction models for soil available nitrogen content were established and optimized using support vector regression (SVR), partial least squares regression (PLSR), and seagull optimization algorithm (SOA), respectively. The results showed that among the five spectral preprocessing methods, the first derivative (D1) preprocessing achieved the best effect. In terms of modeling performance, the SOA algorithm was the most effective, followed by PLSR, while SVR was relatively the worst. Among all models, the S-PLSR model obtained after D1 spectral preprocessing (D1-CARS-S-PLSR model) exhibited the optimal prediction performance, with a coefficient of determination (R²) of 0.96 and a root mean square error (RMSE) of 7.07. Compared with the original PLSR model, the R² of the D1-CARS-S-PLSR model was increased by 9.6%, and the RMSE was decreased by 33.3%. It can be concluded that the prediction method for orchard soil available nitrogen content based on PLSR optimized by the hybrid seagull optimization algorithm provides a possibility for the accurate diagnosis of soil available nitrogen levels in the context of orchard intelligent fertilization technology.
- soil available nitrogen content,
- hyperspectral imaging technology,
- seagull algorithm,
- partial least squares regression

References

[1]	文刚, 杨阳, 易春燕, 等. 四川省柑橘木虱发生为害现状与综合防控技术对策[J]. 四川农业科技, 2024(11): 67-70. Google Scholar
[2]	周小杰, 赵禹, 王梓, 等. 氮肥和钾肥对晚熟柑橘春见幼树生长的影响[J]. 四川农业科技, 2022(3): 52-55. Google Scholar
[3]	顾鑫, 任翠梅, 杨丽, 等. 不同施氮水平对旱地菊芋生长及产量的影响[J]. 北方园艺, 2017(22): 108-112. Google Scholar
[4]	郭润泽. 秸秆配施氮肥对设施土壤性状及黄瓜生长和品质的影响[D]. 保定: 河北农业大学, 2022. Google Scholar
[5]	章蓉月. 重庆万州金秋砂糖橘的生长特征及施肥处理的研究[D]. 万州: 重庆三峡学院, 2024. Google Scholar
[6]	彭杰, 向红英, 周清, 等. 不同类型土壤全氮含量的高光谱预测研究[J]. 中国农学通报, 2013, 29(9): 105-111. Google Scholar
[7]	刘霞, 周凌霄, 夏心杰, 等. 基于混合蝙蝠智能算法优化PLSR的柑橘叶片氮含量预测方法[J]. 西南大学学报(自然科学版), 2025, 47(2): 160-170. doi: 10.13718/j.cnki.xdzk.2025.02.014 CrossRef Google Scholar
[8]	赵建贵, 王国梁, 张宇, 等. 番茄苗期叶位色素含量高光谱检测及可视化研究[J]. 光谱学与光谱分析, 2024, 44(2): 386-391. Google Scholar
[9]	王虹. 土壤肥料分析方法[M]. 沈阳: 辽宁大学出版社, 1991. Google Scholar
[10]	余政军, 尹小红, 杨柳, 等. ASD FieldSpec 3 Hi-Res地物光谱仪的使用与维护[J]. 中国仪器仪表, 2024(4): 80-84. Google Scholar
[11]	冷月. 香精香料品质分析方法的研究与应用[D]. 贵阳: 贵州医科大学, 2024. Google Scholar
[12]	徐佛言, 赵欣, 张晓瑞, 等. 基于高光谱成像的咸鸭蛋腌制品质快速检测[J]. 食品工业科技, 2024, 45(2): 260-268. Google Scholar
[13]	李振. 基于无人机高光谱的农田土壤盐分估测研究[D]. 济南: 山东师范大学, 2023. Google Scholar
[14]	刘莹. 非参数模型在经济学研究中的应用综述[J]. 统计与决策, 2025, 41(14): 35-40. Google Scholar
[15]	PRIYADHARSHINI C A, ARULKUMARAN G. Multi-Constraints Feature Selection-Based Cross-Pattern Heterogenous Ensemble Learning Model for Diabetic Mellitus Prediction under Data-Imbalance and Insufficiency[J]. SN Computer Science, 2025, 6(7): 831. doi: 10.1007/s42979-025-04346-x CrossRef Google Scholar
[16]	CARTA A, FRIGAU L. Tree Oblique for Regression with Weighted Support Vector Machine[J]. Computational Statistics, 2025, 40(9): 5257-5291. doi: 10.1007/s00180-025-01647-w CrossRef Google Scholar
[17]	FANG R Q, YUE M L, WU K Y, et al. Radiomics Nomogram from Multiparametric Magnetic Resonance Imaging for Preoperative Prediction of Substantial Lymphovascular Space Invasion in Endometrial Cancer[J]. Abdominal Radiology, 2025: 1-12. Google Scholar
[18]	ZHANG Z T, QIN H, WU X Y, et al. The Response of Chlorophyll a to Nutrient and Hydro-Meteorological Factors in Lake Taihu[J]. Environmental Monitoring and Assessment, 2025, 197(3): 345. doi: 10.1007/s10661-025-13775-3 CrossRef Google Scholar
[19]	王凯东. 基于肯德尔相关系数的矩阵偏最小二乘方法[D]. 南昌: 江西财经大学, 2024. Google Scholar
[20]	李智缘, 田安红. 基于光谱指数的土壤重金属Zn的定量预测与空间分布研究[J]. 光谱学与光谱分析, 2024, 44(11): 3287-3293. Google Scholar
[21]	覃木宝, 王华, 王龙林, 等. 基于改进海鸥算法优化支持向量机的斜拉桥索力优化研究[J]. 森林工程, 2023, 39(4): 160-169. Google Scholar
[22]	陈红艳, 赵庚星, 张晓辉, 等. 基于遗传算法结合偏最小二乘的潮土碱解氮高光谱特征及含量估测[J]. 中国农学通报, 2015, 31(2): 209-214. Google Scholar
[23]	徐永明, 蔺启忠, 黄秀华, 等. 利用可见光/近红外反射光谱估算土壤总氮含量的实验研究[J]. 地理与地理信息科学, 2005, 21(1): 19-22. Google Scholar
[24]	裴志福, 沈钦国, 范若渝, 等. 基于中红外光谱的内蒙古区域农田土壤有机碳预测模型研究[J]. 土壤通报, 2024, 55(5): 1264-1272. Google Scholar
[25]	李硕. 基于可见近红外成像光谱技术土壤剖面氮的预测研究[D]. 武汉: 华中农业大学, 2013. Google Scholar
[26]	JIANG H, WANG Z Y, DENG J H, et al. Quantitative Detection of Heavy Metal Cd in Vegetable Oils: A Nondestructive Method Based on Raman Spectroscopy Combined with Chemometrics[J]. Journal of Food Science, 2024, 89(11): 8054-8065. doi: 10.1111/1750-3841.17436 CrossRef Google Scholar
[27]	JUBAYER M F, NILOY S, SARKER M A R, et al. Leveraging Machine Learning to Predict Potato Shelf Life: A Comprehensive Analysis in an Evaporative Cooling Structure[J]. Potato Research, 2025, 68(4): 4257-4281. doi: 10.1007/s11540-025-09928-z CrossRef Google Scholar

Access History

通讯作者: 陈斌, bchen63@163.com

1.
沈阳化工大学材料科学与工程学院沈阳 110142

Figures(6) / Tables(1)

Export Citation

PDF

XML

Article Metrics

Article views(423) PDF downloads(77) Cited by(0)

Access History

Other Articles By Authors

on this site
- ZHANG Kun
- LIU Xia
- LI Yulin
- TIAN Yang
- LYU Qiang
- WANG Kejian
- XIE Rangjin
- YI Shilai
on Google Scholar
- ZHANG Kun
- LIU Xia
- LI Yulin
- TIAN Yang
- LYU Qiang
- WANG Kejian
- XIE Rangjin
- YI Shilai

HTML

开放科学（资源服务）标识码（OSID）：
柑橘是我国种植面积和产量最大的水果作物，对我国南方农村乡村振兴发挥了重要作用^[1]。氮是柑橘生长发育的三大必需营养元素之一^[2]，但过量施氮可能会造成柑橘植株徒长^[3]、花芽分化受阻^[4]、果实酸度增加^[5]、果皮增厚与转色推迟等问题，不仅增加肥料成本，而且还破坏土壤环境。因此，快速监测诊断果园土壤有效氮含量进而科学合理施氮，对柑橘优质丰产栽培具有十分重要的意义。

近年来，高光谱成像技术作为一种快速无损检测植株与土壤中物质含量的技术广受关注，且取得了一定进展。彭杰等^[6]利用便携式地物光谱仪建立了4种不同类型土壤全氮含量高光谱反演预测模型；刘霞等^[7]利用蝙蝠算法建立了柑橘叶片氮含量PLSR预测模型；赵建贵等^[8]建立了番茄叶片光合色素含量高光谱预测模型(CARS-IRIV-PLSR)。基于此，本研究在传统模型的基础上，通过一阶导数、二阶导数、平滑滤波函数、标准正态变量变换和小波变换等5种光谱预处理方法，建立其与土壤有效氮含量之间的相关性，采用支持向量机回归、偏最小二乘回归以及海鸥算法的智能优化偏最小二乘回归来构建不同预测模型，通过比较各模型的预测精度，筛选最适宜的光谱预处理方法、特征波段选择和建模算法，以期为建立一种快速无损果园土壤有效氮含量预测技术提供理论依据与方法。

1. 材料与方法

1.1. 研究区概况

本试验于2023-2024年度在重庆市北碚区歇马街道西南大学柑桔研究所栽培与智慧化中心试验示范园中进行。果园位于北纬29°45′、东经106°22′，气候为亚热带季风气候，年均日照时长为1 224 h，年均降水量为1 351 mm，年均气温为19 ℃。果园土壤为紫色土，其中土壤有机质含量为30.69 g/kg，pH值为7.46，碱解氮含量为98.38 mg/kg，有效磷含量为110.39 mg/kg，速效钾含量为275.37 mg/kg，有效镁含量为23.75 mg/kg，有效钙含量为783.81 mg/kg。试验材料为果园采集的150个土壤样品。

1.2. 数据测量

土壤样品于2024年12月随机采自西南大学柑桔研究所栽培与智慧化中心试验示范园，每个土壤样品采集同一株果树四周沿滴水线0~45 cm深处的4个均匀土块，通过四分法进行混合取样，大约1 kg/样。样品带回实验室风干，研磨后用20目筛网全部过筛，150个样品随机分成训练集96个，测试集30个，验证集24个，使用便携式地物光谱仪(ASD)进行图像数据采集，采用碱解氮扩散法^[9]测定土壤有效氮含量，结果如表 1示。

1.3. 数据分析

高光谱数据通过美国ASD公司研制生产的FieldSpec4 Standard-Res便携式地物光谱仪进行采集，所获得的光谱数据使用Python 3.11对其进行各种光谱预处理、提取特征光谱和建立模型。利用R语言进行相关性分析。

4. 讨论与结论

4.1. 讨论

本研究采用5种光谱预处理方法对原始光谱进行处理，以降低光谱数据噪声，来提高建模预测土壤有效氮含量的精度。使用CARS进行特征波段筛选，再对原始光谱和5种预处理后选取的光谱分别进行建模，得到PLSR模型和SVR模型；使用海鸥算法对PLSR模型进行进一步智能优化得到了最终的S-PLSR模型，其中D1光谱预处理建模的土壤有效氮含量预测精度相对最高。与陈红艳等^[22]、徐永明等^[23]的研究结果一致，这可能是因为一阶导数精准匹配了光谱噪声消除与有效信息增强的结果，即同时兼顾“降噪效果”和“特征保留”。从特征波段选取角度看，CARS算法在不同预处理光谱中筛选出的特征波段数量存在明显差异，其中D1预处理后筛选了124个特征波段，其波长分布与土壤有效氮含量的敏感光谱区间(2 200~2 300 nm)的N-H键伸缩振动波段重合度最高，从而提高了相应建模预测精度。

本研究采用PLSR、SVR、S-PLSR 3种算法进行建模，结果表明，不同光谱预处理下，PLSR的R²均高于SVR，RMSE均低于SVR，这与裴志福等^[24]的研究结果相似，PLSR算法所建立柑橘土壤有效氮含量预测模型比SVR具有相对更高的精度。可能与PLSR是一种融合主成分分析、典型相关分析和多元线性回归优势的多元统计数据分析方法，主要用于解决多因变量对多自变量的回归建模问题，专门针对适应高维复杂信息的数据结构和问题设计的算法^[25]。它通过有监督的潜变量提取，高效地解决了维数灾难和多重共线性问题，直接从海量光谱数据中提炼出对预测目标最相关的信息，同时以较低的模型复杂度和易于控制的过拟合风险，在小样本条件下实现了优异的泛化性能^[26]。SVR是一种强大且灵活的通用算法，在处理复杂非线性关系或样本量相对充足的非光谱问题上可能表现更好^[27]。然而，在光谱分析的特定约束条件下，其灵活性反而可能成为负担(如难以选择最优核和参数、过拟合风险高)，导致其在实际应用中平均精度往往低于精心构建的PLSR模型。当然，具体哪个模型更好最终取决于具体的数据集和问题，但PLSR在光谱领域被广泛采用并取得优异成果，正是源于其算法特性与数据特性的高度契合。在经过SOA算法智能优化后，得到了S-PLSR模型，相较于PLSR模型，S-PLSR的R²得到了不同程度的提高，RMSE也显著降低，这说明在PLSR模型的基础上，SOA优化后的S-PLSR模型预测精准度更高。从优化参数的角度来看，这可能是因为海鸥算法突破了传统参数选择方法的局部最优局限，PLSR的预测性能高度依赖潜在变量数(LVs)，传统交叉验证或经验法常因搜索范围有限，导致LVs过少或过多。而SOA通过模拟海鸥“迁徙-攻击”的群体智能行为，在预设的LVs范围(2~20个)内实现全局搜索，其以模型测试集RMSE的负值为适应度函数，通过迭代更新筛选出预测误差相对最小的LVs，因此，其优化后的模型精度相对更高。

目前，大量数据模型分析系统被应用于高光谱数据与元素含量预测的关系之中，PLSR作为应用较为广泛的模型之一，其优化途径仍需不断拓展。本研究采用海鸥算法对PLSR模型进行优化建立了D1-CARS-S-PLSR模型，得到了较好的柑橘土壤有效氮含量预测结果，验证集决定系数R²高达0.96，可见，S-PLSR模型可以为柑橘土壤有效氮含量的估测提供一种新的技术路径，研究结果可为柑橘生产精准施氮的土壤有效氮含量快速无损监测提供有效方法。虽然本研究初步建立了基于高光谱技术的柑橘土壤有效氮含量预测技术，但采集的土壤样品仍需进行土壤水分与土壤颗粒大小等的简单前处理才能得到较为理想的光谱信息，今后可通过田间大量实时样本的训练学习与建模优化，有望实现真正意义上的田间在线实时检测。

4.2. 结论

本研究采用D1、D2、SG、SNV、WAVE 5种方式对原始光谱进行预处理，利用CARS进行特征波段的筛选，结合SVR和PLSR算法建模，最后通过SOA对PLSR进行智能优化，初步建立了柑橘土壤有效氮含量预测精度相对较高的S-PLSR模型，其中D1光谱预处理的模型精度相对最高，建立的D1-CARS-S-PLSR模型表现出最佳的预测性能，其R²为0.96，RMSE为7.07。

Figure (6) Table (1) Reference (27)

Name
	Name cannot be empty!
E-mail
	Mailbox cannot be empty! Mailbox cannot be empty!
Telephone
	Mobile number cannot be empty! Please enter a valid mobile number!
Title

Content
Verification Code

Message Board

A Prediction Method of Available Nitrogen Content in Orchard Soil Based on PLSR Optimized by Hybrid Seagull Optimization Algorithm