留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

基于Sentinel-2遥感影像的农作物分类与适宜性评价

上一篇

下一篇

赵孟辰, 阿里木江·卡斯木. 基于Sentinel-2遥感影像的农作物分类与适宜性评价[J]. 西南大学学报(自然科学版), 2023, 45(11): 176-185. doi: 10.13718/j.cnki.xdzk.2023.11.017
引用本文: 赵孟辰, 阿里木江·卡斯木. 基于Sentinel-2遥感影像的农作物分类与适宜性评价[J]. 西南大学学报(自然科学版), 2023, 45(11): 176-185. doi: 10.13718/j.cnki.xdzk.2023.11.017
ZHAO Mengchen, ALIMUJIANG Kasmu. Crop Classification and Suitability Evaluation Based on Sentinel-2 Remote Sensing Image[J]. Journal of Southwest University Natural Science Edition, 2023, 45(11): 176-185. doi: 10.13718/j.cnki.xdzk.2023.11.017
Citation: ZHAO Mengchen, ALIMUJIANG Kasmu. Crop Classification and Suitability Evaluation Based on Sentinel-2 Remote Sensing Image[J]. Journal of Southwest University Natural Science Edition, 2023, 45(11): 176-185. doi: 10.13718/j.cnki.xdzk.2023.11.017

基于Sentinel-2遥感影像的农作物分类与适宜性评价

  • 基金项目: 新疆自治区创新环境(人才、基地)建设专项(2022D04007);新疆自治区社会科学基金项目(22BJY020)
详细信息
    作者简介:

    赵孟辰,博士,副教授,主要从事地理信息研究 .

  • 中图分类号: TP393

Crop Classification and Suitability Evaluation Based on Sentinel-2 Remote Sensing Image

  • 摘要:

    农作物种植结构信息是作物长势监测和农业结构调整的重要参考依据,及时准确地通过土地分类和农作物适宜性评价获取农作物空间分布与适宜性种植信息对农业可持续发展意义重大. 该文以河北张家口沽源县为研究对象,利用Sentinel-2多光谱数据提取的NDV,NDBI,NDWI,NDRE1,SRre和CIred-edge数据为特征,分别采用SVM支持向量机、决策树法、随机森林法对研究区内典型农作物进行精细化提取,探究主要作物空间分布情况,并通过对比kappa系数探讨不同方法对农作物分类的精度,选择最优分类方法. 选取土壤性质、土壤侵蚀度、高程、坡度、坡向5个指标建立农作物适宜性评价体系,采用GIS层次分析法与土地适宜性分级指标对沽源县农作物适宜性进行评价. 结果表明:基于随机森林分类法对研究区内8种主要农作物进行分类的精度最高,其总体准确率为65.10%,Kappa系数为0.587 1;研究区内主要农作物在空间上整体呈现出镶嵌结构;研究区内中度适宜种植当地主要农作物的用地面积最大,其次是适宜种植面积居中,不适宜种植地区的面积最小.

  • 加载中
  • 图 1  河北省张家口市沽源县作物样本点分布图

    图 2  干预后随机森林分类主要农作物提取分布情况

    图 3  区域种植土地综合适宜性等级分布图

    表 1  植被指数及计算公式

    植被指数 指数描述 计算公式
    NDVI 归一化植被指数 (ρnir-ρred)/(ρnir+ρred)
    NDBI 归一化建筑指数 (ρmir-ρnir)/(ρmir+ρnir)
    NDWI 归一化水体指数 (ρgreen-ρnir)/(ρgreen+ρnir)
    NDREI 归一化差异红色边缘指数 (ρ750-ρ705)/(ρ750+ρ705)
    SRre 简单比值指数 ρnir/ρred-edge
    CIred-edge 红边叶绿素指数 ρ750/ρ710-1
    注:表 1ρnir表示近红外波段的反射率,ρred表示红光波段的反射率,ρmir表示短红外波段的反射率,ρgreen表示绿色波段反射率,ρ750表示中心波长为750 nm波段的反射率,ρ705表示中心波长为705 nm波段的反射率,ρred-edge表示红光波段的反射率;ρ710表示中心波长为710 nm波段的反射率.
    下载: 导出CSV

    表 2  分类结果评价精度

    分类方法 总体精度/% Kappa系数
    SVM分类 17.45 0.127 7
    决策树分类 59.06 0.516 3
    随机森林分类 65.10 0.587 1
    下载: 导出CSV

    表 3  不同分类结果的各农作物种植面积

    作物类别 种植面积/km2
    SVM分类 决策树分类 随机森林分类 干预后随机森林分类
    马铃薯 202.14 340.88 204.82 215.66
    油麦菜 444.30 354.10 467.67 451.12
    玉米 12.60 365.16 308.43 302.95
    生菜 18.06 336.71 260.86 227.28
    白菜 264.31 400.21 463.25 471.11
    胡萝卜 230.44 101.97 25.71 68.26
    西蓝花 24.82 - 26.12 47.58
    野燕麦 144.86 356.32 255.69 230.36
    下载: 导出CSV

    表 4  种植区域土地适宜性评价指标及权重

    指标 权重
    土壤性质 土壤类型 0.15
    土壤侵蚀度 0.20
    地形条件 海拔/m 0.15
    坡度/° 0.10
    坡向 0.40
    下载: 导出CSV

    表 5  主要农作物种植区域土地适宜性分级指标

    适宜性等级 综合得分范围 级别含义
    适宜 70~100 土地对主要农作物的种植具有可持久性,无明显限制或只有微小限制,具有较高的生产率和较好的效益.
    中度适宜 40~70 土地有一定的限制性,主要农作物的产量和质量会受到一定影响,经济效益一般,合理利用不会引起土地退化.
    不适宜 <40 土地具有较强的限制性,生产率和效益低,持久使用而不采取措施会引起土地退化.
    下载: 导出CSV
  • [1] 董玲. 河南省农业产业结构调整优化探讨[J]. 科技创新与生产力, 2018(9): 43-45. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-TAIY201809018.htm
    [2] JOHNSON B A. High-Resolution Urban Land-Cover Classification Using a Competitive Multi-Scale Object-Based Approach [J]. Remote Sensing Letters, 2013, 4(2): 131-140. doi: 10.1080/2150704X.2012.705440
    [3] SHACKELFORD A K, DAVIS C H. A Combined Fuzzy Pixel-Based and Object-Based Approach for Classification of High-Resolution Multispectral Data over Urban Areas [J]. IEEE Transactions on Geoscience and Remote Sensing, 2003, 41(10): 2354-2363. doi: 10.1109/TGRS.2003.815972
    [4] STROM R. A Comparison of the Object-Oriented and Process Paradigms [C] //Proceedings of the 1986 SIGPLAN Workshop on Object-Oriented Programming-. New York: ACM Press, 1986.
    [5] ZHANG P L, LV Z Y, SHI W Z. Object-Based Spatial Feature for Classification of Very High Resolution Remote Sensing Images [J]. Institute of Electrical and Electronics Engineers (IEEE), 2013(6): 1572-1576.
    [6] 陈杰, 邓敏, 肖鹏峰, 等. 结合支持向量机与粒度计算的高分辨率遥感影像面向对象分类[J]. 测绘学报, 2011, 40(2): 135-141, 147. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-CHXB201102003.htm
    [7] 顾海燕, 闫利, 李海涛, 等. 基于随机森林的地理要素面向对象自动解译方法[J]. 武汉大学学报(信息科学版), 2016, 41(2): 228-234. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-WHCH201602014.htm
    [8] 龚珍, 吴浩, 黎华. 面向对象的遥感影像植被信息提取技术研究[J]. 安徽农业科学, 2012, 40(30): 15077-15078. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-AHNY201230166.htm
    [9] 吴波, 林珊珊, 周桂军. 面向对象的高分辨率遥感影像分割分类评价指标[J]. 地球信息科学学报, 2013, 15(4): 567-573. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201304015.htm
    [10] 贾艳红, 谢明翅. 基于GIS的桂林市罗汉果种植土地适宜性评价[J]. 西华师范大学学报(自然科学版), 2022, 43(4): 367-372.
    [11] 段永婕, 赵春子. 县域农业产业结构现状与调整研究——以沽源县为例[J]. 绿色科技, 2021, 23(10): 267-270. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-LVKJ202110094.htm
    [12] 马礼, 郭万翠, 李敏. 沽源县农业土地利用结构优化研究[J]. 农业系统科学与综合研究, 2011, 27(1): 66-71. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-NXTZ201101012.htm
    [13] 后斌. 基于支撑向量机的遥感影像分类方法比较研究[J]. 测绘通报, 2008(10): 5-7. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-CHTB200810005.htm
    [14] 王克晓, 周蕊, 欧毅, 等. 基于光学与雷达遥感的山地油菜分布提取研究[J]. 西南大学学报(自然科学版), 2021, 43(6): 139-146. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2021.06.018
    [15] 胡琼. 基于时序MODIS影像的农作物遥感识别方法研究[D]. 北京: 中国农业科学院, 2018.
    [16] 孙逸飞. 基于多源遥感数据的大蒜种植面积提取方法研究[D]. 泰安: 山东农业大学, 2022.
    [17] XU L L, LI J, BRENNING A. A Comparative Study of Different Classification Techniques for Marine Oil Spill Identification Using RADARSAT-1 Imagery [J]. Remote Sensing of Environment, 2014, 141: 14-23.
    [18] HUANG C, DAVIS L S, TOWNSHEND J R G. An Assessment of Support Vector Machines for Land Cover Classification [J]. International Journal of Remote Sensing, 2002, 23(4): 725-749.
    [19] 邓雪, 李家铭, 曾浩健, 等. 层次分析法权重计算方法分析及其应用研究[J]. 数学的实践与认识, 2012, 42(7): 93-100. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SSJS201207013.htm
    [20] 杨阳. 基于深度优先搜索的混成系统有界可达性分析[D]. 南京: 南京大学, 2013.
    [21] 蒋艾君, 吴亮, 彭强, 等. 基于GIS的坡面泥石流危险性评价[J]. 测绘与空间地理信息, 2013, 36(9): 80-83. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DBCH201309023.htm
    [22] 刘毅, 杜培军, 郑辉, 等. 基于随机森林的国产小卫星遥感影像分类研究[J]. 测绘科学, 2012, 37(4): 194-196. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-CHKD201204065.htm
    [23] 张耀, 周伟. 安太堡露天矿区复垦地植被覆盖度反演估算研究[J]. 中南林业科技大学学报, 2016, 36(11): 113-119. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-ZNLB201611021.htm
    [24] 朱林富, 谢世友, 杨华, 等. 基于MODIS-EVI的四川植被覆盖地形分布特征[J]. 西南大学学报(自然科学版), 2022, 44(9): 122-132. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2022.09.013
    [25] 毕恺艺, 牛铮, 黄妮, 等. 基于Sentinel-2A时序数据和面向对象决策树方法的植被识别[J]. 地理与地理信息科学, 2017, 33(5): 16-20, 27, 127. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DLGT201705003.htm
    [26] 郭文婷, 张晓丽. 基于Sentinel-2时序多特征的植被分类[J]. 浙江农林大学学报, 2019, 36(5): 849-856. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-ZJLX201905002.htm
    [27] BHUIYAN C, SINGH R P, KOGAN F N. Monitoring Drought Dynamics in the Aravalli Region (India) Using Different Indices Based on Ground and Remote Sensing Data [J]. International Journal of Applied Earth Observation and Geoinformation, 2006, 8(4): 289-302.
    [28] 郭铌, 陈添宇, 陈乾. 用NOAA气象卫星资料对甘肃省河东地区土地覆盖分类[J]. 高原气象, 1995, 14(4): 467-475. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-GYQX504.010.htm
    [29] LUNETTA R S, KNIGHT J F, EDIRIWICKREMA J, et al. Land-Cover Change Detection Using Multi-Temporal MODIS NDVI Data [J]. Remote Sensing of Environment, 2006, 105(2): 142-154.
    [30] PALCHOWDHURI Y, VALCARCE-DIÑEIRO R, KING P, et al. Classification of Multi-Temporal Spectral Indices for Crop Type Mapping: a Case Study in Coalville, UK [J]. The Journal of Agricultural Science, 2018, 156(1): 24-36.
    [31] KOBAYASHI N, TANI H, WANG X F, et al. Crop Classification Using Spectral Indices Derived from Sentinel-2A Imagery [J]. Journal of Information and Telecommunication, 2020, 4(1): 67-90.
    [32] 乌云德吉, 于利峰, 包珺玮, 等. RapidEye卫星红边波段对主要农作物识别能力的影响研究[J]. 北方农业学报, 2017, 45(6): 118-123. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-NMGN201706022.htm
    [33] GITELSON A A, GRITZ Y, MERZLYAK M N. Relationships between Leaf Chlorophyll Content and Spectral Reflectance and Algorithms for Non-Destructive Chlorophyll Assessment in Higher Plant Leaves [J]. Journal of Plant Physiology, 2003, 160(3): 271-282.
  • 加载中
图( 3) 表( 5)
计量
  • 文章访问数:  1228
  • HTML全文浏览数:  1228
  • PDF下载数:  87
  • 施引文献:  0
出版历程
  • 收稿日期:  2023-05-24
  • 刊出日期:  2023-11-20

基于Sentinel-2遥感影像的农作物分类与适宜性评价

    作者简介: 赵孟辰,博士,副教授,主要从事地理信息研究
  • 新疆师范大学 地理科学与旅游学院,乌鲁木齐 830054
基金项目:  新疆自治区创新环境(人才、基地)建设专项(2022D04007);新疆自治区社会科学基金项目(22BJY020)

摘要: 

农作物种植结构信息是作物长势监测和农业结构调整的重要参考依据,及时准确地通过土地分类和农作物适宜性评价获取农作物空间分布与适宜性种植信息对农业可持续发展意义重大. 该文以河北张家口沽源县为研究对象,利用Sentinel-2多光谱数据提取的NDV,NDBI,NDWI,NDRE1,SRre和CIred-edge数据为特征,分别采用SVM支持向量机、决策树法、随机森林法对研究区内典型农作物进行精细化提取,探究主要作物空间分布情况,并通过对比kappa系数探讨不同方法对农作物分类的精度,选择最优分类方法. 选取土壤性质、土壤侵蚀度、高程、坡度、坡向5个指标建立农作物适宜性评价体系,采用GIS层次分析法与土地适宜性分级指标对沽源县农作物适宜性进行评价. 结果表明:基于随机森林分类法对研究区内8种主要农作物进行分类的精度最高,其总体准确率为65.10%,Kappa系数为0.587 1;研究区内主要农作物在空间上整体呈现出镶嵌结构;研究区内中度适宜种植当地主要农作物的用地面积最大,其次是适宜种植面积居中,不适宜种植地区的面积最小.

English Abstract

  • 开放科学(资源服务)标识码(OSID):

  • 农业产业结构调整优化是当前我国建设现代化农业,保障农民持续增收,实现农业可持续发展的必然选择[1]. 农作物种植结构是指一个地区主要农作物类型和其空间分布状况,及时有效地获取农业种植结构信息对农作物产量监测、农业用水精细化管理、区域农业、可持续化发展等具有重要意义. 以往的研究依据统计部门的逐级上报和抽样估测数据集获取农作物种植结构信息只能停留在量的层面,难以实现农作物空间分布可视化,且此方法存在费时、费力、时间分辨率低和主观性强等缺点. 遥感技术具有大范围数字成图、高时效性和成本低等优势,目前被广泛用于资源普查,并逐步成为获取农业种植结构信息的重要方式之一.

    国内外众多学者对基于遥感影像的农作物识别、分类及种植区域适宜性进行了大量研究. Johnson[2]采用多尺度分割算法进行分割,通过SVM(Support Vector Machine,SVM)分类模型,计算不同尺度下影像对象隶属度及隶属度类别;Shackelford等[3]以IKONOS影像为实验数据,采用面向对象和基于像素的方法分别进行分类,结果证明面向对象的方法分类精度更高;Strom[4]分别利用面向对象和传统目视解译的方法对SPOT(Systeme Probatoire d'Observation de la Terre)影像进行分类,结果证明面向对象分类方法的精度高于传统目视解译方法;Zhang等[5]基于最近邻分类算法、最大似然分类算法及SVM算法,提出一种面向像斑的空间特征分类方法. 陈杰等[6]在SVM算法的基础上,结合粗糙集粒度的计算方法对影像进行分类;顾海燕等[7]验证了随机森林算法在运行速度和分类准确性上有明显优势.

    不同特色经济作物的生长发育与气候、地形、土壤等自然环境条件密切相关,在不同自然环境条件下的特色经济作物产量及品质有明显差异,因此如何根据各地区的自然条件,研究区域特色经济作物用地布局,因地制宜地发展特色经济作物,实现区域土地资源合理利用具有重要意义. 传统的土地适宜性评价方法计算和处理效率低而且精度差,利用GIS(Geographic Information Systems,地理信息系统)技术进行土地适宜性评价,不仅可以将评价单元的空间数据与评价指标数据结合起来,还可对这些数据进行分析和处理,从而提高土地适宜性评价的效率和精度. 龚珍等[8]、吴波等[9]分别使用GIS技术在我国不同地区针对茶树、苹果树等多种不同品种的植物进行了农业气候适宜性区划研究;贾艳红等[10]以立地条件和土壤性状中海拔、土壤质地等6个因子为指标,建立了罗汉果种植的土地适宜性评价体系,借助层次分析法确定评价因子权重等级标准,划分土地适宜性等级,并利用GIS技术实现了桂林市罗汉果种植土地适宜性综合评价.

    本文基于Sentinel-2影像数据,以河北省张家口市沽源县为研究区,选择胡萝卜、西蓝花、玉米、马铃薯、油麦菜、生菜、白菜、野燕麦这8类研究区内主要种植的农作物,分别采用随机森林分类、支持向量机(SVM)分类和决策树分类方法,对研究区内主要农作物的分布情况进行遥感分类,并将不同方法获得的研究区内农作物分类精度进行对比. 通过遥感技术分析研究区内主要农作物的种植情况,从土地和气候两个方面分析河北省张家口市沽源县主要农作物的生长适宜性,为政府相关部门了解农作物种植情况提供辅助信息,同时为进一步科学规划农作物种植结构提供参考.

  • 河北省张家口市沽源县位于河北省西北部坝上地区,与内蒙古自治区接壤. 全县地势南高北低、东高西低,平均海拔1 536 m,其中北部、西部为波状高原,东部为低山丘陵,南部为中低山地,全县总土地面积为3 654 km2,耕地面积15.5万hm2. 沽源县“冬无严寒、夏无酷热”,为冷温带半干旱大陆性季风气候[11],年平均气温1.4 ℃,≥10 ℃积温1 900 ℃左右,年平均降水量409.9 mm,年蒸发量1 787.5 mm[12]. 土壤类型有灰色森林土、栗钙土、草甸土、沼泽土、盐土,其中栗钙土为主要类型,占全县土壤分布面积的88%. 植被类型为干草原稀树草原,主要由耐寒旱生多年生草本植物组成. 森林覆盖率为35.64%,有杨、榆、桦、落叶松和云杉,部分地带有杞柳、水策棠梨、枸杞等;粮食作物有小麦、莜麦、马铃薯等;经济作物有胡麻;蓄牧业主要发展大牲畜,马、牛的头数逐年增加,沽源牧场是河北省3大牧场之一.

  • 哨兵2号(Sentinel-2)数据是欧洲“哥白尼计划”的重要组成部分. Sentinel-2卫星搭载的MSI成像仪能够覆盖13个光谱波段,幅宽为290 km,空间分辨率分别为10 m(4个波段)、20 m(6个波段)、60 m(3个波段). 在红边范围内有3个波段,可以有效监测植被健康信息,也能够用于森林监测、气候变化、土地利用变化、产量预测、山体滑坡等应用,极大地提高了陆地监测水平. 在光学数据中,Sentinel-2数据是唯一一个在红边范围含有3个波段的数据,这对监测植被健康信息非常有效. 本文使用的Sentinel-2多光谱数据下载自欧空局(European Space Agency,ESA)数据中心(https://scihub.copernicus.eu/dhus/),为表观反射率数据,对该数据的预处理过程如下:

    1) 辐射定标和大气校正:使用SNAP(Sentinels Application Platform)软件中的Sen2Cor插件对Sentinel-2数据完成辐射定标和大气校正,得到地表反射率数据,采用双线性内插法将所有波段的分辨率重采样为10 m,最后将校正结果转换为ENVI格式.

    2) 波段合成经SNAP软件输出的ENVI(The Environment for Visualizing Images)格式Sentinel-2影像数据存储结果为一个波段对应一个图像,本文采用波段合成工具将其顺序调整后合成多波段图像,同时将坐标系设置为UTM(Universal Transverse Mercator Projection-通用横轴墨卡托投影)投影,基准面为WGS(World Geodetic System,世界大地坐标系)-84.

    3) 图像镶嵌和裁剪:图像裁剪实验区所使用的Sentinel-2影像数据单景即可覆盖,本文通过河北省张家口市沽源县矢量数据在GIS软件中对所使用的Sentinel-2数据进行批量裁剪,由此得到实验区影像.

  • 为保证利用遥感影像进行数据标注的准确性,本文对研究区展开野外实地数据调查,通过实地走访和拍照记录等方式进行采集. 根据研究区规模,为了在调查过程中使用训练样本进行更高精度、更符合实际情况的分类,记录了实地调查样本点的经、纬度,对实测样点的农作物进行拍照留档,以期更加准确地把握各类主要农作物的特征. 采样过程利用手持GPS(Global Positioning System,全球定位系统)设备记录采样点位置信息,同时将采样点在奥维地图卫星影像数据中打点标记,以采样点编号进行备注. 将样本数据按照1.5∶1的比例随机分为训练样本数据集和验证样本数据集(图 1).

  • 支持向量机在线性可分的多特征空间中计算出最优超平面,该平面在将被分类样本正确分开的同时使分类间隔最大化[13]. 通过SVM中软间隔概念,将需要分类的样本通过引入核函数映射到高维空间中,同时将解平面由线性扩展为非线性并求得最优分类超平面[14-15],能够有效地解决农作物分类中的线性不可分问题,减少运算量,使SVM更加实用化. SVM算法通过选择恰当的函数子集、合适的对应子集的判别函数,依据有限样本构建最佳模型,使机器学习的实际风险降到最低. SVM分类器采用二次规划寻找最优解,利用核函数,即使面对高维特征也可获得较好的结果,有利于解决非线性分类问题.

    SVM可以表示为二次优化问题,公式为:

    式(1)-式(3)中,min$\frac{1}{2}$||w||2使分类间隔达到最大,$C \sum\limits_{i=1}^n \xi_i$能够尽可能地减小样本错分概率. 其中C>0为惩罚参数,C表示用于函数复杂度和损失函数误差之间的平衡惩罚因子,ξ为松弛变量,w为超平面的法向量,b为偏置,ε为不敏感损失函数.

    在SVM分类器中,核函数的选择十分关键,常用的核函数包括4种[16],其中高斯径向基核函数能够有效解决线性不可分问题,应用较为普遍[17-18],因此本文选用高斯径向基核函数进行农作物分类.

  • 决策树法适合对无序、无规则的多种空间数据通过寻找内部暗藏规律进行分类. 在决策树模型使用中需要考虑算法特性. 决策树模型的优点:①浅层的(Shallow)决策树视觉上非常直观,而且容易解释;②对数据结构和分布不需作任何假设;③可以捕捉住变量间的相互作用(Interaction). 但是,决策树法也存在深层视觉上和解释上比较困难、容易过分微调样本数据而失去稳定性和抗震荡性、对样本量(Sample Size)需求比较大和处理缺失值功能非常有限等缺陷.

  • 随机森林(Random Forest,RF)是一种特殊的套袋算法,本质是决策树法的改进. 该算法特性良好,相对于单棵决策树而言泛化能力更强、稳定性更高,运算速度较快且鲁棒性较好,能够避免因单棵决策树引起的过拟合现象,在小样本容量情况下依旧能够保持较好的稳定性,具备良好的抗噪能力,容易实现,分类效果较好,在农作物种植信息提取应用中优势明显. 在随机森林分类算法模型构建过程中,特征变量数量m和决策树数量n为需要设置的参数,应用不同其取值不同,计算公式为:

    式(4)-式(5)中,ModelRF建立的模型,IndexRF输入变量的数据集,Value为分类结果隶属的代表数值,ResultRF的分类结果.

  • 层次分析法是一种多层次权重分析决策方法[19],被广泛应用于农作物适宜性评价. 层次分析方法是将复杂问题先看作一个系统,然后对其各组成要素进行两两分析,合并层次形成各组成要素间有序的层次,进而形成有序的层次模型[20]. 然后,根据层次间的重要性对每一个层次因素给出判断矩阵,求出每一层次全部要素的相对权值,就会得到最终每个因子的权重值,否则继续进行层次划分[21]. 层次分析是一种决策分析方法,也是一个量化过程,根据各因素之间的比较和计算可以得出相应的决策方案,这些方案可以被选为最佳方案或作为被选为最佳方案的依据.

  • 利用多时相的Sentinel-2影像提取光谱特征、分割特征、颜色特征及纹理特征,构建特征数据集,这些特征可以将土地覆盖类型的光谱与空间信息进行有效地结合,从而极大地提高遥感影像中农作物的识别能力和准确性,改善作物制图的准确率.

    植被指数由卫星影像数据不同波段组合而得,将光谱信息压缩为一个通道,能够反映地表植被的生长状况[22-23]. 多种植被指数,如归一化建筑指数、归一化水体指数、归一化差值红边指数、简单比值指数和红边叶绿素指数已经被广泛应用于植被分类[24-25]、干旱监测[26]、全球与区域土地覆盖[27-28]、农作物识别[29-31]、作物和牧草估产等领域的研究中. 红边是描述植物色素、健康状况的重要指示波段,能够有效地应用于参数计算、植被状态监测等领域.

    已有研究发现,红边信息能够用来有效地区分地物类别. 目前,几十种植被指数已被定义,对不同地物的敏感性也具有差异. 其中,归一化差分植被指数(Normalized Difference Vegetation Index,NDVI)在农作物提取和监测中应用较为广泛. 考虑到Sentinel-2影像的波段特点,本文除NDVI植被指数外,选取了归一化建筑指数(Normalized Difference Building Index,NDBI)、归一化水体指数(Normalized Difference Water Index,NDWI)、归一化差值红边指数(Normalized Difference Red Edge Index,NDRE1)[34]、简单比值指数(Simple Ratio Index,SRre)[35]和红边叶绿素指数(Red-Edge Chlorophyll Index,CIred-edge)共同作为指数特征进行研究,各植被指数的计算公式见表 1.

  • 通过计算混淆矩阵来获取各分类方案在不同分类器下农作物分类结果的精度. 混淆矩阵是衡量不同分类器分类精度最直观、最便捷的方式. 本文主要利用总体精度和Kappa系数这2个评价指标来分析各方案及算法的农作物分类精度.

    总体精度(Overall Accuracy,OA)为被正确分类的样本个数占样本总数的比例,其计算公式为:

    式(6)中,OA为总体精度;N为样本总数;r为分类类别总个数;i为第j类地物被正确分类的样本个数.

    Kappa系数计算公式为:

    式(7)中,N为样本点像元总数;xi+x+i分别为第i列、第i行的和;xii为主对角线上的值.

  • 本研究所选用的分割方法为棋盘分割(Chess Board),以3个像素格为单位作为一个棋盘格,一个像素格面积为900 m2. 为了比较农作物分类过程中支持向量机(SVM)、决策树、随机森林(RF)3种分类器的分类精度,优选出适合地形复杂地区农作物的分类算法,通过野外实地调查获取验证数据,采用建立混淆矩阵的方法对分类结果进行精度验证.

    具体评价指标为总体分类精度(OA)和Kappa系数,其中总体精度是正确分类像元数占参与分类总像元数比例的表征;Kappa系数则用来度量分类结果与实际数据的一致性,分类结果评价精度见表 2.

    通过上述分析可知,基于随机森林的分类方法在本研究中分类精度优于传统SVM分类法和决策树分类法,因此本文对随机森林分类法进行人为干预,对研究区主要农作物进行分类提取,发现经人为干预后得到的分类结果总体精度为81.88%,Kappa系数为0.7842,总体精度和Kappa系数较之前均有较大提升.

  • 根据支持向量机(SVM)分类、决策树分类、随机森林(RF)分类算法的分类结果(表 3),可以看出所有分类方法中只有决策树分类法未识别出西蓝花,其余方法中SVM分类法提取的作物面积最小.

  • 将随机森林分类法得到的结果进行人为干预后得到研究区主要农作物分布情况(图 2). 从图 2中可以看出,8种农作物广泛分布在研究区内. 经分析发现,研究区内主要农作物分布整体呈镶嵌结构,结合表 3中各农作物的种植面积分析可知,在干预后随机森林分类法得到的研究区主要农作物分类中,白菜的种植面积最大,约为471.11 km2,广泛分布于研究区全区;油麦菜种植面积其次,约为451.12 km2,接着从大到小依次为玉米、野燕麦、生菜、马铃薯、胡萝卜、西蓝花;其中种植面积最小的是西蓝花,约为47.58 km2(图 2).

  • 作物经济性评价理论认为,作物在其区域能否正常生长及取得多大的经济效益取决于3个因素:①作物生长所处的自然物理环境,包括气候条件、地形地貌、土壤质量等. ②作物生长的社会条件,包括基础设施情况、人文环境等. ③作物本身对经济适宜性评价的影响,包括叶绿素含量、水分含量、有效氮含量等. 这3个因素决定了物种的地理空间分布,本文也正是基于这个理论来进行作物种植经济适宜性评价研究.

    河北省张家口市沽源县2012年土地变更调查耕地面积为1 319 km2,主要农作物有燕麦、马铃薯、亚麻、杂豆、蔬菜等,是华北最大的脱毒薯基地. 根据乡镇种植意向调查资料显示,蔬菜、莜麦、甜菜、玉米、杂豆等农作物种植面积增长,零星种植的马铃薯、小麦、油料等种植面积有所下降. 研究中考虑到评价因子的相关性、稳定性及各因子数据的可获得性,选取海拔、坡度、坡向、土壤类型及土壤侵蚀度作为研究区主要农作物种植土地适宜性评价因子. 采用层次分析法(Analytic Hierarchy Process,简称AHP)来确定各评价因子的权重(表 4).

  • 根据河北省张家口市沽源县主要农作物种植生态适宜性指标体系,将土壤侵蚀度和土壤类型作为土壤要素因子;并将海拔、坡度和坡向3个地形指标综合为地形要素因子. 参照以往的研究,根据层次分析法(AHP)的具体步骤,利用和积法对判断矩阵进行归一化和正规化处理,确定各评价因子权重[32],并对各因子的影响程度进行分级. 按照自然分断法,划分为3类土地适宜性等级[33]. 根据《土地评价纲要》中对特定用途土地适宜性程度评价等级划分要求及河北省张家口市沽源县主要农作物种植的自然条件,将土地适宜性分为适宜、中度适宜和不适宜3个等级(表 5).

  • 利用GIS层次分析法与土地适宜性分级指标进行评估,获得河北省张家口市沽源县主要农作物种植土地综合适宜性等级分布图(图 3). 由图 3分析可知,研究区内中度适宜种植当地主要农作物的用地面积最大,其次是适宜种植面积,不适宜种植地区的面积最小. 从整体上看,河北省张家口市沽源县适宜和中度适宜种植用地均匀分布在研究区内,不太适宜种植用地主要分布在沽源县白土窑乡、西辛营乡、西坡、闪电河乡等地区. 由此分析,对于沽源县主要农作物种植中度适宜地区,建议培肥地力,提升该区域的土地质量;在不适宜地区发展其他产业,更加合理地规划利用土地;在种植适宜区应完善现有种植园,创新种植技术和生产模式,促进当地产业发展(图 3).

  • 以Sentinel-2提取的NDV,NDBI,NDWI,NDRE1,SRre,CIred-edge数据及组合为分类特征,分别采用SVM分类法、决策树分类法、随机森林分类法提取研究区内农作物种植信息. 结果表明,随机森林分类法对研究区内8种主要农作物进行分类的精度最高,其总体准确率为65.10%,Kappa系数为0.587 1.

  • 将随机森林分类法得到的结果进行人为干预后得到研究区主要农作物分布情况,发现8种农作物广泛分布在研究区内,整体呈镶嵌结构,其中马铃薯种植面积最大,约为22 728 hm2,广泛分布于研究区全区;生菜种植面积其次,约为21 565 hm2,接着从大到小依次为野燕麦、玉米、油麦菜、白菜、西蓝花,其中野燕麦和玉米主要分布在沽源县的中部和西部地区,有较少部分分布于以“塞北管理区—丰源店”为界的东部地区;种植面积最小的是胡萝卜,约6 826 hm2,最集中区域在沽源县南部,在东北边远地区种植较少.

  • 利用GIS加权叠加法与土地适宜性分级指标进行评估,获得沽源县主要农作物种植土地综合适宜性等级,发现研究区内中度适宜种植当地主要农作物的用地面积最大,其次是适宜种植面积,不适宜种植地区的面积最小. 从整体上看,河北省张家口市沽源县适宜和中度适宜种植用地均匀分布在研究区内.

参考文献 (33)

目录

/

返回文章
返回