一种全局空间特征提取的深度网络高光谱解混方法

苏谦; 范永胜; 桑彬彬; 徐敏靖

doi:10.13718/j.cnki.xdzk.2025.04.018

一种全局空间特征提取的深度网络高光谱解混方法

重庆师范大学计算机与信息科学学院，重庆 401331

基金项目: 国家自然科学基金项目(62306054)

详细信息

作者简介:
苏谦，硕士研究生，主要从事计算机视觉高光谱解混研究 .

通讯作者: 范永胜，博士，副教授;

中图分类号: TP751

A Deep Network Hyperspectral Unmixing Method with Global Spatial Feature Extraction

College of Computer and Information Science, Chongqing Normal University, Chongqing 401331, China

摘要:
针对现有高光谱解混方法提取全局上下文信息不充分、光谱空间特征之间的融合也会丢失全局信息，进而导致获取地表信息不准确的现状，提出一种运用双分支网络来提升解混性能的方法。该方法通过3个模块完成解混任务：首先在空间特征提取模块中使用Swin Transformer对全局空间上下文信息进行建模；然后与三维卷积构建的光谱模块提取的光谱信息进行融合；最后运用光谱空间自注意力残差模块对光谱空间特征进行分析。通过相同高光谱数据集上的土壤、树、水、路4种要素对该方法进行验证，并与DAEU、CyCU-Net、DeepTeans、MSNet、DAAN 5种方法的实验数据进行对比，结果表明：在Samson数据集上，该方法比上述5种方法在丰度估计上平均提升了18.31%，在端元提取上平均提升了2.00%；在Jasper Ridge数据集上，丰度估计平均提升了2.70%，端元提取平均提升了8.24%。
- 高光谱解混 /
- 全局信息 /
- 双分支网络 /
- 自注意力
Abstract:
Aiming at the current situation that the existing hyperspectral unmixing methods do not extract enough global context information, and the fusion between spectral and spatial features could also lose global information, which will lead to inaccurate land surface information, a method using a double-branch network to improve the unmixing performance was proposed in this paper. The unmixing task had been completed by this method through three modules. Firstly, the Swin Transformer was used to model the global spatial context information in the spatial feature extraction module. Then, the model was fused with the spectral information extracted by the spectral module constructed by 3D convolution. Finally, the spectral spatial self-attention residual module was used to analyze the spectral spatial features. The proposed method was verified by four elements of soil, tree, water and road on the same hyperspectral data set, and compared with the experimental data of five methods: DAEU, CyCU-Net, DeepTeans, MSNet and DAAN. On the Samson dataset, the proposed method had an average increase of 18.31% in abundance estimation and 2.00% in endmember extraction compared with the above five methods. On the Jasper Ridge dataset, the average increase was 2.70% in abundance estimation and 8.24% in endmember extraction.
- hyperspectral unmixing /
- global information /
- double-branch network /
- self-attention .

图 1 基于AE的高光谱解混

下载: 全尺寸图片幻灯片

图 2 HDN网络架构

下载: 全尺寸图片幻灯片

图 3 双分支网络结构

下载: 全尺寸图片幻灯片

图 4 光谱空间自注意力模块

下载: 全尺寸图片幻灯片

图 5 数据集信息可视化

下载: 全尺寸图片幻灯片

图 6 Samson数据集上的消融实验结果

下载: 全尺寸图片幻灯片

图 7 所有方法在Samson数据集上的端元提取结果对比

下载: 全尺寸图片幻灯片

图 8 所有方法在Samson数据集上的丰度估计结果对比

下载: 全尺寸图片幻灯片

图 9 所有方法在Jasper Ridge数据集上的端元提取结果对比

下载: 全尺寸图片幻灯片

图 10 所有方法在Jasper Ridge数据集上的丰度估计结果对比

下载: 全尺寸图片幻灯片

表 1 训练参数

数据集	优化器	∂	学习率	迭代次数	丢失率
Samson	Adam	0.1	0.030	800	0.2
Jasper Ridge	Adam	0.1	0.001	800	0.2

下载: 导出CSV

表 2 高光谱数据集描述

数据集	选用分辨率	端元	波长/nm	波段数
Samson	95×95	土壤、树、水	401~889	156
Jasper Ridge	100×100	土壤、树、水、路	512~2 500	198

下载: 导出CSV

表 3 所有方法在Samson数据集上的定量结果对比

评估指标	端元	DAEU	CyCU-Net	DeepTrans	MSNet	DAAN	本文方法
E_RMSE	土壤	0.108	0.172	0.072	0.206	0.087	0.044
	树	0.091	0.139	0.093	0.142	0.056	0.065
	水	0.069	0.152	0.116	0.098	0.068	0.065
A_RMSE		0.089	0.154	0.094	0.149	0.071	0.058
D_SAD	土壤	0.057	0.066	0.011	0.220	0.058	0.055
	树	0.057	0.112	0.059	0.032	0.071	0.038
	水	0.084	0.058	0.084	0.080	0.019	0.054
A_SAD		0.066	0.079	0.051	0.111	0.050	0.049

下载: 导出CSV

表 4 所有方法在Jasper Ridge数据集上的定量结果对比

评估指标	端元	DAEU	CyCU-Net	DeepTrans	MSNet	DAAN	本文方法
E_RMSE	土壤	0.103	0.160	0.131	0.163	0.140	0.114
	树	0.096	0.103	0.115	0.082	0.118	0.072
	水	0.144	0.140	0.151	0.153	0.100	0.124
	路	0.151	0.194	0.195	0.077	0.094	0.122
A_RMSE		0.124	0.111	0.148	0.119	0.113	0.108
D_SAD	土壤	0.093	0.078	0.065	0.092	0.068	0.072
	树	0.069	0.123	0.051	0.071	0.103	0.031
	水	0.154	0.131	0.071	0.096	0.161	0.065
	路	0.148	0.156	0.151	0.121	0.056	0.144
A_SAD		0.116	0.122	0.085	0.095	0.097	0.078

下载: 导出CSV

[1]	代先强, 杨盛刚, 肖鹏, 等. 渝东北烟区土壤退化现状剖析[J]. 西南大学学报(自然科学版), 2023, 45(12): 65-75. doi: https://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2023.12.008
[2]	王智, 杨胜刚, 范业晨, 等. 重庆市石柱县烟田土壤养分空间异质性分布及评价[J]. 西南大学学报(自然科学版), 2023, 45(11): 42-52. doi: https://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2023.11.005
[3]	杨鉴, 张珍明, 陈祖拥, 等. 贵州省典型茶园土壤锌含量空间异质性及影响因素[J]. 东北农业大学学报, 2023, 54(12): 21-31.
[4]	杨梅, 胡晓婷, 徐卫红. 不同类型土壤与辣椒风味品质的相关性研究[J]. 西南大学学报(自然科学版), 2024, 46(1): 2-16. doi: https://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2024.01.001
[5]	李恬, 李怀刚, 何建军, 等. 陆面资料对复杂地形气温和降水模拟的影响——以济南市为例[J]. 西南大学学报(自然科学版), 2023, 45(9): 124-131. doi: https://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xdzk.2023.09.012
[6]	莫金宵, 雷冬梅, 李杰, 等. 县级自然保护区土地利用景观格局与固碳功能关系分析——以云南省梁王山为例[J]. 云南农业大学学报(自然科学), 2023, 38(4): 694-703.
[7]	HEYLEN R, PARENTE M, GADER P. A Review of Nonlinear Hyperspectral Unmixing Methods[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(6): 1844-1868. doi: 10.1109/JSTARS.2014.2320576
[8]	LI S T, SONG W W, FANG L Y, et al. Deep Learning for Hyperspectral Image Classification: An Overview[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(9): 6690-6709. doi: 10.1109/TGRS.2019.2907932
[9]	PALSSON B, SIGURDSSON J, SVEINSSON J R, et al. Hyperspectral Unmixing Using a Neural Network Autoencoder[J]. IEEE Access, 2018, 6: 25646-25656. doi: 10.1109/ACCESS.2018.2818280
[10]	SHI S K, ZHAO M, ZHANG L J, et al. Probabilistic Generative Model for Hyperspectral Unmixing Accounting for Endmember Variability[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 60: 5516915.
[11]	PALSSON B, ULFARSSON M O, SVEINSSON J R. Convolutional Autoencoder for Spectral-Spatial Hyperspectral Unmixing[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 59(1): 535-549. doi: 10.1109/TGRS.2020.2992743
[12]	YU Y, MA Y, MEI X G, et al. Multi-Stage Convolutional Autoencoder Network for Hyperspectral Unmixing[J]. International Journal of Applied Earth Observation and Geoinformation, 2022, 113: 102981. doi: 10.1016/j.jag.2022.102981
[13]	GHOSH P, ROY S K, KOIRALA B, et al. Hyperspectral Unmixing Using Transformer Network[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 5535116.
[14]	DOSOVITSKIY A, BEYER L, KOLESNIKOV A, et al. An Image Is Worth 16×16 Words: Transformers for Image Recognition at Scale[EB/OL]. (2021-06-03)[2024-02-10]. https://arxiv.org/abs/2010.11929.
[15]	MA Q, JIANG J J, LIU X M, et al. Learning a 3D-CNN and Transformer Prior for Hyperspectral Image Super-Resolution[J]. Information Fusion, 2023, 100: 101907. doi: 10.1016/j.inffus.2023.101907
[16]	FAROOQUE G, LIU Q C, SARGANO A B, et al. Swin Transformer with Multiscale 3D Atrous Convolution for Hyperspectral Image Classification[J]. Engineering Applications of Artificial Intelligence, 2023, 126: 107070. doi: 10.1016/j.engappai.2023.107070
[17]	LIU Z, LIN Y T, CAO Y, et al. Swin Transformer: Hierarchical Vision Transformer Using Shifted Windows[C] //2021 IEEE/CVF International Conference on Computer Vision (ICCV), October 10-17, 2021, Montreal, QC, Canada. IEEE, 2021: 9992-10002.
[18]	GAO L R, HAN Z, HONG D F, et al. CyCU-Net: Cycle-Consistency Unmixing Network by Learning Cascaded Autoencoders[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 60: 5503914.
[19]	SU Y C, ZHU Z Q, GAO L R, et al. DAAN: A Deep Autoencoder-Based Augmented Network for Blind Multilinear Hyperspectral Unmixing[J]. IEEE Transactions on Geoscience and Remote Sensing, 2024, 62: 5512715.
[20]	NASCIMENTO J M P, DIAS J M B. Vertex Component Analysis: A Fast Algorithm to Unmix Hyperspectral Data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(4): 898-910.

图( 10) 表( 4)

计量

文章访问数: 528
HTML全文浏览数: 528
PDF下载数: 84
施引文献: 0

全文HTML

开放科学(资源服务)标识码(OSID):
高光谱图像是一种通过在大量连续波长范围内采集数据来获取物体表面光谱信息的图像，因其具有丰富的光谱信息，能更精准识别其他图像无法区分的细微材料。地表相关信息对农业生产具有重大意义，其研究需要运用高光谱图像，例如适宜的土壤能够生产出更加优质的烟草^[1-2]和茶叶^[3]，不同的土壤能够让辣椒产生不同的营养和风味品质^[4]，精准的陆面资料能够降低地区天气和降水的模拟误差^[5]，生态系统碳储存功能与景观格局变化有着极大相关性^[6]等。然而高光谱图像具有空间分辨率较低，图像中普遍存在混合像元的问题，因此对下游任务的开展将带来不利影响。高光谱解混技术的研发，其目的就是将高光谱图像中高度混合的像元分解成纯物质的光谱(即端元)和纯物质所占像元的比例(即丰度)。高光谱解混技术的大量研究和应用主要基于2个不同的混合模型，即线性和非线性混合模型^[7]。线性混合模型假设入射光只与一种物质产生作用，其混合光谱可以表示为纯物质光谱的线性组合。非线性混合模型考虑到了多种物体之间的多次反射，更符合实际情况，但面临着缺乏适当的非线性程度以及先验知识相关方面的挑战。

随着大数据时代的来临，深度学习迅速发展，并已用于高光谱解混任务中^[8]。与传统的解混方法相比，深度学习可以在任意网络结构组合以及非线性结构上实现，具有更高的适用性与灵活性。自动编码器(Auto Encoder，AE)是高光谱解混方法中典型的基于深度学习方法的基本网络结构，其主要分为编码器和解码器2个部分。编码器主要用于提取隐藏层的低维特征来进行丰度估计，解码器主要用于将低维特征重构为原始输入数据并获得端元矩阵。目前，已经有学者提出许多基于AE方法的变体。例如：Palsson等^[9]提出了一种深层AE来进行高光谱解混，并验证了不同激活函数对AE的作用；Shi等^[10]针对现有方法对光谱变异性建模能力的不足，提出了一个概率生成模型来解决端元变异性问题，并通过神经网络的非线性建模功能来拟合任意端元分布，进而提供更准确的丰度和端元估计。然而，高光谱图像中的相邻像素间往往表现出高度的空间相关性，上述方法并没有充分考虑空间信息。因此，Palsson等^[11]提出了一种基于卷积AE的解混方法，该方法直接使用高光谱图像块，并且不使用任何池化或上采样层，因此始终保留了图像的空间结构。Yu等^[12]受感受野机制和多级框架有效性的启发，提出了一种用于高光谱解混的多级卷积AE网络，能够通过卷积AE在逐步多级分解过程中学习广泛的上下文信息而不丢失细节特征。过去也有一些学者尝试解决这些问题，例如Ghosh等^[13]将卷积AE与Transformer相结合，提出了一种新颖的基于深度神经网络的Transformer高光谱解混模型，使Transformer在视觉领域中建模全局上下文信息得到成功应用^[14]。但目前大多数基于AE的解混方法都是纯粹基于卷积神经网络(Convolutional Neural Network，CNN)提出的，而CNN又受卷积核大小的限制，容易丢失原始图像中的大量上下文信息，使其在处理高光谱图像的复杂性问题上面临较大的挑战。

近年来，许多学者也通过Swin Transformer和三维CNN的结合来进行光谱信息处理，例如Ma等^[15]使用Transformer代替CNN来学习HSI(Hyperspectral Image)的先验，然后在Transformer层后面添加了三维CNN探索HSI的空间光谱相关性，使得在2个广泛使用的HSI数据集和真实世界数据集上实现了相当大的增益。Farooque等^[16]提出了一种以处理HSI立方体作为输入，并采用涉及具有不同Atrous速率的三维层并行分支光谱空间特征提取模块的方法，该方法能够以多种尺度和分辨率提取特征，并在多个HSI数据集上取得一定的优越性。但是使用Swin Transformer和三维CNN结合的方法依然是针对HSI的2种特征进行直接融合或拼接，对于深层融合时出现的特征冗余现象的处理存在一定不足。

为此，本文提出一种综合考虑全局上下文信息的双分支网络结构，其中空间特征提取模块利用Swin Transformer建模全局空间上下文信息^[17]，光谱特征提取模块利用三维CNN进行光谱信息的建模，而光谱空间自注意力模块进一步提取全局深度融合的上下文信息，最后在2个真实数据集上通过消融实验和对比实验进行验证。

4. 结论

针对深度神经网络方法在高光谱图像解混研究中的不足，本文提出了一种结合二维和三维卷积的双分支网络模型，以提升解混性能。该网络模型包含3个模块，首先通过Swin Transformer构建的空间模块和三维卷积构建的光谱模块分别进行高光谱图像空间特征和光谱特征的提取，然后通过光谱空间自注意力残差模块进行空间特征和光谱特征的深度融合以获得联合特征信息。在Samson数据集和Jasper Ridge数据集上进行实验，以验证模型的有效性。采用均方根误差E_RMSE、光谱角距离D_SAD、平均均方根误差A_RMSE与平均光谱角距离A_SAD作为评估指标，结果表明在丰度估计上分别平均提升了18.31%与2.70%，在端元提取上分别平均提升了2.00%与8.24%，证明了本文方法可以有效地提升高光谱解混的性能，对于地表相关信息能够更加精准地进行分析。

参考文献 (20)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

一种全局空间特征提取的深度网络高光谱解混方法

重庆师范大学计算机与信息科学学院，重庆 401331

作者简介:
苏谦，硕士研究生，主要从事计算机视觉高光谱解混研究 .

通讯作者: 范永胜，博士，副教授;

A Deep Network Hyperspectral Unmixing Method with Global Spatial Feature Extraction

College of Computer and Information Science, Chongqing Normal University, Chongqing 401331, China

计量

一种全局空间特征提取的深度网络高光谱解混方法

通讯作者: 范永胜，博士，副教授;

作者简介: 苏谦，硕士研究生，主要从事计算机视觉高光谱解混研究
重庆师范大学计算机与信息科学学院，重庆 401331

English Abstract

A Deep Network Hyperspectral Unmixing Method with Global Spatial Feature Extraction

Corresponding author: FAN Yongsheng ;

全文HTML

1.1. 线性混合模型

1.2. 基于AE解混的原理

2.1. 网络结构

2.2. 双分支特征提取模块

2.3. 光谱空间自注意力模块

2.4. 损失函数

3.1. 实验设置

3.2. 高光谱数据集描述

3.3. 评估指标

3.4. 消融实验

3.5. 定量结果分析

3.5.1. Samson数据集的实验结果分析

3.5.2. Jasper Ridge数据集的实验结果分析

目录

留言板

一种全局空间特征提取的深度网络高光谱解混方法

重庆师范大学 计算机与信息科学学院，重庆 401331

作者简介: 苏谦，硕士研究生，主要从事计算机视觉高光谱解混研究 .

通讯作者: 范永胜，博士，副教授;

A Deep Network Hyperspectral Unmixing Method with Global Spatial Feature Extraction

College of Computer and Information Science, Chongqing Normal University, Chongqing 401331, China

计量

出版历程

一种全局空间特征提取的深度网络高光谱解混方法

通讯作者: 范永胜，博士，副教授;

作者简介: 苏谦，硕士研究生，主要从事计算机视觉高光谱解混研究 重庆师范大学 计算机与信息科学学院，重庆 401331

English Abstract

A Deep Network Hyperspectral Unmixing Method with Global Spatial Feature Extraction

Corresponding author: FAN Yongsheng ;

全文HTML

1.1. 线性混合模型

1.2. 基于AE解混的原理

2.1. 网络结构

2.2. 双分支特征提取模块

2.3. 光谱空间自注意力模块

2.4. 损失函数

3.1. 实验设置

3.2. 高光谱数据集描述

3.3. 评估指标

3.4. 消融实验

3.5. 定量结果分析

3.5.1. Samson数据集的实验结果分析

3.5.2. Jasper Ridge数据集的实验结果分析

目录

重庆师范大学计算机与信息科学学院，重庆 401331

作者简介:
苏谦，硕士研究生，主要从事计算机视觉高光谱解混研究 .

作者简介: 苏谦，硕士研究生，主要从事计算机视觉高光谱解混研究
重庆师范大学计算机与信息科学学院，重庆 401331