-
计算机视觉中的显著性检测是确定图像最突出和最明显部分的过程[1]. 查找图像中的显著区域在计算机视觉中是至关重要的应用程序,因为它使系统可以使用较少的资源来处理相对较小但重要的区域[2]. 因此,显著目标检测在图像分割、分类、目标识别与检测、图像和视频压缩等图像处理领域中得到了广泛的应用[3].
目前,在寻找图像显著区域方面已经进行了众多的研究. 大多数方法通过比较显著性物体与背景的差异来突出显著物体,主要依赖于颜色[4]、对比度[5]、轮廓[6]、目标度[7]、聚焦度[8]、背景以及唯一性[9]等,这些方法分别在像素、区域和图像级别提取显著性特征. 显著性检测模型分为两类:一类是自下而上的感知驱动模型,使用低级图像特征来自动定位显著区域,另一类是自上而下的语义驱动模型,根据一定的先验知识来判断所考虑图像的显著区域[10]. 本文主要关注自下而上的显著性模型. Sun等[11]提出一种基于稀疏梯度的结构矩阵分解显著目标检测模型,利用稀疏梯度正则化来扩大特征空间中显著区域和背景区域之间的距离,从而提高模型的性能. Annum等[12]提出一种基于对比度增强和纹理平滑的显著性框架用于处理具有纹理和低对比度背景的复杂图像. 近年来,基于机器学习的方法在显著性检测领域取得较好的效果. Tu等[13]提出一种基于边缘引导的非局部全卷积神经网络,该网络采用边缘引导特征学习的方式获得显著目标的清晰边缘结构,从而实现精确的显著目标检测. 为了解决显著图中存在背景信息杂乱、干扰噪声多、细节丢失等问题,Han等[14]将边缘卷积约束加入到一个修正的U-Net中,采用跳跃式的网络结构融合不同层次的特征,从而减少输出对象边缘模糊和信息丢失.
尽管当前研究人员在显著区域检测方面取得了很大的进步,但是这些方法在计算显著性模型时所考虑的图像是干净的,并且没有视觉干扰,而在宽广的噪声强度范围内获得退化图像的高质量显著性图仍是当前面临的一项重大挑战. 为了解决这一问题,本文提出一种基于多分辨率动态模式分解(multi-resolution dynamic mode decomposition,MRDMD)的显著性区域检测方法,该方法首先将输入图像由RGB色彩空间转换至CIELAB,YCbCr和YUV色彩空间中,将每个颜色通道的图像以及边缘映射和高斯滤波图像堆叠在一起组成快照矩阵,然后MRDMD模型将生成的矩阵分解为多个级别并使用各个级别的信息来生成显著性图. 为了增强显著性图,该方法基于空间信息进行了一些后处理操作.
全文HTML
-
动态模式分解(dynamic mode decomposition,DMD)[15]是流体力学界最初引入的一种新的工具,主要用于分析非线性系统的行为. DMD理论对数据进行模拟得到流场,提取其中的动态信息,根据不同频率的流场变动寻找数据映射,将高维数据分解为时空模式,该操作可以视为空间域中的主成分分析(principle component analysis,PCA)和频率域中傅立叶分析的组合. 给定在等间隔时间内收集的数据,DMD方法逼近低维模态,以估计底层系统的非线性动力学.
-
基于MRDMD模型的显著区域检测将多分辨率技术与DMD集成在一起,从空间和时间两个角度分离多尺度的时空特征. 本文模型大致分为4个步骤:图像色彩空间转换和边缘检测、构造快照矩阵、MRDMD分解、显著性图增强.
-
多分辨率动态模式分解是将多分辨率分析技术引入DMD方法中,在时间和空间上对多尺度系统进行建模的过程. 尽管与其他降维技术相比,DMD能够提供更好的性能,但是其局限性也十分明显. DMD仅以单个分辨率运行,并且包含前景和背景数据,而且与多分辨率分析相比,DMD的计算复杂度高. 多分辨率分析通常使用基于小波的方法进行,可以从感兴趣的数据中系统地递归删除特征. 多分辨率动态模式分解是DMD算法的扩展,可将时域信号分为时空模式,同时提取时空特征.
-
MRDMD整合了空间和时间特征,通过递归采样的方式从数据中删除缓慢变化或不重要的空间和时间特征(包括噪声),因此MRDMD非常适合分离感兴趣的区域. 正如基于DMD的显著区域检测方法一样,本文方法将大小为M×N的输入彩色图像由RGB色彩空间转换至CIELAB,YCbCr和YUV色彩空间中,并且将每个颜色通道的图像堆叠在一起以形成序列快照. 将图像分解为各种颜色通道能够更好地分离图像的色度和亮度,而且图像的显著区域在不同颜色通道中显示出不同程度的可感知性. 除此之外,还能够利用多个颜色通道表示保留的图像信息做进一步的处理,用于描述人类感知的非线性行为.
人脑对图像/场景具有独特的颜色敏感,因此使用与色度信息相对应的列向量为图像提供了更好的动态表示. 基于颜色的表示方法适用于前景和背景颜色分布不同的图像. 如果前景和背景颜色重叠,仅基于颜色的表示将很弱. 为了解决这个问题,需要增加亮度信息. 本文利用经典的Canny边缘检测算法[16]对不同亮度通道的边缘映射进行提取,但是边缘映射仅能够表征输入图像的高频信息. 为了增加低频图像表示,还需将输入的原始图像进行高斯平滑. 然后将平滑图像和边缘映射进行矢量化,并添加到快照矩阵中,用作MRDMD模块的输入.
由于MRDMD能够更好地分解具有不同频率分量的输入矩阵,因此本文使用具有不同频率分量(平滑图像、边缘映射和颜色通道表示)的快照矩阵作为输入. MRDMD将对给定的数据矩阵进行分解,并递归地移除每个矩阵中缓慢变化的内容. 在本文实验中MRDMD进行了3级分解:MRDMD的第1级分解将DMD近似分量分解为慢速模式和快速模式,MRDMD的第2级分解用于捕获最慢的模式,即图像的背景信息,第3级分解捕获最快模式,即图像的前景信息.
为了增强显著性图,本文方法基于空间信息进行了一些后处理操作,基本思想是赋予属于显著区域的像素更多的权重,并抑制非显著像素. 在空间细化过程中主要是基于两个假设进行的:①图像中的显著区域通常不位于图像边界附近;②与非显著区域相比,初始显著性图中的真实显著对象通常具有更多的像素数. 因此,可以从初始显著性图中去除靠近图像边界的区域以及较小的区域.
2.1. 多分辨率动态模式分解
2.2. 基于MRDMD的显著区域检测
-
为了验证本文方法的有效性,利用MSRA-B,SOD和ECSSD这3个数据集[17]对基于MRDMD的显著性模型进行评估,并将测试结果与当前先进的显著性检测模型SP-GMM[18],SOD-CED[19],GVF-MDC[20]和GTS[21]等进行了对比. 这些方法在获取图像显著图的过程中或多或少地考虑了噪声的影响,并采取了一定的技巧用于处理噪声. 本文实验的运行环境为Window10系统,Intel Core i7-4790 @ 3.6 GHz,RAM 8 GB,NVIDIA GTX750 Ti,运行软件为matlab 2018b.
-
本文选取MSRA-B,ECSSD和PASCAL-S这3个具有像素级显著性真实图像标注的基准数据集进行一组定性和定量分析实验. MSRA-B数据集中含有5 000幅多个类别的图像,其中大多数图像都有一个突出的目标和相应的真实图像. ECSSD数据集中含有1 000幅结构复杂的图像,该数据集的全部图像来自互联网,其中包含的真实图像由5名受试者标记. PASCAL-S包含850个图像,这些图像包含由12名受试者标记的像素级显著性真实图像.
为了客观评估本文方法的检测效果,使用平均绝对误差MAE、精度-召回率分析(PR曲线)和F1-测量值作为客观评价指标. MAE表示显著性图与真实图之间的误差,其定义为
式(1)中:H表示像素总数,h表示像素变量,取值范围为[1,H],S和GT分别表示像素的显著性值和真值.
精度P是指检测出的真实显著性图内像素个数与检测显著性像素个数之比,召回率R是指检测出的真实显著性像素个数与真图内显著性像素个数之比,两者的计算公式分别为
F1-测量值通过综合考虑查准率和查全率来评估模型的整体性能,是精度和召回率的调和平均数.
式中:β为调和系数,其值设置为0.3.
-
所有显著区域检测方法都能够检测出显著区域的位置和轮廓,但是SP-GMM方法突出的区域比较模糊,边缘细节丢失严重. SOD-CED和GVF-MDC则轮廓比较清晰,边缘细节处理的较好,但是混杂了细微背景. GTS检测对象较为完整,整个区域的显著性值较为一致,但是也存在细节丢失的现象. 相比于其他算法,本文模型产生了更好的显著性图,不仅清晰检测出显著性区域的细节部分不含多余的非显著性区域,而且显著性图的信息更丰富.
-
为了对本文方法的性能进行客观评价,选取PR曲线、F1-测量值和MAE值进行对比分析. 对于PR曲线,相同召回率下的准确率越高,则说明相应检测方法越有效. 本文方法的性能优越性在PR曲线上明显可见,在相同召回率情况下MRDMD的准确率最高. 同时,在所有数据集中与MRDMD模型相关的PR曲线在0.4~1之间,表明了该方法的鲁棒性. 因此,本文方法产生了更好的显著性映射.
-
为了评估各种显著性模型在噪声输入下的稳定性,本文实验在输入图像中加入方差为0.05,0.1,0.2或0.3的高斯白噪声. 选择高斯白噪声是因为它被用来模拟自然界中许多随机过程的影响. 本文的显著性模型能够在不同的噪声强度下保持质量.
为了研究模型对噪声刺激的敏感性,本文针对各种噪声强度(σ2=0,0.05,0.1,0.2,0.3)给出了每种方法的AUC(Area Under Curve)值. 随着噪声强度增加,所有显著性模型的性能都会下降. 但是,本文提出的MRDMD显著性模型在较大的噪声强度范围内要优于其他方法.
3.1. 数据集及评价指标
3.2. 定性评价
3.3. 定量评价
3.4. 噪声影响分析
-
为了解决在宽广噪声强度范围内获得退化图像高质量显著性图的挑战问题,本文提出一种基于MRDMD模型的噪声图像显著性检测方法,该方法通过将MRA技术引入DMD方法中,在时间域和空间域上进行建模,提取多尺度的时空特征. 本文方法将输入图像由RGB色彩空间转换至CIELAB,YCbCr和YUV色彩空间中,利用图像的色度、亮度和边缘信息生成MRDMD模型的输入矩阵,而后MRDMD模型经过多级分解并使用各级中的信息来生成显著性图. 为了增强显著性图,本文方法还采用形态学平滑和对比度增强技术进行了后处理操作. 相比于其他方法,本文方法在干净和嘈杂的图像中显著性都具有明显的优势.