应用于线上会议系统的改进仿射投影符号算法

魏丹丹; 吴军; 周翊

doi:10.13718/j.cnki.xdzk.2023.10.013

应用于线上会议系统的改进仿射投影符号算法

1.
遵义师范学院信息工程学院，贵州遵义 563002

2.
重庆邮电大学通信与信息工程学院，重庆 400065

基金项目: 国家自然科学基金项目(62066049)；贵州省普通高等学校青年科技人才成长项目(黔教合KY字[2022]015号)；贵州省科技厅科技支撑计划(黔科合支撑[2023]257)

详细信息

作者简介:
魏丹丹，硕士，讲师，主要从事语音信号处理研究 .

中图分类号: TN911.72

Improved Affine Projection Algorithm and Its Application in Teleconferencing System

1.
School of Information Engineering, Zunyi Normal University, Zunyi Guizhou 563002, China

2.
School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China

摘要:
针对线上会议系统中存在的双端讲话干扰和脉冲噪声问题，提出一种适用于线上会议系统的改进型仿射投影符号算法. 该算法首先用无限脉冲响应(Infinite Impulse Response，IIR)滤波平滑的方式计算信号包络来度量信号能量，通过比较相关的能量估计值来有选择地更新滤波器权重系数以降低双讲情况对系统的干扰，然后对噪声建模，并用新的非线性函数类型替代原算法中的sign函数对噪声性能进行提升，防止算法在脉冲噪声影响下发散. 仿真结果表明，与传统仿射投影算法相比，该算法可以有效克服线上会议系统中的双端对讲干扰和脉冲噪声干扰，而且在收敛速度、稳态失调等方面依旧保持良好性能.
- 线上会议系统 /
- 脉冲噪声 /
- 双端讲话 /
- 仿射投影算法
Abstract:
Aiming at the problems of double-talk interference and impulse noise in the application of online conference system, an improved affine projection symbol algorithm for online conference system was proposed. The new algorithm uses the IIR filter smoothing method to calculate the signal envelope as a measure of signal energy, and by comparing the relevant estimates to selectively update the weight coefficients of the filter, so as to reduce the interference to the system. Then the noise was modeled, and the sigmodal function was used to improve the noise performance to prevent the algorithm from diverging. Finally, the convex combination technique was introduced as the algorithm acceleration scheme. The simulation results show that, compared with the traditional affine projection algorithm, the proposed algorithm can effectively overcome the two-terminal talk interference and impulse noise interference, and still maintain good performance in terms of convergence speed and steady-state.
- teleconference system /
- convex combination /
- two-terminal speech /
- affine projection algorithm .
图 1 线上会议系统的AEC设置

下载: 全尺寸图片幻灯片

图 2 输入高斯白噪声信号

下载: 全尺寸图片幻灯片

图 3 系统辨识

下载: 全尺寸图片幻灯片

图 4 相关自适应算法性能比较(汽车脉冲响应)

下载: 全尺寸图片幻灯片

图 5 相关自适应算法性能比较(会议系统脉冲响应)

下载: 全尺寸图片幻灯片

图 6 不同脉冲噪声水平下算法跟踪性能

下载: 全尺寸图片幻灯片

图 7 相关自适应算法待辨识系统突变的性能比较

下载: 全尺寸图片幻灯片

图 8 语音输入下相关自适应算法跟踪性能(汽车脉冲响应)

下载: 全尺寸图片幻灯片

图 9 语音输入下相关自适应算法跟踪性能(会议系统脉冲响应)

下载: 全尺寸图片幻灯片

图 10 单通道AEC软、硬件实验设置

下载: 全尺寸图片幻灯片

图 11 信号时域波形图

下载: 全尺寸图片幻灯片

[1]	DUTTWEILER D. Proportionate Normalized Least-Mean-Squares Adaptation in Echo Cancelers[J]. IEEE/ACM Transactions on Audio Speech and Language Processing, 2000, 8(5): 508-518. doi: 10.1109/89.861368
[2]	HANSLER E, SCHMIDT G. Acoustic Echo and Noise Control: A Practical Approach[M]. Hoboken: John Wiley & Sons, 2004.
[3]	NI J G, LI F. Adaptive Combination of Subband Adaptive Filters for Acoustic Echo Cancellation[J]. IEEE Transactions on Consumer Electronics, 2010, 56(3): 1549-1555. doi: 10.1109/TCE.2010.5606296
[4]	王文博, 姚英彪, 刘兆霆. 二值传感器网络的分布式稀疏LMS算法[J]. 信号处理, 2019, 35(1): 86-92. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XXCN201901012.htm
[5]	HASSANI I, AREZKI M, BENALLAL A. A Novel Set Membership Fast NLMS Algorithm for Acoustic Echo Cancellation[J]. Applied Acoustics, 2020, 163(C): 107210.
[6]	赵益波, 严涛, 李春彪, 等. α-稳定分布噪声环境下的非线性回声消除研究[J]. 电子学报, 2020, 48(1): 59-65. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DZXU202001007.htm
[7]	吉利鹏, 倪锦根. 偏差补偿符号子带自适应滤波器[J]. 电子学报, 2020, 48(11): 2220-2225. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DZXU202011018.htm
[8]	WANG B, LI H, WU C, et al. Variable Step-Size Correntropy-Based Affine Projection Algorithm with Compound Inverse Proportional Function for Sparse System Identification[J]. IEEJ Transactions on Electrical and Electronic Engineering, 2022, 17(3): 416-424. doi: 10.1002/tee.23533
[9]	LIU W F, POKHAREL P. Principe Correntropy: Properties, and Applications in Non-Gaussian Signal Processing[J]. IEEE Transactions Signal Process, 2007, 55(11): 5286-5298. doi: 10.1109/TSP.2007.896065
[10]	Al-SAYED S, ZOUBIR A M, SAYED A H. Robust Adaptation in Impulsive Noise[J]. IEEE Transactions on Signal Processing, 2016, 64(11): 2851-2865. doi: 10.1109/TSP.2016.2535239
[11]	SHAO T G, Zheng Y R, Benesty J. An Affine Projection Sign Algorithm Robust Against Impulsive Interferences[J]. IEEE Signal Processing Letters, 2010, 17(4): 327-330. doi: 10.1109/LSP.2010.2040203
[12]	ZHOU Y, LIU H, CHAN S C. New Partial Update Robust Kernel Least Mean Square Adaptive Filtering Algorithm[C]//2014 19th International Conference on Digital Signal Processing. Hong Kong: IEEE, 2014.
[13]	郭莹, 于和芳, 赵璐, 等. 非高斯噪声下基于Wilcoxon范数的变步长符号扩散式仿射投影算法[J]. 电子与信息学报, 2021, 43(2): 303-309. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DZYX202102008.htm
[14]	黄梓桐, 阿里甫·库尔班, 韩文轩, 等. 基于最大相关熵的簇稀疏仿射投影算法[J]. 新疆大学学报(自然科学版), 2020, 37(2): 177-182. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XJDZ202002009.htm
[15]	CHAN S C, ZHOU Y, HO K L. A New Sequential Block Partial Update Normalized Least Mean M-Estimate Algorithm and its Convergence Performance Analysis[J]. Journal of Signal Processing Systems, 2010, 58(2): 173-191.
[16]	LOGANATHAN P, HABETS E AP, NAYLOR P A. A Proportionate Adaptive Algorithm with Variable Partitioned Block Length for Acoustic echo Cancellation[C]//Proceedings of the 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Prague: IEEE, 2011.
[17]	CHOI J H, CHO H, JEONG J J, et al. Combination of Step Sizes For Affine Projection Algorithm with Variable Mixing Parameter[J]. Electronics Letters, 2013, 49(18): 1149-1150.
[18]	ALDAJANI M A. Adaptive Step-Size Sign Least Mean Squares[C]// 2004 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Montreal: IEEE Press, 2004.
[19]	WEI Y, ZHANG Y G, WANG C C. Block-Sparsity-Aware LMS Algorithm for Network Echo Cancellation[J]. Electronics Letters, 2018, 54(15): 951-953.
[20]	JIANG S, GU Y. Block-Sparsity-Induced Adaptive Filter for Multi-Clustering System Identification[J]. IEEE Transactions on Signal Processing, 2014, 63(20): 5318-5330.
[21]	魏丹丹, 周翊, 师黎明, 等. 基于反双曲正弦函数的抗冲激块稀疏自适应滤波算法[J]. 计算机应用, 2017, 37(1): 197-199. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY201701035.htm
[22]	Iqbal M A, Stokes J W, Grant S L. Normalized Double-Talk Detection Based on Microphone and AEC Error Cross-Correlation[C]//IEEE International Conference on Multimedia & Expo. Beijing: IEEE, 2007.
[23]	ROTILI R, CIFANI S, PRINCIPI E, et al. A Robust Iterative Inverse Filtering Approach for Speech Dereverberation in Presence of Disturbances[C]//IEEE Asia Pacific Conference on Circuits & Systems. Macao: IEEE, 2008.
[24]	PRINCIPI E, VESPERINI F, SQUARTINI S, et al. Acoustic Novelty Detection with Adversarial Autoencoders[C]//International Joint Conference on Neural Networks. Copenhagen: IEEE, 2017.
[25]	COHEN I. Optimal Speech Enhancement Under Signal Presence Uncertainty Using Log-Spectral Amplitude Estimator[J]. IEEE Signal Processing Letters, 2002, 9(4): 113-116.

图( 11)

计量

文章访问数: 1342
HTML全文浏览数: 1342
PDF下载数: 202
施引文献: 0

全文HTML

开放科学（资源服务）标志码（OSID）：
得益于5G通信技术成熟和业务的蓬勃开展，宽带语音给用户带来了更优质的接近面对面交流的沟通体验. 目前，用户在各类线上会议软件的注册量或者使用以每年数10倍甚至更多倍数的速度增长. 但是，目前线上会议系统的研究还存在许多亟待解决的现实应用问题，例如现有会议系统中搭载的自适应滤波器回声消除算法(Acoustic Echo Cancellation，AEC)在脉冲噪声干扰或双端对讲情况下经常存在发散的问题^[1]，实时性要求得不到保证^[2]. 因此，创建能够克服这一问题并提升用户体验的回声消除算法是当前的主要任务. 回声消除算法在线上会议系统的应用主要是远端用户将语音信号从发送室传到近端接收室，远端语音信号通过扬声器播放出来，经过房间的回波路径不停反射后得到回声信号，该信号同背景噪声一起被话筒拾取得到期望信号. 而回声消除算法不断迭代更新权重系数实现对回声路径建模，从而估计出回声信号^[3-4]. 基于最小均方误差准则(Minimum Mean Square Error，MMSE)的归一化最小均方(Normalized Least Mean Square，NLMS)算法^[5]、迭代最小均方(Recursive Least Mean，RLS)算法^[6]及各类变形算法由于计算复杂度低，结构简单等优点被广泛应用到回声消除中，但是却无法克服输入语音信号高度相关的影响^[7]. 对此，Wang等^[8]提出一种通过多个输入向量更新权重系数的仿射投影(Affine Projection Algorithm，APA)算法，但是APA收敛速度加快是以计算复杂度增加为代价的. 此外，在非高斯干扰下，APA算法性能因为“2-范数准则”特征有所下降，并利用低阶规范对非高斯噪声的鲁棒性^[9-10]提出了基于经典“1-范数准则”的一种无矩阵求逆的仿射投影符号算法(Affine Projection Sign Algorithm，APSA)^[11]. 但是步长因子和正则因子控制的跟踪性能无法满足工程实践的需求，为了同时满足收敛速度快和稳态误差小的跟踪性能要求^[12]，一种基于凸组合方式的算法^[13]被提出，所谓凸组合^[14]就是一种利用两个步长参数进行换挡操作的技术. 小步长参数和大步长参数分别控制误差矢量和收敛速度. 凸组合技术最早是应用在LMS算法中，文献[15]首次将凸组合技术引入APA算法中，接着一系列改进凸组合仿射投影算法甚至凸组合3个独立滤波器抽头系数的方案被提出^[16-17]，从而提高了算法总体性能.

有学者在对线上会议系统中的双端讲话干扰和脉冲噪声问题深入研究的基础上，提出了一种改进型凸组合仿射投影符号算法. 该算法首先在AEC中加入双端检测(Double Talk Detection，DTD)^[18]，DTD方案一般有两种形式：一种是比较远端语音信号和近端麦克风信号的能量，如著名的广泛应用于线路回波消除(Line Echo Cancellation)中的Geigel法^[19]；另一种是通过检测远端和近端麦克风信号之间的相关性来判断DT(Double Talk). 原理在于回波信号与远端语音信号高度相关，而近端语音与远端语音的相关性却很低. 相关检测可通过计算远端信号与近端信号的互相关矢量来实现. 然后，对噪声建模，用新的非线性函数替代原算法中的Sign函数对噪声性能进行提升，防止算法在脉冲噪声影响下发散.

2. 双端讲话干扰推导

线上会议系统中的双端讲话检测(DTD)是一个难点，基于信号包络检测的DTD是一种低运算量的算法，该方法通过比较远端语音信号和近端麦克风信号的能量进而作出相应的DT判断^[22]. 这点和Geigel方法性质类似. 但是，Geigel方法比较的是单个数据点的绝对值，检测函数的变化非常剧烈. 为了得到更准确稳定的判据，信号保罗检测法采用的是信号能量而非单个数据点. 通过IIR滤波平滑的方式来计算信号包络作为信号能量的度量，然后比较相关的估计值得出DT判断. 其中，输入语音信号能量为：

式(12)中，α=0.99是遗忘因子，麦克风信号能量为：

检测函数因此可以计为

式(14)中，参数γ在只有背景噪声时用来限制检测函数的取值，一般设为0.05. 通常情况下，回波能量相对于远端语音信号能量较弱，且近端语音信号能量比回波能量高. 因此，检测函数的值会随着DT出现而显著增大，并随着DT结束而减小. 将检测函数值和一个阈值T相比较，就可以做出相应的判断. 由于语音信号的能量具有时变特性，固定阈值T方案不是好的选择，必须设计一个能跟踪信号能量变化的时变阈值T(n). 当自适应滤波器收敛后，其输出y(n)可以近似地认为等同于真实的回波，因此可以用来作为时变阈值的参考，于是有：

式(15)中，κ=0.02是一个小的正数，用来为检测误差留下一点余地. 比较两者的值可以给出DT判断. 其中，v_x(n)的作用可看作是为了增加算法准确度引入的一个归一化处理.

3. 一种新的凸组合仿射投影符号算法NCC-APSA

本节提出一种新的凸组合仿射投影符号算法NCC-APSA(Novel Covex Combination Affine Projection Sign Algorithm)，新算法用新的非线性Sigmoid函数类型替代原算法中的sign函数，在第2部分双端讲话干扰推导基础上定义新的DT统计量g(n)，有效克服线上会议系统中的双端对讲干扰和脉冲噪声干扰，而且在收敛速度、稳态失调等方面依旧保持良好性能. 根据滤波器线性约束最小化表达式改写为代价函数形式为：

利用负梯度最陡下降法，对式(16)两边关于w_i求导：

令

代入约束条件和基于l₁范数的凸组合技术，然后代入式(10)组合因子推导结果，更新公式为：

为了保证算法在脉冲噪声下的鲁棒性，将式(18)改进为更加平稳的非线性函数sigmoid形式，在算法实施时，为了克服双端对讲干扰，本文做了一点处理. 定义新的DT统计量g(n)，采用ζ(n)-T(n)作为检测函数，通过试验设计固定阈值和控制环节来实现更稳定的DTD，改进后的权重系数更新为：

式(19)中，g(n)由如下表达式获得：

当单端讲话时，近端语音能量值非常小，即DT统计量g(n)=1. 在算法迭代初期，误差信号能量值较大，而滤波器输出信号能量和麦克风信号能量值较小，算法以大步长参数更新，收敛速度快的同时伴随着稳态误差不理想. 待算法迭代趋于稳定后，误差信号能量值变小，而滤波器输出信号能量和麦克风信号能量值逐渐增大，算法以小步长因子更新，降低稳态误差. 随着迭代次数不断增加，算法收敛程度增加，麦克风信号能量和滤波器输出信号能量的差值始终小于误差信号能量，由此可以保证式(19)推导的改进型仿射投影符号算法的收敛性. 当发生双端对讲时，近端语音能量快速增加到一个较大的值，即DT统计量g(n)=0，此时更新过程近乎停止，从而防止了算法发散. 当脉冲噪声干扰时由式(19)可知，会导致误差信号大幅度增加，从而造成$\mu_2 \boldsymbol{U}_i \operatorname{sigm}\left(\boldsymbol{e}_i\right) g(n) / \sqrt{\operatorname{sigm}\left(\boldsymbol{e}_i^{\mathrm{T}}\right) \boldsymbol{U}_i^{\mathrm{T}} \boldsymbol{U}_i \operatorname{sigm}\left(\boldsymbol{e}_i\right)} \approx 0$，权系数的增加量接近于零，算法的迭代几乎停止，因此基本消除了脉冲噪声对算法性能的影响，而回声抑制能力不受影响. 步长衡量因子满足文献[13]中提出的抗脉冲干扰条件. 步长调节因子在脉冲噪声发生时自动调节步长，算法性能趋于均方误差自适应算法，消除了权重矢量由于大幅度误差信号引起更新的可能. 以上分析表明，改进算法NCC-APSA在脉冲噪声和双端对讲的双重干扰下仍能保持算法收敛，表现出了复杂环境下良好的适应性.

5. 结论

针对线上会议系统中存在的双端讲话干扰和脉冲噪声问题，本文提出一种适用于线上会议系统的改进型仿射投影符号算法. 仿真结果表明，该算法可以有效克服线上会议系统中的双端对讲干扰和脉冲噪声干扰，而且依旧保持良好的跟踪性能. 尽管本文算法在一定程度上改善了算法性能，但是没有考虑稀疏信道下的性能优化，而且计算复杂度依然较高，不利于实际应用中推广. 因此，如何利用信道的稀疏先验特性，进一步开发适应稀疏信道的低复杂度算法是下一步研究的重点工作.

参考文献 (25)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

应用于线上会议系统的改进仿射投影符号算法

1.
遵义师范学院信息工程学院，贵州遵义 563002

2.
重庆邮电大学通信与信息工程学院，重庆 400065

作者简介:
魏丹丹，硕士，讲师，主要从事语音信号处理研究 .

Improved Affine Projection Algorithm and Its Application in Teleconferencing System

1.
School of Information Engineering, Zunyi Normal University, Zunyi Guizhou 563002, China

2.
School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China

计量

应用于线上会议系统的改进仿射投影符号算法

作者简介: 魏丹丹，硕士，讲师，主要从事语音信号处理研究
1. 遵义师范学院信息工程学院，贵州遵义 563002

2. 重庆邮电大学通信与信息工程学院，重庆 400065

English Abstract

Improved Affine Projection Algorithm and Its Application in Teleconferencing System

全文HTML

1.1. 仿射投影算法APA

1.2. 仿射投影符号算法APSA

1.3. 凸组合仿射投影符号算法CC-APSA

4.1. 算法性能对比

4.1.1. 稳态输入信号的算法性能对比

4.1.2. 脉冲噪声模型下的算法性能对比

4.1.3. 语音输入信号的算法性能对比

4.2. 基于线上会议系统的算法验证实验

目录

留言板

应用于线上会议系统的改进仿射投影符号算法

1. 遵义师范学院 信息工程学院，贵州 遵义 563002 2. 重庆邮电大学 通信与信息工程学院，重庆 400065

作者简介: 魏丹丹，硕士，讲师，主要从事语音信号处理研究 .

Improved Affine Projection Algorithm and Its Application in Teleconferencing System

1. School of Information Engineering, Zunyi Normal University, Zunyi Guizhou 563002, China 2. School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China

计量

出版历程

应用于线上会议系统的改进仿射投影符号算法

作者简介: 魏丹丹，硕士，讲师，主要从事语音信号处理研究 1. 遵义师范学院 信息工程学院，贵州 遵义 563002 2. 重庆邮电大学 通信与信息工程学院，重庆 400065

English Abstract

Improved Affine Projection Algorithm and Its Application in Teleconferencing System

全文HTML

1.1. 仿射投影算法APA

1.2. 仿射投影符号算法APSA

1.3. 凸组合仿射投影符号算法CC-APSA

4.1. 算法性能对比

4.1.1. 稳态输入信号的算法性能对比

4.1.2. 脉冲噪声模型下的算法性能对比

4.1.3. 语音输入信号的算法性能对比

4.2. 基于线上会议系统的算法验证实验

目录

1.
遵义师范学院信息工程学院，贵州遵义 563002

2.
重庆邮电大学通信与信息工程学院，重庆 400065

作者简介:
魏丹丹，硕士，讲师，主要从事语音信号处理研究 .

1.
School of Information Engineering, Zunyi Normal University, Zunyi Guizhou 563002, China

2.
School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China

作者简介: 魏丹丹，硕士，讲师，主要从事语音信号处理研究
1. 遵义师范学院信息工程学院，贵州遵义 563002

2. 重庆邮电大学通信与信息工程学院，重庆 400065