基于加权核范数的低秩矩阵补全算法研究

石莹; 黄华; 王智; 高超

doi:10.13718/j.cnki.xdzk.2022.05.022

基于加权核范数的低秩矩阵补全算法研究

1.
西南大学信息化建设办公室，重庆 400715

2.
重庆工程职业技术学院，现代教育技术中心，重庆 402260

3.
西南大学计算机与信息科学学院，重庆 400715

4.
西北工业大学光电与智能研究院，西安 710072

基金项目: 国家自然科学基金项目(61976181)

详细信息

作者简介:
石莹，高级工程师，主要从事机器学习、网络优化等研究 .

通讯作者: 黄华，硕士，高级实验师;

中图分类号: TN911.72

Low-Rank Matrix Completion with Weighted Nuclear Norm Regularizer

1.
Office of Information Technology, Southwest University, Chongqing 400715, China

2.
Modern Education Technology Center, Chongqing Vocational Institute of Engineering, Chongqing 402260, China

3.
College of Computer and Information Science, Southwest University, Chongqing 400715, China

4.
School of Artificial Intelligence, Northwestern Polytechnical University, Xi'an 710072, China

摘要: 利用加权核范数去松弛原始低秩极小化问题，基于Soft-Impute算法思想提出WNNM-Impute算法.通过引入不精确的近邻算子极大地降低WNNM-Impute算法的时间复杂度，从而使得算法收敛更快.同时，在算法中引入Nesterov加速策略，使得算法的总体迭代次数进一步减少.大量的实验结果表明，所提算法能得到更精确的解且拥有比Soft-Impute和大多数对比算法更快的收敛速率.
- 低秩矩阵补全 /
- Soft-Impute算法 /
- Nesterov优化理论
Abstract: Low rank matrix completion is a most basic problem in machine learning and data analysis.It plays a key role in solving many important problems, such as collaborative filtering, dimensionality reduction, multi-task learning and pattern recognition.In this work, we employ the weighted nuclear norm to relax the rank function.Inspired by the idea of Soft-Impute, we proposed WNNM-Impute algorithm by using inexact proximal operator and Nesterov's rule.Experiments delivered very encouraging results in terms of the quality of achieved solution and the processing time required.
- low rank matrix completion /
- Soft-Impute /
- Nesterov's rule .

图 1 测试图像集

下载: 全尺寸图片幻灯片

图 2 WNNM-Impute算法在Lena图像上的恢复结果

下载: 全尺寸图片幻灯片

表 1 不同算法在不同规模和不同采样率下的矩阵补全结果

	m=500			m=1 500			m=2 000			m=3 000
	NMSE	r	t/s	NMSE	r	t/s	NMSE	r	t/s	NMSE	r	t/s
SVT	5.11	5	4.96	4.97	5	33.34	4.75	5	52.96	5.17	5	121.39
APG	4.14	45	5.29	4.05	91	369.17	3.81	104	462.34	3.78	143	2 615.23
R1MP	29.42	142	0.62	27.51	118	1.12	30.02	141	2.84	29.20	156	5.29
Soft-Impute	6.26	52	45.31	9.74	83	201.37	21.30	94	529.48	37.25	88	1 282.21
WNNM	2.01	5	25.70	2.33	5	156.98	2.17	5	429.73	2.30	5	984.29
WNNM-Impute	1.99	5	0.25	1.89	5	0.79	1.84	5	2.03	1.86	5	2.45

下载: 导出CSV

表 2 不同算法在图像数据集上的恢复结果

	Barbara		Bridge		Clown		Couple		Crowd
	PSNR	t/s	PSNR	t/s	PSNR	t/s	PSNR	t/s	PSNR	t/s
SVT	21.57	13.20	21.49	11.78	25.43	11.39	24.31	11.25	22.96	11.84
APG	23.74	9.39	23.16	7.78	26.36	7.60	25.57	7.67	24.88	7.82
R1MP	18.56	0.41	14.29	0.34	20.11	0.42	19.51	0.47	18.28	0.44
Soft-Impute	23.67	21.30	16.41	1.34	26.35	16.97	16.74	1.35	24.85	20.74
WNNM	23.61	10.32	23.25	8.76	26.69	13.92	26.33	8.71	25.05	14.37
WNNM-Impute	23.92	0.57	23.76	0.43	26.71	0.66	26.30	0.63	25.16	0.58

	Fingerprint		Houses		Girlface		Lena		Kiel
	PSNR	t/s	PSNR	t/s	PSNR	t/s	PSNR	t/s	PSNR	t/s
SVT	19.47	10.53	19.52	12.75	25.98	11.36	25.61	11.60	21.55	13.52
APG	23.06	7.89	22.34	8.07	26.11	7.97	25.86	7.82	21.59	8.30
R1MP	12.26	0.40	10.97	0.51	21.07	0.47	20.38	0.53	18.37	0.55
Soft-Impute	14.86	1.40	13.72	1.38	26.41	1.31	25.97	1.56	21.71	1.36
WNNM	23.34	10.29	22.76	9.84	26.83	9.17	26.11	9.34	22.17	9.14
WNNM-Impute	23.32	0.51	23.01	0.73	26.82	0.68	26.16	0.75	22.25	0.68

下载: 导出CSV

表 3 协同过滤数据集的特征

dataset	ausers	jokes and movies	ratings
Jester1	24 983	100	10⁶
Jester1	23 500	100	10⁶
Jester1	24 983	100	6×10⁵
MovieLens-100K	943	1 682	10⁵
MovieLens-1M	6 040	3 706	10⁶
MovieLens-10M	69 878	10 677	10⁷

下载: 导出CSV

表 4 不同算法在Jester笑话数据集上的恢复结果

	Jester1			Jester2			Jester3
	RMSE	r	t/s	RMSE	r	t/s	RMSE	r	t/s
SVT	4.441 0	3	60.55	4.475 1	2	59.86	4.923 6	2	78.34
APG	4.522 1	31	122.30	4.416 2	30	118.72	4.956 4	31	267.35
R1MP	5.005 6	6	0.90	4.921 8	5	0.66	5.249 4	5	0.82
Soft-Impute	4.304 8	27	23.52	4.392 6	25	15.93	4.758 1	25	30.10
WNNM	4.335 9	3	20.19	4.527 1	2	14.99	4.882 4	2	28.67
WNNM-Impute	4.301 7	3	1.34	4.405 8	2	0.91	4.742 5	2	3.94

下载: 导出CSV

表 5 不同算法在MovieLens数据集上的恢复结果

	MovieLens-100K			MovieLens-1M			MovieLens-10M
	RMSE	r	t/s	RMSE	r	t/s	RMSE	r	t/s
SVT	0.877 6	2	42.26	0.870 4	5	512.81	-	-	＞10⁴
APG	1.045 2	43	476.26	-	-	＞10⁴	-	-	＞10⁴
R1MP	0.988 4	9	0.24	0.969 3	23	1.67	0.943 5	42	47.19
Soft-Impute	0.961 2	39	4.57	0.912 7	90	95.73	0.850 1	107	1 528.61
WNNM	0.977 4	2	4.22	0.920 8	5	84.27	0.863 3	8	1 186.41
WNNM-Impute	0.913 5	2	0.55	0.910 6	5	5.62	0.842 7	8	118.76

下载: 导出CSV

[1]	RENNIE J D M, SREBRO N. Fast Maximum Margin Matrix Factorization for Collaborative Prediction[C]//ICML'05: Proceedings of the 22nd International Conference on Machine Learning. New York: Association for Computing Machinery, 2005: 713-719.
[2]	KOREN Y. Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model[C]//KDD'08: Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: Association for Computing Machinery, 2008: 426-434.
[3]	LI X H, WANG Z, GAO C, et al. Reasoning Human Emotional Responses from Large-Scale Social and Public Media[J]. Applied Mathematics and Computation, 2017, 310: 182-193. doi: 10.1016/j.amc.2017.03.031
[4]	PENG X, TANG H J, ZHANG L, et al. A Unified Framework for Representation-Based Subspace Clustering of Out-of-Sample and Large-Scale Data[J]. IEEE Transactions on Neural Networks and Learning Systems, 2016, 27(12): 2499-2512. doi: 10.1109/TNNLS.2015.2490080
[5]	LIU Y, NIE F P, GAO Q X. Nuclear-Norm Based Semi-Supervised Multiple Labels Learning[J]. Neurocomputing, 2018, 275: 940-947. doi: 10.1016/j.neucom.2017.09.039
[6]	LIU Y, GAO Q X, LI J, et al. Zero Shot Learning via Low-Rank Embedded Semantic AutoEncoder[C]//Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence. California: International Joint Conferences on Artificial Intelligence Organization, 2018: 2490-2496.
[7]	RECHT B, FAZEL M, PARRILO P A. Guaranteed Minimum-Rank Solutions of Linear Matrix Equations via Nuclear Norm Minimization[J]. SIAM Review, 2010, 52(3): 471-501. doi: 10.1137/070697835
[8]	CANDÈS E J, RECHT B. Exact Matrix Completion via Convex Optimization[J]. Foundations of Computational Mathematics, 2009, 9(6): 717-772. doi: 10.1007/s10208-009-9045-5
[9]	FAZEL M. Matrix Rank Minimization with Applications[D]. Stanford: Stanford University, 2002.
[10]	CAI J F, CANDÈS E J, SHEN Z W. A Singular Value Thresholding Algorithm for Matrix Completion[J]. SIAM Journal on Optimization, 2010, 20(4): 1956-1982. doi: 10.1137/080738970
[11]	TOH K C, YUN S. An Accelerated Proximal Gradient Algorithm for Nuclear Norm Regularized Linear Least Squares Problems[J]. Pacific Journal of Optimization, 2010, 6(3): 615-640.
[12]	MA S Q, GOLDFARB D, CHEN L F. Fixed Point and Bregman Iterative Methods for Matrix Rank Minimization[J]. Mathematical Programming, 2011, 128(1-2): 321-353. doi: 10.1007/s10107-009-0306-5
[13]	MAZUMDER R, HASTIE T, TIBSHIRANI R. Spectral Regularization Algorithms for Learning Large Incomplete Matrices[J]. Journal of Machine Learning Research, 2010, 11: 2287-2322.
[14]	YAO Q M, KWOK J T. Accelerated inexact Soft-Impute for Fast Large-Scale Matrix Completion[C] // Proceedings of the International Joint Conference on Artificial Intelligence. New York: IEEE Computer Society Press: 4002-4008.
[15]	FAN J Q, LI R Z. Variable Selection via Nonconcave Penalized Likelihood and Its Oracle Properties[J]. Journal of the American Statistical Association, 2001, 96(456): 1348-1360. doi: 10.1198/016214501753382273
[16]	ZHANG T Z. Analysis of Multi-Stage Convex Relaxation for Sparse Regularization[J]. Journal of Machine Learning Research, 2010, 11(3): 1081-1107.
[17]	HU Y, ZHANG D B, YE J P, et al. Fast and Accurate Matrix Completion via Truncated Nuclear Norm Regularization[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(9): 2117-2130. doi: 10.1109/TPAMI.2012.271
[18]	ZHANG C H. Nearly Unbiased Variable Selection under Minimax Concave Penalty[J]. The Annals of Statistics, 2010, 38(2): 894-942.
[19]	PENG D T, XIU N H, YU J. S_1/2 Regularization Methods and Fixed Point Algorithms for Affine Rank Minimization Problems[J]. Computational Optimization and Applications, 2017, 67(3): 543-569. doi: 10.1007/s10589-017-9898-5
[20]	WANG Z, WANG W D, WANG J J, et al. Fast and Efficient Algorithm for Matrix Completion via Closed-Form 2/3-Thresholding Operator[J]. Neurocomputing, 2019, 330: 212-222. doi: 10.1016/j.neucom.2018.10.065
[21]	GU S H, XIE Q, MENG D Y, et al. Weighted Nuclear Norm Minimization and Its Applications to Low Level Vision[J]. International Journal of Computer Vision, 2017, 121(2): 183-208. doi: 10.1007/s11263-016-0930-5
[22]	YAO Q M, KWOK J T. Accelerated and Inexact Soft-Impute for Large-Scale Matrix and Tensor Completion[J]. IEEE Transactions on Knowledge and Data Engineering, 2019, 31(9): 1665-1679. doi: 10.1109/TKDE.2018.2867533

图( 2) 表( 5)

计量

文章访问数: 2385
HTML全文浏览数: 2385
PDF下载数: 626
施引文献: 0

全文HTML

开放科学（资源服务）标识码（OSID）：
在诸如协同过滤^[1-2]、降维处理^[3]、子空间聚类^[4]、图像和信号处理^[5-6]等机器学习或数据分析领域，人们通常需要求解如下优化问题

其中：M∈ $\mathbb{R}$^m×n为仅知道部分观察元素的待恢复矩阵，X∈ $\mathbb{R}$^m×n为目标矩阵，Ω表示已知的观察元素的位置，为正交投影算子，定义为

求解优化问题(1)的主要任务是寻找一个最小秩矩阵X^*∈ $\mathbb{R}$^m×n，使其满足且使得秩函数rank(X)最小.利用正则化方法，问题(1)可等价地转换为如下非约束最小化问题

这里‖·‖_F表示F范数，λ＞0为正则化参数.

然而，由于秩函数rank(X)具有非凸和不连续的特性，优化问题(1)和(3)是NP难的^[7]，无法在多项式时间内求得有效解.为了解决这一难题，一个广泛使用的策略是将秩函数rank(X)极小化问题松弛为核范数极小化问题.当满足一定的条件^[8]，如|Ω|≥O(N^1.2rlogN)(N= max(m，n)，r=rank(X))时，通过求解核范数极小化问题可以高概率近乎完美地恢复原始矩阵M中缺失的元素.一般来说，核范数正则化问题可以被看作为半定规划问题(semi-definite program，SDP)^[9].但是，这种策略仅对m，n≤100的矩阵有效.为了有效地求解这一问题，大量的一阶梯度算法被提出.这些方法包括：SVT (singular value thresho-lding)算法^[10]和APGL (accelerated proximal gradient with linesearch)算法^[11].SVT和APGL算法在通常情况下能够得到较为满意的解且有严格的理论保证，但是它们在每次迭代过程中需要进行费时的SVD (singular value decomposition)分解，这限制了它们在大规模矩阵上的应用.为了缓解这一缺陷，FPCA (fixed point continuation with approximate)算法^[12]被提出求解和APGL算法相同的优化问题.由于在FPCA算法中引入了快速蒙特卡罗算法来近似求解SVD，它的效率得到了极大的提升.另一个被广泛关注的算法是Soft-Impute算法^[13]，该方法利用求解过程存在“低秩+稀疏”的特性，同时结合SVT算法，达到在每次迭代中快速进行SVD分解的目的.最近，通过引入Nesterov优化理论，使得Soft-Impute算法的计算时间复杂度由 $O\left(\frac{1}{T}\right)$提升为 $O\left(\frac{1}{T^{2}}\right)$，其中T为迭代次数^[14].

核范数正则化方法作为一个强大的工具已广泛地应用于求解低秩矩阵补全问题，然而正如文献[15]所述，该方法同等对待目标矩阵中的所有奇异值，从而导致过度惩罚较大奇异值.换句话说，核范数正则化方法在大多数时得到的解严重偏离真实解.为了使得较大奇异值得到更少的惩罚，大量的非凸函数被提出用于替代秩函数rank(X)，例如Capped-l₁，LSP(log-sum penalty)，TNN(truncated nuclear norm)，SCAD(smoothly clipped absolute deviation)和MCP(minimax concave penalty).在文献[16]中，基于Capped-l₁的目标优化函数利用多步的凸松弛策略得以求解；在文献[17]中，理论和实验表明，基于TNN的低秩矩阵补全模型能更佳地逼近目标矩阵的秩函数；在文献[18]中，一个快速、连续和精确的算法被提出用于求解高维线性回归问题.另一类在低秩矩阵补全领域得到广泛关注的策略是，利用Schatten-q(0＜q≤1)拟范数来逼近目标矩阵的秩函数rank(X).然而，基于该策略得到的非凸l_q正则化优化问题较难被求解.为了解决这一问题，l_qPG(l_q-Proximal-Gradient)算法被提出用于求解该非凸l_q正则化优化问题.在l_qPG算法的每次迭代过程中包含不精确的近似求解和费时的SVD，这严重制约了算法的应用范围.基于此，文献[19]和文献[20]分别提出利用Schatten- $\frac{1}{2}$和Schatten- $\frac{2}{3}$拟范数来逼近目标矩阵的秩函数rank(X).同时，提出基于半阈值算子和 $\frac{2}{3}$阈值算子的不动点算法.对比l_qPG算法，基于Schatten- $\frac{1}{2}$和Schatten- $\frac{2}{3}$拟范数的阈值函数具有闭式解，因此得到的解更精确.所有实验结果表明，相比核范数正则化方法，这些非凸正则化方法性能更佳.

基于非凸正则化方法的优良性能，本文对基于加权核范数正则化模型进行进一步的分析和探讨，并借鉴Soft-Impute算法的思想提出一个拥有更快收敛速率和能够得到更高精度解的低秩矩阵补全算法.在本文提出WNNM-Impute(weighted nuclear norm minimization impute)算法的迭代过程中，需要进行费时的SVD分解.针对这一问题，通过引入不精确的近邻算子极大地降低WNNM-Impute算法的时间复杂度，从而使得算法收敛更快.同时，在算法中引入Nesterov加速策略，使得算法的总体迭代次数进一步减少.本文提出的算法基于Soft-Impute算法，但是实验结果表明，它比Soft-Impute算法收敛更快且得到的解的精度更高.因此，本文提出的算法适合用于求解大规模低秩矩阵补全问题.

4. 结束语

本文利用加权核范数去松弛原始低秩极小化问题，得到一个非凸非光滑的优化问题.为了高效地求解该问题，文中利用Soft-Impute的算法思想，融入不精确近邻算子和Nesterov优化理论，提出了一个快速、准确的低秩矩阵补全算法.实验结果表明，在不同规模和不同采样率的模拟数据集上WNNM-Impute算法能够得到更加精确的解且效率更高；在采样率相同和不同规模的协同过滤数据集上WNNM-Impute算法能够得到秩更低且更好质量的解.因此，本文提出的WNNM-Impute算法是一个具有较强竞争力的低秩矩阵补全算法.

参考文献 (22)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于加权核范数的低秩矩阵补全算法研究

1.
西南大学信息化建设办公室，重庆 400715

2.
重庆工程职业技术学院，现代教育技术中心，重庆 402260

3.
西南大学计算机与信息科学学院，重庆 400715

4.
西北工业大学光电与智能研究院，西安 710072

作者简介:
石莹，高级工程师，主要从事机器学习、网络优化等研究 .

通讯作者: 黄华，硕士，高级实验师;

Low-Rank Matrix Completion with Weighted Nuclear Norm Regularizer

计量

基于加权核范数的低秩矩阵补全算法研究

通讯作者: 黄华，硕士，高级实验师;

English Abstract

Low-Rank Matrix Completion with Weighted Nuclear Norm Regularizer

Corresponding author: HUANG Hua ;

全文HTML

目录

留言板

基于加权核范数的低秩矩阵补全算法研究

1. 西南大学 信息化建设办公室，重庆 400715 2. 重庆工程职业技术学院，现代教育技术中心，重庆 402260 3. 西南大学 计算机与信息科学学院，重庆 400715 4. 西北工业大学 光电与智能研究院，西安 710072

作者简介: 石莹，高级工程师，主要从事机器学习、网络优化等研究 .

通讯作者: 黄华，硕士，高级实验师;

Low-Rank Matrix Completion with Weighted Nuclear Norm Regularizer

计量

出版历程

基于加权核范数的低秩矩阵补全算法研究

通讯作者: 黄华，硕士，高级实验师;

English Abstract

Low-Rank Matrix Completion with Weighted Nuclear Norm Regularizer

Corresponding author: HUANG Hua ;

全文HTML

目录

1.
西南大学信息化建设办公室，重庆 400715

2.
重庆工程职业技术学院，现代教育技术中心，重庆 402260

3.
西南大学计算机与信息科学学院，重庆 400715

4.
西北工业大学光电与智能研究院，西安 710072

作者简介:
石莹，高级工程师，主要从事机器学习、网络优化等研究 .