基于最大相关最小冗余的动作识别算法

龚静; 李英杰; 黄欣阳

doi:10.13718/j.cnki.xdzk.2018.06.023

基于最大相关最小冗余的动作识别算法

1.
湖南环境生物职业技术学院公共基础课部，湖南衡阳 421005

2.
南华大学计算机学院，湖南衡阳 421001

基金项目: 国家自然科学基金项目(61300234)；湖南省教育厅项目(12C1056，17C0566)

详细信息

作者简介:
龚静(1972-)，女，硕士，教授，主要从事图像信息处理、数据挖掘、模式识别方面的研究 .

通讯作者: 李英杰;

中图分类号: TP399

An Action Recognition Algorithm Based on Maximum Correlation-Minimum Redundancy

1.
Department of Public Basic Course, Hunan Environment Biological Polytechnic, Hengyang, Hunan 421005, China

2.
College of Computer Science and Technology, University of South China, Hengyang, Hunan 421001, China

摘要: 为了提高动作的识别精度与鲁棒性，降低冗余特征，提高算法效率，设计了一种基于最大相关-最小冗余(Max-Correlation and Min-Redundancy，MCMR)的动作识别算法.首先，为了消除噪声影响，减少计算成本，利用符号聚集近似(SAX)技术将连续图像序列转换为离散符号；其次，为避免出现时间漂移问题，利用动态时间归整(Dynamic Time Warping，DTW)来计算符号特征的距离，提取符号序列的特征；然后，为了消除冗余的特征，定义了一个特征权重，根据权重对特征进行降序排列，引入最大相关-最小冗余技术消除相关性弱的特征，筛选出具有高相关性和低冗余的特征；最后，为了完成动作识别，根据筛选出的特征，利用k-近邻(K-Nearest Neighbor，KNN)进行分类器学习.结果表明：与当前动作识别算法相比，本文算法能够有效完成动作的识别与理解，具有较高的识别率，有效地降低了冗余特征，提高了算法的效率和鲁棒性.
- 动作识别 /
- 最大相关-最小冗余 /
- 符号表示 /
- 动态时间归整 /
- k-近邻
Abstract: In order to improve the accuracy and robustness of motion recognition, reduce redundant features and increase algorithm efficiency, an action recognition scheme based on MCMR (maximum correlation-minimum redundancy) is designed. Firstly, in order to eliminate the influence of noise and reduce computational cost, the continuous image sequence is transformed into discrete symbol representation by using the symbolic aggregation approximation technology. Next, to avoid the problem of time drift, dynamic time warping (DTW) is used to calculate symbol distance and to extract the character of a symbolic sequence. Then, in order to eliminate redundant features, a feature weight is defined, the features are arranged in a descending order based on weight, the maximum correlation-minimum redundancy is introduced to eliminate the weak correlation feature, and features with high correlation and low redundancy are selected. Finally, in order to perform action recognition, classifier learning is performed, using k-nearest neighbor based on the selected features. Test results show that compared with the current image action recognition, this algorithm can effectively accomplish action recognition and understanding. It has a high recognition rate, the redundant features are greatly reduced, and the efficiency and robustness of the algorithm are improved.
- action recognition /
- maximum correlation-minimum redundancy /
- symbolic representation /
- dynamic time warping /
- k-nearest neighbor .

图 1 规整路径计算过程

下载: 全尺寸图片幻灯片

图 2 本文算法流程图

下载: 全尺寸图片幻灯片

图 3 符号表示示意图

下载: 全尺寸图片幻灯片

图 4 DTW提取示意图

下载: 全尺寸图片幻灯片

图 5 KNN分类过程

下载: 全尺寸图片幻灯片

图 6 Kinect运动集

下载: 全尺寸图片幻灯片

图 7 不同目标维数下的性能比较

下载: 全尺寸图片幻灯片

图 8 不同算法的识别正确率测试

下载: 全尺寸图片幻灯片

表 1 实验数据集与方法

数据集	动作介绍	动作数量	实验方法
Kinect	走路/坐下/站起来/拿起/搬运/投掷/推/拉/挥舞/拍手	10个对象，200个动作	10倍交叉法

IXMAS	Check watch/cross arms/get up/kick/pick up/punch/scratch head/sit down/turn around/walk/wave	11个对象，396个动作	50%训练/50%测试

下载: 导出CSV

表 2 Kinect数据集混淆矩阵

	走	坐下	站起来	拿起	搬运	投掷	推	拉	挥舞	拍手
走	0.85		0.03		0.10	0.02
坐下		0.95	0.05
站起来			1.00
拿起		0.05		0.90				0.05
搬运		0.01	0.08		0.90	0.01
投掷						1.00
推				0.02		0.08	0.85		0.05
拉		0.02		0.03				0.95
挥舞									1.00
拍手							0.03		0.02	0.95

下载: 导出CSV

表 3 IXMAS数据集混淆矩阵

	Check watch	cross arms	get up	kick	pick up	punch	scratch head	sit down	turn around	walk	wave
Check watch	0.90	0.05									0.05
cross arms		0.95	0.05
get up			0.90		0.05			0.05
kick				1.00
pick up			0.08		0.80	0.05		0.07
punch						0.95					0.05
scratch head							1.00
sit down			0.06	0.02	0.07			0.85
turn around						0.05			0.95
walk										1.00
wave		0.05				0.05					0.90

下载: 导出CSV

表 4 算法效率评估

算法名称	运行时间/s
算法名称	Kinect	IXMAS
文献[4]	183.95	301.66
文献[5]	54.87	98.20
文献[6]	33.58	73.21
本文算法	31.25	51.64

下载: 导出CSV

[1]	陈文强, 肖国强, 林霄, 等.一种基于属性贝叶斯网络的行为识别模型[J].西南师范大学学报(自然科学版), 2014, 39(3): 7-11. doi: http://www.cnki.com.cn/Article/CJFDTOTAL-XNZK201403002.htm
[2]	DERPANIS K G, SIZINTSEV M, CANNONS K J, et al. Action Spotting and Recognition Based on a Spatiotemporal Orientation Analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(3): 527-540. doi: 10.1109/TPAMI.2012.141
[3]	田国会, 尹建芹, 韩旭, 等.一种基于关节点信息的人体行为识别新方法[J].机器人, 2014, 36(3): 285-292. doi: http://www.cnki.com.cn/Article/CJFDTOTAL-JQRR201403005.htm
[4]	杨顺卿, 陈昌红.基于双语动态系统包的视角无关的人体行为识别[J].南京邮电大学学报(自然科学版), 2014, 34(1): 103-110. doi: http://mall.cnki.net/magazine/Article/RJXB200807008.htm
[5]	王鑫, 沃波海, 管秋, 等.基于流形学习的人体动作识别[J].中国图象图形学报, 2014, 19(6): 914-923. doi: http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zgtxtxxb-a201406012
[6]	DAVIS J W, BOBICK A F. The Representation and Recognition of Human Movement Using Temporal Templates[C]// Computer Vision and Pattern Recognition, 1997. Proceedings., 1997 IEEE Computer Society Conference on. San Juan, Puerto Rico, USA: IEEE, 1997: 928-934.
[7]	傅颖, 郭晶云.基于动态时间规整的人体动作识别方法[J].电子测量技术, 2014, 37(3): 69-72. doi: http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=dzcljs201403018
[8]	宋伟, 张帆, 叶阳东, 等.面向时间序列分类任务的SAX方法特性及可视化探索[J].计算机辅助设计与图形学学报, 2016, 28(11): 1906-1915. doi: 10.3969/j.issn.1003-9775.2016.11.012
[9]	doi: http://cn.bing.com/academic/profile?id=8b39ecad440a3e36b3aa1ff3e45b3374&encoded=0&v=paper_preview&mkt=zh-cn WEI Y, JIAO L B, WANG S L, et al. Sports Motion Recognition Using MCMR Features Based on Interclass Symbolic Distance[J]. International Journal of Distributed Sensor Networks, 2016, 12(5): 1-15.
[10]	LU S, MIRCHEVSKA G, PHATAK S S, et al. Dynamic Time Warping Assessment of High-Resolution Melt Curves Provides a Robust Metric for Fungal Identification[J]. PLoS ONE, 2017, 12(3): e0173320. doi: 10.1371/journal.pone.0173320
[11]	姚明海, 王娜, 齐妙, 等.改进的最大相关最小冗余特征选择方法研究[J].计算机工程与应用, 2014, 50(9): 116-122. doi: http://www.cqvip.com/QK/91690X/201409/49662573.html
[12]	doi: http://cn.bing.com/academic/profile?id=2cb8e895b084a56caeb4964ad3d4f326&encoded=0&v=paper_preview&mkt=zh-cn ROBNIK-SIKONJA M, KONONENKO I. Theoretical and Empirical Analysis of ReliefF and RReliefF[J]. Machine Learning, 2013, 53(1): 23-69.
[13]	李扬, 顾雪平.基于改进最大相关最小冗余判据的暂态稳定评估特征选择[J].中国电机工程学报, 2013, 33(34): 179-186. doi: http://www.cnki.com.cn/Article/CJFDTotal-ZGDC201334025.htm
[14]	doi: http://cn.bing.com/academic/profile?id=7d39ad5fb5b66422741ebd0fd7f708fd&encoded=0&v=paper_preview&mkt=zh-cn JOHNSON M, BRIGG M, GRAHAM M. Pearson and Responsibility: (Mis-) Understanding the Capabilities Approach[J]. Australian Journal of Politics & History, 2016, 62(2): 251-267.
[15]	朱郭峰, 杨彦, 周竹荣, 等.基于领域的微博用户影响力计算方法[J].西南大学学报(自然科学版), 2014, 36(3): 145-151. doi: http://xbgjxt.swu.edu.cn/jsuns/jsuns/ch/reader/view_abstract.aspx?file_no=2014-03-145&flag=1
[16]	XIA L, CHEN C C, AGGARWAL J K. View Invariant Human Action Recognition Using Histograms of 3D Joints[C]//Computer Vision and Pattern Recognition Workshops (CVPRW), 2012 IEEE Computer Society Conference on. Providence, RI, USA: IEEE, 2012: 20-27.
[17]	姚湘, 徐平平, 王华君.基于非线性知识迁移的交叉视角动作识别[J].重庆邮电大学学报(自然科学版), 2017, 29(1): 121-128. doi: 10.3979/j.issn.1673-825X.2017.01.018

图( 8) 表( 4)

计量

文章访问数: 670
HTML全文浏览数: 243
PDF下载数: 142
施引文献: 0

全文HTML

动作识别是计算机视觉领域研究的热点问题，在人机交互、监控、体感游戏、智能家居等方面具有重要的实用价值^[1].现如今，视频已成为人们生活中不可缺少的一种信息载体，随着视频呈现爆炸式地增加，如何迅速、准确地提取视频中人们所关注的内容，理解与识别图像序列中人体的动作意义重大^[2-3].近年来，通过不断研究，产生了一些关于动作识别的算法.如杨顺卿等^[4]提出了一种基于双语动态系统的行为识别方法，结合兴趣点检测与密集采样获取序列中的时空信息同时构建线性动态系统(LDS)，然后对LDS进行编码；并利用LDS在码本中的分布与权重，通过动态系统袋(bag of dynamical systems，BODS)表征动作特征；接着通过K-SVD对得到的BODS特征操作，形成迁移字典对；最后通过OMP将字典在2个视角下进行动作的稀疏表示.该算法能够连续完整地表达图像序列，但是通过密集采样法会带来较多的冗余特征，导致计算效率低下.王鑫等^[5]提出了一种利用流形学习的动作识别技术，该算法通过Kinect的深度内容获取活动位置，并利用相对活动位移差来得到运动特征；同时，借助Lalpacian映射流形对多维信号降维，得到了低维运动信息，在匹配过程中，通过改进的Hausdorff对低维空间样本和训练数据的进行相似测量，实验显示该算法识别效果良好.但是，此技术对视频中的视觉变化、相互遮挡等较为敏感. Davis等^[6]提出了一种基于运动能量图的动作识别方案，首先，通过马氏距离获取模板间的距离，然后，根据观测与训练间的距离，引入了k-近邻完成对动作学习.该方法计算简单，但在选择时间间隔时不好确定.当间隔小，样本与训练的差别较小时，动作识别精度良好；相反，识别率不高，一般适用于简单动作识别.

为了降低动作识别中的特征冗余，提高识别精度和计算效率，本文提出了一种基于最大相关-最小冗余(MCMR)的动作识别方案.首先，在距离估计之前，使用SAX将时间序列转换为较短的符号序列，消除噪声影响的同时加快计算，并利用一个符号表示快速DTW测量.由于不同传感器种类与不同维度数据上动作的识别具有差异性，本文采用MCMR策略来选择合适的候选特征；然后，根据选择的特征，利用k-近邻分类学习；最后，对所提动作识别技术进行测试.

4. 结论

为了提高动作的识别精度与鲁棒性，降低冗余特征，提高算法效率，本文提出了一种基于最大相关-最小冗余的动作识别算法.为了消除噪声影响并提高算法的效率，在距离估计之前，通过使用SAX技术将原来的时间序列转换为较短的符号序列；采用DTW准确提取图像时间序列中的特征，避免了时间漂移；针对动作特征的相似性和差异性，采用了MCMR策略来选择合适的候选特征，MCMR根据特征权重对特征进行降序排列，消除弱相关性特征，选择高相关与低冗余特征；再根据选择的特征，利用k-近邻分类学习.实验证明了本文算法具有优异的识别率，降低了冗余特征，并有效地改善了算法的识别效率.本文的不足之处在于只在2个数据集上进行了实验，未来将着眼于处理更多的数据集，还将研究基于深度神经网络的人体动作识别.

参考文献 (17)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于最大相关最小冗余的动作识别算法

1.
湖南环境生物职业技术学院公共基础课部，湖南衡阳 421005

2.
南华大学计算机学院，湖南衡阳 421001

作者简介:
龚静(1972-)，女，硕士，教授，主要从事图像信息处理、数据挖掘、模式识别方面的研究 .

通讯作者: 李英杰;

An Action Recognition Algorithm Based on Maximum Correlation-Minimum Redundancy

1.
Department of Public Basic Course, Hunan Environment Biological Polytechnic, Hengyang, Hunan 421005, China

2.
College of Computer Science and Technology, University of South China, Hengyang, Hunan 421001, China

计量

基于最大相关最小冗余的动作识别算法

通讯作者: 李英杰;

作者简介: 龚静(1972-)，女，硕士，教授，主要从事图像信息处理、数据挖掘、模式识别方面的研究
1. 湖南环境生物职业技术学院公共基础课部，湖南衡阳 421005

2. 南华大学计算机学院，湖南衡阳 421001

English Abstract

An Action Recognition Algorithm Based on Maximum Correlation-Minimum Redundancy

Corresponding author: Ying-jie LI ;

全文HTML

2.1. 符号表示

2.2. 基于DTW的特征提取

2.3. 基于最大相关最小冗余筛选的特征选择

2.4. 分类器学习

3.1. 数据集

3.2. 实验结果

目录

留言板

基于最大相关最小冗余的动作识别算法

1. 湖南环境生物职业技术学院 公共基础课部，湖南 衡阳 421005 2. 南华大学 计算机学院，湖南 衡阳 421001

作者简介: 龚静(1972-)，女，硕士，教授，主要从事图像信息处理、数据挖掘、模式识别方面的研究 .

通讯作者: 李英杰;

An Action Recognition Algorithm Based on Maximum Correlation-Minimum Redundancy

1. Department of Public Basic Course, Hunan Environment Biological Polytechnic, Hengyang, Hunan 421005, China 2. College of Computer Science and Technology, University of South China, Hengyang, Hunan 421001, China

计量

出版历程

基于最大相关最小冗余的动作识别算法

通讯作者: 李英杰;

作者简介: 龚静(1972-)，女，硕士，教授，主要从事图像信息处理、数据挖掘、模式识别方面的研究 1. 湖南环境生物职业技术学院 公共基础课部，湖南 衡阳 421005 2. 南华大学 计算机学院，湖南 衡阳 421001

English Abstract

An Action Recognition Algorithm Based on Maximum Correlation-Minimum Redundancy

Corresponding author: Ying-jie LI ;

全文HTML

2.1. 符号表示

2.2. 基于DTW的特征提取

2.3. 基于最大相关最小冗余筛选的特征选择

2.4. 分类器学习

3.1. 数据集

3.2. 实验结果

目录

1.
湖南环境生物职业技术学院公共基础课部，湖南衡阳 421005

2.
南华大学计算机学院，湖南衡阳 421001

作者简介:
龚静(1972-)，女，硕士，教授，主要从事图像信息处理、数据挖掘、模式识别方面的研究 .

1.
Department of Public Basic Course, Hunan Environment Biological Polytechnic, Hengyang, Hunan 421005, China

2.
College of Computer Science and Technology, University of South China, Hengyang, Hunan 421001, China

作者简介: 龚静(1972-)，女，硕士，教授，主要从事图像信息处理、数据挖掘、模式识别方面的研究
1. 湖南环境生物职业技术学院公共基础课部，湖南衡阳 421005

2. 南华大学计算机学院，湖南衡阳 421001