由此判断测试集类别。
3 基于模糊聚类LLE和SVM的人脸识别的基本步骤
本文算法的具体步骤如下:
(1)图像预处理;
(2)读入样本训练集;
(3)利用改进的LLE算法对图像进行降维,提取样本集的特征;
(4)利用SVM对训练集样本进行学习,识别测试集样本。
4 人脸特征提取
4.1 实验准备
实验中用到的人脸图像从ORL人脸数据库中选取。该数据共有40个人,每个人有10幅图像,分别具有不同的表情,共有400张图像。实验选取每个人的前5张图像作为训练集,共有200张图像,共分为40类。剩余的图像作为实验的测试集。部分人脸图像如图1所示。
4.2人脸特征提取
为了能够清楚地对比人脸特征提取方法,从ORL人脸数据库中选取5个人的图像,分为5类,每个人10张图像。每一个点代表一幅人脸图像,降至2维。图2为LLE算法和改进算法CLLE在领域数K=15时的降维效果图。
从图2可以看出,CLLE算法将人脸数据降至2维后,不同的人已经可以被明显地区分开来,而LLE算法效果则不明显。
当K=11时, LLE算法和CLLE算法的降维效果对比如图3所示。可以看出,CLLE算法已经可以对人脸数据进行很好的分类,效果十分明显,而LLE算法取得的效果则稍稍比K=15时略好一点。
从实验结果可以看出,LLE算法易受邻域数K的影响,而对于K的不同取值,CLLE算法却可以普遍取得好的效果。
5 人脸识别
5.1 算法参数的选取
5.1.1 核函数的选取
核函数的选取决定了学习分类的好坏。常用核函数主要有线性核函数、多项式核函数、径向基核函数以及Sigmoid核函数。使用这4种核函数对人脸数据进行分类识别,结果如表1所示。易知对于实验的人脸数据,在线性核函数下分类的准确率最高。
5.1.2 邻域个数的选取
在选取聚类个数C时,若选取太大,会影响实验的运行时间,因此实验选取C=6,并利用CLLE算法将人脸数据降至60维,进行训练测试。不同邻域数的分类准确率如表2所示。由表2可知,当聚类个数为6、邻域个数为5时分类识别率略高一些。
5.2 不同分类方法对识别率的影响
表3表明,CLLE-SVM算法在人脸识别中优于其他三种算法,人脸识别率可达到89.5%。
6 结论
本文利用基于模糊聚类的LLE算法对人脸数据进行降维,在低维空间中利用SVM训练学习已知样本,从而识别人脸类别。实验表明,该方法得到的人脸识别率相对于已有方法有了显著的提高,从而证实了其有效性和可行性。
参考文献
[1] Wang Jing, Su Guangda, Xiong Ying, et al. Sparse representation for face recognition based on constraint sampling and face alignment[J]. 清华大学学报(自然科学英文版), 2013 (1):62-67.
[2] BRUNELLI R, POGGIC T. Face recognition: features ve- rsus templates[J]. IEEE Transactions on PAMI, 1993,10 (15),1042-1052.
[3] CHELLAPPA R, WISLSON C L, SIROHEY S. Human and machine recognition of faces: a survey[C]. Proceedings of the IEEE, 1995,83(5), 705-741.
[4] VAPNIK V N.统计学习理论的本质[M].张学工,译.北京:清华大学出版社,2000.
[5] 李芳.支持向量机在TE过程故障诊断中的应用[J].安徽工业大学学报(自然科学版),2010,27(2):195-199.
[6] 丁娇,梁栋,阎庆.基于WLLE和SVM的植物叶片图像识别方法[J].安徽大学学报(自然科学版),2013,37(4):61-67.
[7] CHANG K P, TEA J K. Objective rating of seam pucker using neural networks[J]. Textile Research Journal, 1997,67(7):494-502.
[8] ROWEIS S T, SAUL L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290(5500):2323-2326.
[9] SAUL L K, ROWEIS S T. Think globally, fit locally: unsupervised learning of low dimensional manifolds [J]. Journal of Machine Learning Research, 2003,4(12):119-155.
[10] 吴晓婷,闫德勤.改进的非线性数据降维方法及其应用[J].计算机工程与应用,2011,47(2):156-159.
[11] 李新社,姚俊平.模糊聚类分析及其应用研究[J].网络安全技术与应用,2014(1):69-70.
[12] 王和勇,郑杰,姚正安,等.基于聚类和改进距离的LLE方法在数据降维中的应用[J].计算机研究与发展,2006,43(8):1485-1490.
[13] THEODORIDIS S, KOUTROUMBAS K.模式识别(第3版)[M].李晶娇,王爱侠,张广源,译.北京:电子工业出版社,2006.
[14] 王元珍,王健李,李晨阳.一种改进模糊聚类算法[J].华中科技大学学报,2005,33(2):92-94.
[15] BEZDEK J C. Pattern recognition with fuzzy objective function algorithms [M].New York: Plenum Press, 1981.