<
>

人脸识别技术发展及实用方案设计

2018-01-20 08:00:44 来源:易采站长网友投稿 作者:admin

  本文试图梳理人脸辨认手艺开展,并按照做者正在相干范畴的理论给出一些真用计划设想,等待能对感爱好的读者有所裨益。

  

 

  人脸辨认手艺不单吸收了Google、Facebook、阿里、腾讯、百度等海内中互联网巨子的年夜量研收投进,也催死了Face++、商汤科技、Linkface、中科云从、依图等一年夜波明星创业公司,正在视频监控、刑事侦破、互联网金融身份核验、自助通干系统等标的目的缔造了诸多胜利使用案例。本文试图梳理人脸辨认手艺开展,并按照做者正在相干范畴的理论给出一些真用计划设想,等待能对感爱好的读者有所裨益。

  1、概述

  浅显天讲,任何一个的机械进修成绩皆能够等价于一个寻觅适宜变更函数的成绩。

  比方语音辨认,便是正在供与适宜的变更函数,将输进的一维时序语音疑号变更到语义空间;而远去激发齐平易近存眷的围棋野生智能AlphaGo则是将输进的两维规划图象变更到决议计划空间以决议下一步的最劣走法;响应的,人脸辨认也是正在供与适宜的变更函数,将输进的两维人脸图象变更到特性空间,从而独一肯定对应人的身份。

  不断以去,人们皆以为围棋的易度要弘远于人脸辨认,因而,当AlphaGo以尽对劣势随便挨败天下冠军李世乭九段战柯净九段时,人们更惊讶于野生智能的壮大。

  实践上,那一结论只是人们的基于“知识”的曲解,果为从年夜大都人的亲身体验去讲,即便颠末严厉锻炼,挨败围棋天下冠军的概率也是微不足道;相反,尽年夜大都一般人,即使已颠末严厉锻炼,也能沉紧完成人脸辨认的使命。

  但是,我们无妨认真阐发一下那二者之间的易易水平:正在计较机的“眼里”,围棋的棋盘不外是个19×19的矩阵,矩阵的每个元素能够的与值皆去自于一个三元组{0,1,2},别离代表无子,黑子及乌子,因而输进背量能够的与值数为3361;而关于人脸辨认去讲,以一幅512×512的输进图象为例,它正在计较机的“眼中”是一个512x512x3维的矩阵,矩阵的每个元素能够的与值范畴为0~255,因而输进背量能够的与值数为256786432。固然,围棋AI战人脸辨认皆是觅供适宜的变更函数f,但后者输进空间的庞大度隐然近弘远于前者。

  关于一个幻想的变更函数f而行,为了到达最劣的分类结果,正在变更后的特性空间上,我们期望同类样本的类内好尽量小,同时差别类样本的类间好尽量年夜。

  可是,幻想是饱满的,理想倒是骨感的。因为光照、心情、遮挡、姿势等诸多果素(如图1)的影响,常常招致差别人之间的差异比不异人之间差异更小,如图2。人脸辨认算法开展的汗青便是取那些辨认影响果子奋斗的汗青。

  

 

  图1 人脸辨认的影响果素

  

 

  图2 姿势招致差别人类似度比同人更下

  2、人脸辨认手艺开展

  早正在20世纪50年月,认知科教家便已动手对人脸辨认睁开研讨。20世纪60年月,人脸辨认工程化使用研讨正式开启。其时的办法次要操纵了人脸的多少构造,经由过程阐发人脸器民特性面及其之间的拓扑干系停止辨识。那种办法简朴曲不雅,可是一旦人脸姿势、心情发作变革,则粗度严峻降落。

  1991年,出名的“特性脸”办法[1]第一次将主身分阐发战统计特性手艺引进人脸辨认,正在真用结果上获得了少足的前进。那一思绪也正在后绝研讨中获得进一步收扬光年夜,比方,Belhumer胜利将Fisher鉴别原则使用于人脸分类,提出了基于线性鉴别阐发的Fisherface办法[2]。

  21世纪的前十年,跟着机械进修实际的开展,教者们接踵探究出了基于遗传算法、撑持背量机(Support Vector Machine, SVM)、boosting、流形进修和核办法等停止人脸辨认。 2009年至2012年,稠密表达(Sparse Representation)[3]果为其漂亮的实际战对遮挡果素的鲁棒性成为其时的研讨热门。

  取此同时,业界也根本告竣共鸣:基于野生粗心设想的部分形貌子停止特性提与战子空间办法停止特性挑选可以获得最好的辨认结果。Gabor[4]及LBP[5]特性形貌子是迄古为行正在人脸辨认范畴最为胜利的两种野生设想部分形貌子。那时期,对各类人脸辨认影响果子的针对性处置也是那一阶段的研讨热门,好比人脸光照回一化、人脸姿势校订、人脸超分辩和遮挡处置等。也是正在那一阶段,研讨者的存眷面开端从受限场景下的人脸辨认转移到非受限情况下的人脸辨认。LFW人脸辨认公然比赛正在此布景下开端盛行,其时最好的辨认体系虽然正在受限的FRGC测试散上能获得99%以上的辨认粗度,可是正在LFW上的最下粗度仅仅正在80%阁下,间隔真用看起去间隔颇近。

  2013年,MSRA的研讨者尾度测验考试了10万范围的年夜锻炼数据,并基于下维LBP特性战Joint Bayesian办法[6]正在LFW上得到了95.17%的粗度。那一成果表白:年夜锻炼数据散关于有用提拔非受限情况下的人脸辨认很主要。但是,以上一切那些典范办法,皆易以处置年夜范围数据散的锻炼场景。

  2014年前后,跟着年夜数据战深度进修的开展,神经收集重受注目,并正在图象分类、脚写体辨认、语音辨认等使用中得到了近超典范办法的成果。

  喷鼻港中文年夜教的Sun Yi等人提出将卷积神经收集使用到人脸辨认上[7],接纳20万锻炼数据,正在LFW上第一次获得超越人类程度的辨认粗度,那是人脸辨认开展汗青上的一座里程碑。

  自此以后,研讨者们不竭改良收集构造,同时扩展锻炼样本范围,将LFW上的辨认粗度推到99.5%以上。如表1所示,我们给出了人脸辨认开展历程中一些典范的办法及其正在LFW上的粗度,一个根本的趋向是:锻炼数据范围愈来愈年夜,辨认粗度愈来愈下。假如读者浏览有爱好理解人脸辨认更细节的开展汗青,能够参考文献。

  

 

  表2 较为一般的人脸辨认锻炼散

  

 

  表3 本文用到的测试散

  

 

  表4 一种快速牢靠的锻炼数据浑洗办法

  图4给出了一套止之有用的人脸辨认手艺计划,次要包罗多patch分别、CNN特性抽与、多使命进修/多loss交融,和特性交融模块。

  

 

  图4 人脸辨认手艺计划

  1、多patch分别次要是操纵人脸差别patch之间的互补疑息加强辨认机能。特别是多个patch之间的交融能有用提拔遮挡状况下的辨认机能。当前,正在LFW评测中超越99.50%的成果年夜大都是由多个patch交融获得。

  2、颠末考证较优良的人脸特性抽与卷积神经收集包罗:Deep-ID系列、VGG-Net、ResNet、Google Inception构造。读者能够按照本人对粗度及服从的需供挑选适宜的收集。本文以19层resnet举例。

  3、多使命进修次要是操纵其他相干疑息提拔人脸辨认机能。本文以性别战种族辨认为例,那两种属性皆是战详细人的身份强相干的,而其他的属性如心情、年齿皆出有那个特性。我们正在resnet的中心层引出分收停止种族战性此外多使命进修,那样CNN收集的前几层相称于具有了种族、性别辨别力的下层语义疑息,正在CNN收集的后几层我们进一步进修了身份的细化辨别疑息。同时,锻炼集合样本的性别战种族属性能够经由过程一个baseline分类器停止大都投票获得。

  4、多loss交融次要是操纵差别loss之间的互补特征进修出恰当的人脸特性背量,使得类内好尽量小,类间好尽量年夜。当前人脸辨认范畴较为经常使用的集合loss包罗:pair-wise loss、triplet loss、softmax loss、center loss等。此中triplet loss间接界说了删年夜类内类间好gap的劣化目的,可是正在详细工程理论中,其trick较多,没有简单掌握。而近来提出的center loss,分离softmax loss,能较好天襟怀特性空间中的类内、类间好,锻炼设置也较为便利,因而利用较为普遍。

  5、经由过程多个patch锻炼获得的模子将发生多个特性背量,怎样交融多特性背量停止终极的身份辨认也是一个主要的手艺成绩。较为经常使用的计划包罗:特性背量拼接、分数级减权交融和决议计划级交融(如投票)等。

  

 

  表5 数据浑洗前后辨认模子机能比照

  表5给出了锻炼数据浑洗前后正在测试散上的机能比照成果。据此能够获得以下结论:

  数据的浑洗不单能放慢模子锻炼,也能有用提拔辨认粗度;

  正在西圆报酬主的锻炼散MSCeleb1M上锻炼获得的模子,正在一样以西圆报酬主的测试散LFW上到达了完善的泛化机能;可是正在以东圆报酬主的营业测试散的泛化机能则有较年夜的下滑;

  正在以东圆报酬主的营业锻炼散锻炼获得的模子,正在东圆报酬主的营业测试散上机能十分好,可是正在西圆报酬主的测试散LFW上相对MSCeleb1M有必然差异;

  将营业锻炼散战MSCeleb1M停止兼并,锻炼获得的模子正在LFW战营业数据上皆有远乎完善的机能。此中,基于三个patch交融的模子正在LFW上获得了99.58%的辨认粗度。

  由此,我们能够晓得,为了到达尽量下的真用辨认机能,我们该当尽量接纳取利用情况不异的锻炼数据停止锻炼。一样的结论也呈现正在论文[12]中。

  实践上,一个完好的人脸辨认真用体系除包罗上述辨认算法之外,借该当包罗人脸检测,人脸枢纽面定位,人脸对齐等模块,正在某些宁静级别请求较下的使用中,为了避免照片、视频回放、3D挨印模子等对辨认体系的冒充进犯,借需求引进活体检测模块;为了正在视频输进中获得最劣的辨认结果,借需求引进图象量量评价模块挑选最适宜的视频帧停止辨认,以尽量解除没有平均光照、年夜姿势、低分辩战活动恍惚等果素对辨认的影响。别的,也有很多研讨者战公司试图经由过程自动的方法躲避那些果素的影响:引进白中/3D摄像头。典范的真用人脸辨认计划如图5所示。

  

 

  图5 真用人脸辨认计划流程图

  4、总结

  本文简朴总结了人脸辨认手艺的开展汗青,并给出了真用计划设想的参考。固然人脸辨认手艺正在LFW公然比赛中获得了99%以上的粗度,可是正在视频监控等真用处景下的1:N辨认间隔实正真用借有一段路要走,特别是正在N很年夜的状况下。将来,我们借需求正在锻炼数据扩大、新模子设想及襟怀进修等圆里投进更多的精神,让年夜范围人脸辨认早日走进真用。

  参考文献

  [1]Turkand M A, Pengland A P. Eigenfaces for recognition [J]. Journal of Cognitve Neuroscience, 1991, 3(1): 71-86.

  [2]Belhumeur P, Hespanha J, Kriegman D. Eigenfaces vs. fisherfaces: Recognition using class specific linear projection [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7): 711-720.

  [3]Liu C, Wechsler. Gabor feature based classification using enhanced fisher linear model for face recognition [J]. IEEE Transactions on Image Processing, 2002, 11(4): 467-476.

  [4]Ahonen T, Hadid A, Pietikäinen M. Face description with local binary patterns: Application to face recognition [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(12): 2037-2041.

  [5]Wright J, Yang A, Ganesh A, Sastry S, Ma Y. Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227.

  [6]Chen D, Cao X, Wen F, Sun J. Blessing of dimensionality: high-dimensional feature and its efficient compression for face verification [C]. IEEE International Conference on Computer Vision and Pattern Recognition, 2013.

  [7]Sun Y, Wang X, Tang X. Deep learning face representation by joint identification-Verification [C].

  [8]Zhao W, Chellappa R, Rosenfeld A, Phillips P J. Face recognition: A literature survey [J]. ACM Computing Surveys, 2003, 35(4): 399-458.

  [9]Li S Z, Jain A K. Handbook of face recognition (2nd Edition) [M]. Springer-Verlag, 2011.

  [10]Wang B, Li W, Yang W, Liao Q. Illumination normalization based on Weber’s law with application to face recognition [J]. IEEE Signal Processing Letters, 2011, 18(8): 462-465.

  [11]Wang Biao, Feng X, Gong L, Feng H, Hwang W, Han J. Robust Pose normalization for face recognition under varying views [C]. ICIP, 2015,

  [12]Kan M. Domain Adaptation for face recognition: Targetize source domain briged by common subspace, IJCV, 2014.

  做者:_两只橙_

  滥觞:https://www.jianshu.com/p/68e768131b65

  本文由 @_两只橙_ 受权公布,已经做者答应,制止转载。

  题图去自unsplash,基于CC0和谈

暂时禁止评论

微信扫一扫

易采站长站微信账号