aoi学院

Aisaka's Blog, School of Aoi, Aisaka University

人脸识别-人脸识别合集 | 5 DeepID3解析(港中文 2015)

DeepID3是Yi Sun, Ding Liang, Xiaogang Wang, Xiaoou Tang在2015.02发表,提出基于VGGNet和GoogLeNet的人脸表示,DeepID3: Face Recognition with Very Deep Neural Networks


主要思想

  • 本文提出了用两种非常深的神经网络架构用于人脸表示,称为DeepID3。这两种架构是从VGGNet和GoogLeNet中提出的堆叠卷积和Inception层构建的,使它们适合于人脸识别。
  • 在训练期间,将joint face identification-verification supervisory signals添加到中间和最终特征提取层。
  • 所提出的两种架构的集合在LFW上99.53%,略微提升

网络结构

  • DeepID3 net1:基于VGG的结构,
  • DeepID3 net2:基于GoogLeNet的结构,含有Inception层
  • 有更深的网络层,还有连续两个conv layer的情况,有助于形成更大感受野和更复杂的非线性特征,同时使用了Inception后参数数量也有所降低。
  • 监督信号作用在最后层和中间层。

测试结果

DeepID3仍采用原来DeepID2+中使用的训练样本,在分别25个patches(带水平翻转)产生的网络上作性能对比,DeepID3 net1优势最为明显,而DeepID3 net2提升不大显著。平均而言net1和net2降低了误码率分别为0.81%和0.26%

为了减少冗余,使用DeepID3 net1和net2来提取原始或水平翻转上的特征,但不是两者都有。在测试中,特征提取需要50次的正向传播,其中一半来自DeepID3 net1,另一半来自DeepID3 net2。这些特征被连接成一个大约长30000维的特征向量。利用PCA将人脸识别问题简化为300维,并在此基础上学习联合贝叶斯模型进行人脸识别。

DeepID3在LFW上人脸验证的准确率为99.53%,性能上并没有比DeepID2+的99.47%提升多少。因此,作者对于具有更深的架构网络是否具有更强的优势没有下定论,这可以作为之后的研究方向。作者最后提出一个方向,在这样深的架构上采用更多的数据集,或许这可以提升性能。

而且LFW数据集里面有三对人脸被错误地标记了,在更正这些错误的label后,两者准确率均为99.52%。


参考资料

https://zhuanlan.zhihu.com/p/76535973
https://blog.csdn.net/yiyouxian/article/details/52145727