aoi学院

Aisaka's Blog, School of Aoi, Aisaka University

人脸识别-人脸识别系列(八):VGGFace

论文链接与数据集下载:VGGFace—-Deep Face Recognition

本文主要内容有二:

  1. 从零开始构建一个人脸识别数据库,一共 2.6M images, over 2.6K people,构建过 程主要是程序实现的,少量人工参与。
  2. 通过对比各种CNN网络,提出了一个简单有效的CNN网络,在各种公开的人脸识别数据库上得到很好的效果。

VGGFace DateSet

构建过程主要分为5个阶段:

  1. 阶段在IMDB网站上获得名人名字的名单列表,这个和CASIA-Webface有点像
  2. 阶段是通过谷歌来扩大每个人的图片量
  3. 阶段使用一个Fisher Vector Faces descriptor 与SVM清除一些错误的图片
  4. 阶段清除一些一样的照片,因为从不同网站上爬下来的照片,难免会有所重复。
  5. 阶段再人工清除一些照片

各阶段的统计数据如下:

比较花时间的是2阶段和5阶段,其余都很快。

这是与其他数据集的比较:


网络结构

基于VGG自己的数据集,构建了如下的CNN,用来进行人脸识别

看图片的描述,作者说这是VGGNet中的A结构,但是参考VGGNet论文中的结构表(如下),博主认为却是D结构,不知道是不是作者写错了,但是影响不大。

使用Softmax在VggDataSet上预训练。

在进行验证时,在最后一层输出的2622维的特征(即对应每一类的概率)还会被用来以Tripletloss做一个度量学习

度量学习是一个全连层,使用目标数据集(LFW)的训练集部分训练。

通过训练好的度量学习层,获得人脸的1024维特征表达,然后直接以欧式距离来作为人脸是否为同一个脸的判定依据。

这一做法和百度的论文其实是十分相似的,其实两篇论文发表的时间也相近,都是15年。


实验

此表的训练数据Data有d和f两种,分别对应的是构建数据集时3阶段的数据(清理前)和5阶段的数据(清理后)

通过这里可以发现,使用更大但是有更多错误的数据集对网络能力有提高作用,原因一是因为数据量更大,二是因为小的数据集可能被清除了一些hard positive的数据,使得网络无法从这些数据里受益。


LFW得分


参考资料

版权声明:本文为CSDN博主「Fire_Light_」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Fire_Light_/article/details/79593778