论文链接与数据集下载:VGGFace—-Deep Face Recognition
本文主要内容有二:
- 从零开始构建一个人脸识别数据库,一共 2.6M images, over 2.6K people,构建过 程主要是程序实现的,少量人工参与。
- 通过对比各种CNN网络,提出了一个简单有效的CNN网络,在各种公开的人脸识别数据库上得到很好的效果。
VGGFace DateSet
构建过程主要分为5个阶段:
- 阶段在IMDB网站上获得名人名字的名单列表,这个和CASIA-Webface有点像
- 阶段是通过谷歌来扩大每个人的图片量
- 阶段使用一个Fisher Vector Faces descriptor 与SVM清除一些错误的图片
- 阶段清除一些一样的照片,因为从不同网站上爬下来的照片,难免会有所重复。
- 阶段再人工清除一些照片
各阶段的统计数据如下:
比较花时间的是2阶段和5阶段,其余都很快。
这是与其他数据集的比较:
网络结构
基于VGG自己的数据集,构建了如下的CNN,用来进行人脸识别
看图片的描述,作者说这是VGGNet中的A结构,但是参考VGGNet论文中的结构表(如下),博主认为却是D结构,不知道是不是作者写错了,但是影响不大。
使用Softmax在VggDataSet上预训练。
在进行验证时,在最后一层输出的2622维的特征(即对应每一类的概率)还会被用来以Tripletloss做一个度量学习
度量学习是一个全连层,使用目标数据集(LFW)的训练集部分训练。
通过训练好的度量学习层,获得人脸的1024维特征表达,然后直接以欧式距离来作为人脸是否为同一个脸的判定依据。
这一做法和百度的论文其实是十分相似的,其实两篇论文发表的时间也相近,都是15年。
实验
此表的训练数据Data有d和f两种,分别对应的是构建数据集时3阶段的数据(清理前)和5阶段的数据(清理后)
通过这里可以发现,使用更大但是有更多错误的数据集对网络能力有提高作用,原因一是因为数据量更大,二是因为小的数据集可能被清除了一些hard positive的数据,使得网络无法从这些数据里受益。
LFW得分
参考资料
版权声明:本文为CSDN博主「Fire_Light_」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Fire_Light_/article/details/79593778