From Facial Parts Responses to Face Detection: A Deep Learning Approach
翻译:
在本文中,我们提出了一种新的深度学习卷积网络架构。在FDDB,PASCAL face,和AFW上获得了出色的性能表现。特别指出的是,我们的方法在具有挑战性的标准测试集FDDB上获得了90.99%的召回率,超过了先前最好的算法2.91%的跨越。能够得到最重要的是,我们寻找到了基于面部空间结构与布局得分来进行人脸发现(检测)的新方法。因为面部的局部可视性,其得分机制(策略)实在考虑了挑战实例的前提下经过仔细论证(表述)的。这样的考虑允许我们的学习网络能够在严峻的遮挡和不受约束的姿态变化中也能够进行面部检测,这也是我们的方法最大的不同之处,也是迄今为止大多数人脸检测方法的瓶颈所在。
我们的演示显示尽管使用了DCN(深度卷积网络),我们的网络也能够获得实用的实时速度。基于神经网络的方法曾经广泛用于人脸定位,但是它很快被各种基于非神经网络的方法所代替,这些非神经网络的方法如:
参考文献3、9、20、34的层叠结构方法,以及参考文献23,36,40所提及的可变形部分模型。鉴于深度学习和GPU进来最新的进展,是值得从神经网络的角度去从新审视这一问题。
我们希望设计一个深度学习卷积网络以完成人脸的检测,其目标不但能够利用DCN的的学习表达能力,而且设计了一个新的方法处理严重的阻塞问题,这已经成为了人脸检测中的瓶颈问题。
为了此目的,我们设计了具有如下吸引力特性的新深度卷积网络:
所有上述的特性对传统方法来讲在实现上都是具挑战性的,并且在以下的condsideration 中是可能的:
(1)从深度网络的属性感知生成对应的面部部分组成:我们相信关于面部局部独特结构的推理是处理无约束环境下人脸识别的关键。为此,我们设计了一套性感知深度网络,它是预先使用通用面部对象训练而后调整某些特性定部分的二制属性。(例如:嘴巴属性,包括大嘴唇,张口,微笑,涂口红)。我们分析表明这些网络能够在深层生成对对应的映射以强烈的标出部件的位置。正如图1(b)所示,五个不同面部部件对应的映射。
(2)从相应的配置中计算机面部分数:,我们公式化了一个有效的方法,通过分析所给对应的部件的空间布局来推断它与脸的相似度。例如,头发应该出现在眼睛的上面,而嘴巴应该仅仅出现在鼻子的下面。任何不一致都将被惩罚。面部分值将会被计算出并且用其来排名任何提出获得了一组通用对象脸表决的候选窗口。我们的实验表明,我们的脸建议方案享有一个高的召回率,大约150个建议中,超过90%的召回率,约0.5%的全滑动窗口和约10%的通用对象建议。
(3)改善了脸假设:上述的两个步骤为我们提供的找到脸的机会,甚至在严重的遮挡与姿态形变下。以上步骤的输出是一个个高质量的面部边框建议,其覆盖了图片中大部分的脸。给出脸部建议,我们在第二阶段设计了一个多任务的深度卷积网络,通过实时识别真脸并评估更精确脸位置的方法来进一步精炼假设。
本研究中,我们最大的贡献是新颖的将DCN用于从任意原始未处理的图片中发现脸部相应部件。有趣的是,在我们的方法中部件检测器出现在CNN训练中,以从未处理过的脸部图片中分类属性,并且没有任何部分监督。这是本文的创新之处。我们利用这一新的能力进一步提出一个具有鲁棒严重遮挡的脸检测器。我们的网络在包括FDDB、PASCAL faces以及AFW这些标准的具有挑战性的脸检测标准测试库中获得了最好的性能。
翻译:
在本文中,我们提出了一种新的深度学习卷积网络架构。在FDDB,PASCAL face,和AFW上获得了出色的性能表现。特别指出的是,我们的方法在具有挑战性的标准测试集FDDB上获得了90.99%的召回率,超过了先前最好的算法2.91%的跨越。能够得到最重要的是,我们寻找到了基于面部空间结构与布局得分来进行人脸发现(检测)的新方法。因为面部的局部可视性,其得分机制(策略)实在考虑了挑战实例的前提下经过仔细论证(表述)的。这样的考虑允许我们的学习网络能够在严峻的遮挡和不受约束的姿态变化中也能够进行面部检测,这也是我们的方法最大的不同之处,也是迄今为止大多数人脸检测方法的瓶颈所在。
我们的演示显示尽管使用了DCN(深度卷积网络),我们的网络也能够获得实用的实时速度。基于神经网络的方法曾经广泛用于人脸定位,但是它很快被各种基于非神经网络的方法所代替,这些非神经网络的方法如:
参考文献3、9、20、34的层叠结构方法,以及参考文献23,36,40所提及的可变形部分模型。鉴于深度学习和GPU进来最新的进展,是值得从神经网络的角度去从新审视这一问题。
我们希望设计一个深度学习卷积网络以完成人脸的检测,其目标不但能够利用DCN的的学习表达能力,而且设计了一个新的方法处理严重的阻塞问题,这已经成为了人脸检测中的瓶颈问题。
为了此目的,我们设计了具有如下吸引力特性的新深度卷积网络:
所有上述的特性对传统方法来讲在实现上都是具挑战性的,并且在以下的condsideration 中是可能的:
(1)从深度网络的属性感知生成对应的面部部分组成:我们相信关于面部局部独特结构的推理是处理无约束环境下人脸识别的关键。为此,我们设计了一套性感知深度网络,它是预先使用通用面部对象训练而后调整某些特性定部分的二制属性。(例如:嘴巴属性,包括大嘴唇,张口,微笑,涂口红)。我们分析表明这些网络能够在深层生成对对应的映射以强烈的标出部件的位置。正如图1(b)所示,五个不同面部部件对应的映射。
(2)从相应的配置中计算机面部分数:,我们公式化了一个有效的方法,通过分析所给对应的部件的空间布局来推断它与脸的相似度。例如,头发应该出现在眼睛的上面,而嘴巴应该仅仅出现在鼻子的下面。任何不一致都将被惩罚。面部分值将会被计算出并且用其来排名任何提出获得了一组通用对象脸表决的候选窗口。我们的实验表明,我们的脸建议方案享有一个高的召回率,大约150个建议中,超过90%的召回率,约0.5%的全滑动窗口和约10%的通用对象建议。
(3)改善了脸假设:上述的两个步骤为我们提供的找到脸的机会,甚至在严重的遮挡与姿态形变下。以上步骤的输出是一个个高质量的面部边框建议,其覆盖了图片中大部分的脸。给出脸部建议,我们在第二阶段设计了一个多任务的深度卷积网络,通过实时识别真脸并评估更精确脸位置的方法来进一步精炼假设。
本研究中,我们最大的贡献是新颖的将DCN用于从任意原始未处理的图片中发现脸部相应部件。有趣的是,在我们的方法中部件检测器出现在CNN训练中,以从未处理过的脸部图片中分类属性,并且没有任何部分监督。这是本文的创新之处。我们利用这一新的能力进一步提出一个具有鲁棒严重遮挡的脸检测器。我们的网络在包括FDDB、PASCAL faces以及AFW这些标准的具有挑战性的脸检测标准测试库中获得了最好的性能。