4.3 SIR-LAN 人脸关键点定位算法

基于深度学习的级联回归器在人脸定位方面超越了传统方法,但存在执行效率不高的问题,为了提高其计算效率,文献[6]提出了SIR-LAN人脸关键点定位算法,它包括自迭代回归(Self-Iterative Regression,SIR)和人脸关键点注意力神经网络(Landmarks-Attention Network,LAN)两部分,如图4-4所示为该算法的处理框架和流程。LAN 使用了3个卷积层,之所以称为注意力网络,是因为它只关注每个人脸关键点周围的脸部特征,对每个人脸关键点区域分别进行特征提取,然后将这些特征拼接,如图4-4(b)所示。

img

图4-4 SIR-LAN 人脸关键点定位算法的主要处理框架和流程[6]

SIR-LAN 人脸关键点定位算法旨在迭代训练一个回归器(而非多个级联回归器),用于预测人脸关键点的位置。该回归器的输入数据是通过随机高斯采样方法构造的数据,该采样方法是SIR-LAN 人脸关键点定位算法成功的关键。LAN 神经网络以回归器预测的人脸关键点结果为基础,对人脸的不同区域分别进行卷积特征提取(如左眼、右眼、鼻部、嘴部),然后将这些特征拼接,得到全连接向层fc1,fc1后接另一个全连接层fc2。LAN 的预测结果与真实结果的差异(误差),作为SIR 通过不断迭代训练人脸关键点回归器的依据。更新后的人脸回归器的预测数据又作为LAN 的输入,对脸部不同区域进行特征提取、预测,并计算误差,如此循环往复。

SIR-LAN 人脸关键点定位算法,本质上仍然是通过卷积神经网络回归学习人脸关键点的位置,但作者通过精密的采样方法,保证了输入数据的多样性和回归器的准确率。该方法的人脸关键点定位效果与级联回归器方法相当,但是计算效率得到了显著提升。