2.1.5 Inception V2/V3
Inception V2(Szegedy et al.,2016)在BN-Inception的基础上进一步改进网络结构。Inception V2和BN-Inception 都用了10个Inception模块,两者区别在于Inception V2 同时使用了图2-8中的3种模块。
图2-8 Inception V2和Inception V3中的Inception模块
● 在网络的前几层,使用3个图2-8(a)中的模块,该模块和BN-Inception中使用的模块相同,都是将 GoogLeNet中Inception模块中的卷积用两个卷积取代。相比于使用一个卷积,使用两个卷积有更少的参数量和计算量。
● 在网络的中间几层(对应特征空间维度为),使用5个图2-8(b)中的模块,该模块进一步将卷积分解成卷积,相比于使用一个卷积,使用卷积有更少的参数量和计算量。这种非对称的卷积分解形式在网络前几层中作用不大,但是在网络中间几层(特征空间维度在到之间)中效果很好。
● 在网络的后几层(对应特征空间维度为),使用图2-8(c)中的两个模块,相比于原始Inception模块,该模块可以得到更多通道数的输出特征,以避免特征空间维度比较小时带来的信息损失。
Inception V3(Szegedy et al.,2016)在Inception V2的基础上,将网络最初的卷积也分解为卷积。此外,在全连接层后也使用了BN层,并且使用了标记平滑(Label Smoothing)训练技巧等。Inception V3计算量是GoogLeNet计算量的2.5 倍,而错误率较后者下降了3%。