论文 | 备注 | top5 error |
---|---|---|
Network In Network | 提出了1 x 1卷积核代替maxout 提供了更好的多filter聚合能力 | CIFAR-100 数据集 1 model; 1 crop; top1 error: 35.68% |
Going deeper with convolutions | 将NIN中子网络的概念更加泛化利用多个不同大小的filter抽取信息利用1 X 1卷积增加信息稠密程度减少计算量 | ILSVRC 2014 数据集1 model; 1 crop: 10.07%ensemble(7 models, 144 crops): 6.67% |
Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift | 提出并利用BN结构解决内部协变量漂移问题大幅提升网络训练速度 | LSVRC 2012 数据集ensemble(6 models, 144 crops): 4.94% |
Rethinking the Inception Architecture for Computer Vision | 提出了4个设计网络的原则 提出了用多个小卷积代替大卷积的方法 提出了用非对称卷积 提出了更高效的pooling方式——conv和pool并行计算然后concat到一起 提出新的正则化方式——标签平滑 |
LSVRC 2012 数据集 1 model; 1 crop:5.6% ensemble(4 models, 144 crops): 3.58% |
Inception-v4, Inception-ResNet and the Impact of Residual Connection on Learning | 在v3的基础上加了一些小改动提出v4与ResNet结合提出Inception-ResNet提出了当filter数量超过1000的时候防止训练崩溃的缩放残差方法 | ILSVRC 2012 数据集 1 model; 1 crop: Inception-v4: 5.0% Inception-ResNet-v1: 5.5% Inception-ResNet-v2: 4.9% Inception-v4 + 3 * Inception-ResNet-v2: 3.1% |