深度可分离网络-Xception

1. 摘要

我们提出了一种关于inception的解释，其介于正常卷积网络和深度可分离卷积之间（先进行分离卷积然后进行点卷积）。就此而论，深度可分离卷积可以被视为inception最大质量的跨越。这项工作受到Inception的启发，将会成为一个新网络架构的基准，同时Inception的卷积网络也将被替代。我们将此网络命名为Xception，在ImageNet数据集上略微强于Inception V3，当在大数据集上明显的超过Inception V3。当Xception和Inception V3具有相同的参数，表现能力不会提高，但是效率会提升。

翻译太烂，自己都没看懂

2. 介绍

今年来卷积神经网络作为计算机视觉的主要算法，同时开发设计他们的结构作为主要注意点。卷积神经网络的设计可以追溯到LeNet模型，进行简单的卷积堆叠提取特征和通过max-pooling对空间进行降采样。2012年，这种思想结构被提炼到AlexNet网络中，使用大量的max-pooling结构，对网络的每一层进行提取，获得大量的特征。由于ImageNet竞赛的驱动，随之而来的是网络越来越深的趋势。最著名的就是VGG网络等

此时出现一种Inception新的架构，在2014年被发明称之为GoogLeNet，之后陆续提升精确的升级到了V2、V3等版本。自从Inception架构的提出，其成为在ImageNet等数据集上最好的网络系列之一。

Inception系列是由Inception的基础模块构成，其中包括几个版本。如下图一所示为标准形式，同时也出现在Inception V3之中。这与早期的VGG网络有所不同，他是由渐渐的卷积网络堆叠而成。

然而Inception的结构和基本卷积类似（卷积特征提取结构），从经验上来看，此结构可以通过很少的参数获得大量的特征。他们如何工作，和传统卷积有何区别？

3. Inception假设

一个卷积层可以学习三维空间的滤波器权重，通过一个二维空间尺寸（长和宽）+一个通道空间。因此，一个单卷积核的任务可以同时映射跨通道的相关性和空间的相关性。

Inception模型的背后想法是使过程更简单、更高效的分解一系列独立的夸通道相关性和夸空间相关性操作。更精确的说，典型的Inception结构首先通过1×1的卷积研究夸通道的相关性，映射输入数据到3-4个相互独立的空间，和输入类似，之后通过规则的3×3或5×5卷积将所有相关性映射进3D空间之中。事实上，Inception模块的假设是跨通道的相关性和空间相关性相关分离，而不是倾向于将他们联合。

考虑一个简化版本的Inception模块，仅使用一种大小的卷积同时不包括pooling跳跃层。Inception模块可以被重新描述成一个大的1×1卷积+空间卷积，操作于输出通道没有重叠的段落。这个表达自然的出现以下几个问题：这个假设比之前的Inception的假设更合理吗？跨通道相关性和空间相关性可以完全分离吗？

单词汇总

intermediate：中介
inspired by：由。。。。启发（受到。。。鼓舞）
outperform：超过
emerged：出现，暴露
sub-sampling：次采样（下采样==upSampling）
what follow was：随之而来
At this point：此时
canonical：标准
This is a departure from：与。。。。不同
conceptually：概念（concept）
come afte：紧随
This idea behind：背后的想法
decouple：解耦合（couple夫妇）
reformulate：再叙述（formulate叙述）
segment：分割、段落、分段
``：
``：
``：
``：

《论文翻译》Xception

深度可分离网络-Xception

1. 摘要

2. 介绍

3. Inception假设

单词汇总

相关推荐