论文阅读: Filter Response Normalization

2019-12-13

Google AI在上周放出来的一篇paper: Filter Response Normalization, 简称FRN, 旨在提出新的normalization layer, 同时也提出了新的激活函数TLU.
paper: https://arxiv.org/pdf/1911.09737.pdf
code: 比较简单, 自己写了一个, code.

FRN(Filter Response Normalization)

符号定义:

$B - batch\\ C - channel\\ W - width\\ H - height\\ x_i - i^{th} channel$

$x$代表feature map.
归一化公式:

$v^2=\sum_i{x^2_i/N}\\ \hat{x}=\frac{x}{(v^2+\varepsilon)^{1/2}}\\ y = \gamma\hat{x} + \beta$

FRN没有使用关于batch的变量, 也就不会受制于batch的大小.
并且FRN没有减去mean, 而是把mean交给TLU来处理.
需要注意的是, $\varepsilon$也是可学习的.

TLU(Thresholded Linear Unit)

这部分更简单, 提出一个可学习的参数$\tau$, 直接计算:

$z = max(y, \tau)$

本质上, 就是一个可学习的ReLU…

Result

很不错
在这里插入图片描述
而且把BN+ReLU替换成BN+TLU, 也不会对性能有多少影响(基本没影响)

However

paper很美好, 但是自己玩了一下, FRN+Swish表现很好, FRN+TLU表现很一般…

gk

论文阅读: Filter Response Normalization

相关工作

FRN(Filter Response Normalization)

TLU(Thresholded Linear Unit)

Result

However