**
B_CNN
** 再经过sum-pool 或者maxpool,后加分类模块。 fA:CxM fB: CxN bilinear = MxN -----> reshape to size MN x 1 -----> classification
双线性CNN的梯度传播
实验 本文采用 M(15 layers)conv5+relu ,D(30 layers)conv5-4 + relu。
Low dimensional bilinear CNN models
对称初始化的b-cnn在参数调整后还是对称的,因为梯度是相同的。虽然有效率,但是次优的,没有探索到不同的CNN空间。 为打破特征提取器的对称性:
dropout效果稍微有所下降降维度,降低通道数。