ROI Pooling(Region of interest pooling – 感兴趣区域池化)主要作用:对于不同尺寸的输入目标框,通过roi pooling,将其尺寸变为相同。
作用:
统一预选框尺寸
减轻网络,加速计算
允许端到端的训练模型
步骤:
将区域提案划分为相等大小的部分(其数量与输出的维度相同)
找到每个部分的最大值
将这些最大值复制到输出(max pooling)
例如,下面为常规检测模型框架,
对于输入图片,如下:
此时输入的为N*5,其中N为经过ROI Pooling后的尺寸,“5”分别为框的x,y,w,h和类别。
经过一系列的提取特征,最终我们得到feature map,如下:
则一系列预选框在feature map上的尺寸大小不一样,假设其中一个尺寸如下:
假设N=2,则其进行如下划分,取每一块最大值:
得到,如下: