深度学习-单发探测器(2)

tech2022-10-13  122

Yolo:

该检测器的精度稍差一些(在v2上进行了改进),但它是一种非常快速的检测器,本章将尝试解释其工作原理,并在tensorflow中提供参考工作代码。此检测器的想法是,您可以在CNN模型上运行图像,并在一次通过中获得检测。 首先将图像调整为448x448,然后馈入网络,最后通过非最大抑制算法对输出进行过滤。

训练阶段步骤: 1、查看哪个单元格靠近地面真相边界框的中心。 (匹配阶段) 2、从特定单元格检查哪个边界框与地面实况(IoU)重叠更多,然后减小重叠较少的边界框的置信度。 (每个边界框都具有置信度) 3、从没有对象的每个像元中降低所有边界框的置信度。 也不要调整这些单元格的框坐标或类概率。 4、减少不包含任何对象的单元格的边界框置信度。 Yolo检测器最近得到了改进,列出了它们的主要改进: 1、更快 2、更准确(在Pascal数据集上为73.4 mAP(所有类别的平均平均精度) 3、最多可以检测9000个课程(之前为20个) 他们做了哪些改进: 1、添加了Batchnorm 2、在Imagenet上以多个比例(224x224)然后(448x448)进行预训练,然后再对它们进行训练以进行检测。 3、现在他们使用Faster-RCNN之类的锚框,分类是按照每个框的形状而不是每个网格单元进行的 4、他们使用K均值来获取基于数据的盒子形状,而不是手动选择盒子形状 5、可以从多个角度训练网络,因为网络现在是完全卷积的(NO FC层),这很容易做到。 6、他们在Image-net和MS-COCO上进行训练 7、他们创建了一种新的机制来训练没有检测数据的数据集。 通过选择多部分损失函数,传播什么。 8、使用WordTree将来自各种来源的数据与我们的联合优化技术相结合,以同时在ImageNet和COCO上进行训练。

SSD:

SSD探测器与其他单发探测器不同,这是因为使用了多层,可以在不同比例的物体上提供更高的精度。 (每个更深的层将看到更大的对象)。 SSD通常从Resnet上的VGG预训练模型开始,然后将其转换为完全卷积神经网络。 然后,我们附加一些额外的转换层,这实际上将有助于处理更大的对象。 SSD架构原则上可以与任何深度网络基础模型一起使用。 需要注意的重要一点是,在图像通过VGG网络传递后,添加了一些转换层,从而生成尺寸为19x19、10x10、5x5、3x3、1x1的特征图。 这些以及由VGG的conv4_3生成的38x38特征图,将用于预测边界框。

如图所示,某些激活已从网络“抓取”并传递到专用的子网,该子网应用作分类器和本地化器。 在预测期间,我们使用非最大值抑制算法来过滤每个可能出现的对象的多个框。

总结:

本章节我们主要介绍了单发探测器相关内容,包括与Yolo、SSD。后面将继续介绍深度学习相关内容。

最新回复(0)