卷积核越大越好?ICCV论文说:你可能一直想错了!多感受野聚合模块| 即插即用模块与论文写作【V1代码讲解178】
多感受野聚合卷积模块(Multi-Receptive Field Aggregation, MRFA):
实际意义:①感受野太小:小卷积核(3×3、5×5)只能看到局部区域,缺乏对远处区域的感知力,导致模型理解不完整。
②分布不合理:大卷积核能扩大视野,但远处和近处特征影响“差不多大”,这破坏图像规律:越靠近像素对结果影响越强,越远的影响越弱。
③计算量大:大卷积核参数量大、FLOPs高,训练和推理成本极高,很难落地使用。
实现方式:①使用7×7、9×9、11×11卷积核,小核→精细局部特征;中核→区域上下文;大核→全局结构信息,并行组合逐步扩展有效感受野。
②一个辨别器、一个放大器。
立即观看