序列模型处理图像,空间信息去哪了?SEFN:不,我没丢!还更强了:空间增强前馈网络| | 即插即用模块与论文写作【V1代码讲解165】
空间增强前馈网络(Spatially-Enhanced Feedforward Network,SEFN):
实际意义:①线性序列处理局限性:传统 SSM(如 Mamba)将2D图像像素展开为1D序列处理,仅能捕获线性序列中的长距离依赖,但破坏了2D空间中像素邻接关系。
②局部空间依赖的缺失:对局部空间结构(如边缘、小区域纹理)的建模能力较弱。
实现方式:①取特征:两个输入。②提空间(上半部分)。③门控调制:图中Gate。
立即观看