关于MLKA中的大核和self.LKA3(a_1)*self.X3(a_1)这个地方为什么叫做门控的问题。 #29

sky-1232 · 2024-12-17T13:25:50Z

作者打扰您了、这里的LKA中的大核、是指将7×7、9×9这样子的大核卷积分成三个部分来减少参数和计算量、与那种卷积核31*31这种的大核卷积完全不同是吧。还有就是self.LKA3(a_1)*self.X3(a_1)这个地方乘上self.X3(a1)为什么叫做门控机制、而不能叫做注意力机制呢。非常感谢您的代码。

icandle · 2024-12-17T17:06:01Z

这里的大核是类似于31*31的卷积只不过分解成7*7和9*9的卷积大小减小计算量，这里可以参考VAN中的内容，这里是门控不是注意力的原因可以参考#28 中的回答，注意力是对输入的调整可以看作y=a(x)*x而门控粗糙点说可以当作y=f(x)*h(x)

sky-1232 · 2024-12-19T07:52:37Z

您好、您能给我讲讲门控和注意力的区别在于什么嘛、什么时候用门控什么时候用注意力、我搜索资料、我好像都不太理解。麻烦您了！

sky-1232 · 2024-12-19T08:35:02Z

或者说注意力机制和门控机制在cv方向来说、本质上都是控制信息的流通。

sky-1232 · 2024-12-19T11:57:55Z

门控机制更注重特征级别的强化筛选、注意力更注重像素级别的强化筛选？这样理解可以吗

icandle · 2024-12-19T14:49:10Z

不是，上面这两个的公式不一样

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于MLKA中的大核和self.LKA3(a_1)*self.X3(a_1)这个地方为什么叫做门控的问题。 #29

关于MLKA中的大核和self.LKA3(a_1)*self.X3(a_1)这个地方为什么叫做门控的问题。 #29

sky-1232 commented Dec 17, 2024 •

edited

Loading

icandle commented Dec 17, 2024 •

edited

Loading

sky-1232 commented Dec 19, 2024

sky-1232 commented Dec 19, 2024

sky-1232 commented Dec 19, 2024

icandle commented Dec 19, 2024

关于MLKA中的大核和self.LKA3(a_1)*self.X3(a_1)这个地方为什么叫做门控的问题。 #29

关于MLKA中的大核和self.LKA3(a_1)*self.X3(a_1)这个地方为什么叫做门控的问题。 #29

Comments

sky-1232 commented Dec 17, 2024 • edited Loading

icandle commented Dec 17, 2024 • edited Loading

sky-1232 commented Dec 19, 2024

sky-1232 commented Dec 19, 2024

sky-1232 commented Dec 19, 2024

icandle commented Dec 19, 2024

sky-1232 commented Dec 17, 2024 •

edited

Loading

icandle commented Dec 17, 2024 •

edited

Loading