arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

清华计图胡事民团队的这篇注意力机制的综述火了!

清华计图胡事民团队的这篇注意力机制的综述火了!

在上周的arXiv上,这是最热的一篇论文:

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

推特以及GitHub上也有不低的热度:

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

而这篇论文引用近200篇内容,对计算机视觉领域中的各种注意力机制进行了全面回顾。

在大量调查之后,论文将注意力机制分为多个类别,GitHub还给出了各类别下提到内容的PDF下载文件:

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

现在,就来一起看看这篇论文。

文章主要内容

论文首先将基于注意力的模型在计算机视觉领域中的发展历程大致归为了四个阶段:

  1. 将深度神经网络与注意力机制相结合,代表性方法为RAM
  2. 明确预测判别性输入特征,代表性方法为STN
  3. 隐性且自适应地预测潜在的关键特征,代表方法为SENet
  4. 自注意力机制

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

同时,注意力机制也被分为了通道注意、空间注意、时间注意、分支注意,以及两个混合类别:

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

针对不同类别,研究团队给出了其代表性方法和发展背景:

通道注意力(Channel Attention)

在深度神经网络中,不同特征图的不同通道常代表不同对象。

而通道注意力作为一个对象选择过程,可以自适应地重新校准每个通道的权重,从而决定关注什么。

因此,按照类别和出版日期将代表性通道关注机制进行分类,应用范围有分类(Cls)、语义分割(SSeg)、实例分割(ISeg)、风格转换(ST)、动作识别(Action)。

其中,(A)代表Channel-wise product,(I)强调重要通道,(II)捕捉全局信息。

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

空间注意力(Spatial Attention)

空间注意力可以被看作是一种自适应的空间区域选择机制。

其应用范围比通道注意力多出了精细分类(FGCls)和图像字幕(ICap)。

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

时间注意力(Temporal Attention)

时间注意力可以被看作是一种动态的时间选择机制,决定了何时进行注意,因此通常用于视频处理。

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

分支注意力(Branch Attention)

分支注意可以被看作是一种动态的分支选择机制,通过多分支结构决定去注意什么。

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

通道空间注意力(Channel & Spatial Attention)

通道和空间结合的注意力机制可以自适应地选择重要的对象和区域,由残差注意力(Residual Attention)网络开创了这一内容。

在残差注意力之后,为了有效利用全局信息,后来的工作又相继引入全局平均池化(Global Average Pooling),引入自注意力机制等内容。

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

时空注意力(Spatial & Temporal Attention)

时空注意力机制可以自适应地选择重要区域和关键帧。

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

最后,作者也提出了注意力机制在未来的一些研究方向:

  • 探索注意力机制的必要和充分条件
  • 是否可以有一个通用的注意块,可以根据具体的任务在各类注意力机制之间进行选择
  • 开发可定性和可解释的注意力模型
  • 注意力机制可以产生稀疏的激活,这促使我们去探索哪种架构可以更好地模拟人类的视觉系统
  • 进一步探索基于注意力的预训练模型
  • 为注意力模型研究新的优化方法
  • 找到简单、高效、有效的基于注意力的模型,使其可以广泛部署

关于作者

这篇论文来自清华大学计算机系胡事民团队。

胡事民为清华大学计算机系教授,教育部长江学者特聘教授,曾经和现任IEEE、Elsevier、Springer等多个期刊的主编、副主编和编委。

同时,他也是清华“计图”框架团队的负责人,这是首个由中国高校开源的深度学习框架。

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

文章一作为胡事民教授的博士生国孟昊,现就读于清华大学计算机系,也是清华计图团队的一员。

arXiv爆款:想了解Attention就看它!清华计图胡事民团队出品

各类资源汇总链接:
https://github.com/MenghaoGuo/Awesome-Vision-Attentions

论文地址:

https://arXiv.org/abs/2111.07624

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/110324.html

(0)

相关推荐

  • 美国心脏协会:10条降低心血管疾病风险的饮食建议值得学习。

    对人体而言,心脏终其一生都在不停地跳动,泵血,为人体器官运转提供血液供给。这样的“工作狂”也可能受到一些外界因素的影响,而出现心血管疾病,威胁健康。我国心血管疾病高发,人们不健康的生活方式不断地对心脏造成损伤,心血管疾病导致的死亡比例占城乡居民总死亡的首位,给人们带来的健康负担,经济负担也越来越重。

    生活 2021年11月17日
  • 科技定制酒“巷子浅”获近千万元天使轮融资

    36氪获悉,科技定制酒“巷子浅”于近日完成近千万元天使轮融资,投资方为梅花创投。此轮资金将用于酱酒包装升级、团队扩张、线下增长方面。

    科技 2021年11月28日
  • 低血糖时吃什么效果最佳?

    如果说高血糖的危害是以年计算的,那低血糖的危害则是按分钟计算的。不同程度的低血糖,表现有所差异:①轻度低血糖,常出现饥饿感、心慌、手抖、出冷汗、面色苍白、四肢无力、嘴周麻刺感等不适;②严重低血糖,出现意识模糊、肢体瘫痪、昏迷、大小便失禁等。低血糖发生时,如果已经出现神智不清,不要擅自喂食物或水,以免发生窒息,此时要立即送医。如果出现了低血糖症状,但还未出现如抽搐、昏迷等严重情况,应立即进食15克碳水化合物。用于低血糖急救的食物,有个优先级:>>白糖、糖块、糖水、蜂蜜、葡萄糖片最佳,这类食物吃进去后,很快被肠道吸收入血,能迅速缓解低血糖症状;>>饼干、点心、馒头、含糖饮料(含白砂糖的)、粥次之;>>再次是含糖饮料(含果葡糖浆的)、牛奶、冰淇淋、巧克力等。15克碳水化合物≈4~6颗糖果(迅速嚼碎服下),或1勺蜂蜜或白砂糖,或2~4块饼干,或100~200毫升含糖饮料(配料表中需含白砂糖)。

    生活 2021年9月2日
  • 雷军:小米公益基金会计划在100所高校设立奖学金项目,总赞助5亿元。

    10月30日消息,小米创办人,董事长兼CEO雷军29日晚通过其个人微博宣布小米奖助学金计划,小米公益基金会计划在100所高校设立奖助学金项目,赞助总额5亿元。去年完成10所大学,今年计划完成20所大学。

    科技 2021年10月30日
  • 下月初择机加仓,看好新能源!险资“抢跑”跨年行情

    “出于对跨年行情的看好,部分险资已提前加仓。”11月30日,多位险资大佬对中国证券报·中证金牛座记者透露,目前险资仓位处于较高水平,预计12月初和春节前后还有一波择机加仓的操作。 ...

    2021年12月1日
  • 先心病论坛,心病还需你来医一文越

    有专家预测,随着三胎时代的到来,小儿先天性心脏病(以下简称“先心病”)的发病率或将上升。少部分先心病患者在5岁前有自愈的机会,因此早诊治早治疗非常重要。面对先心病的治疗,许多家长仍有疑虑:手术治疗可以使宝宝恢复到正常孩子水平吗?手术费用高吗?今天我们就来谈谈有关先心病治疗的相关问题。

    生活 2021年10月22日