无需大规模预训练,清华提出高效NLP学习框架TLM

机器之心专栏

机器之心专栏

清华大学

近期,来自清华大学的研究者们提出了一种简单高效的 NLP 学习框架。不同于当下 NLP 社区主流的大规模预训练 + 下游任务微调(pretraining-finetuning)的范式,这一框架无需进行大规模预训练。相较于传统的预训练语言模型,该框架将训练效率 (Training FLOPs) 提升了两个数量级,并且在多个 NLP 任务上实现了比肩甚至超出预训练模型的性能。这一研究结果对大规模预训练语言模型的必要性提出了质疑:大规模预训练对下游任务的贡献究竟有多大?我们真的需要大规模预训练来达到最好的效果吗?

无需大规模预训练,清华提出高效NLP学习框架TLM

  • 论文地址:https://arxiv.org/pdf/2111.04130.pdf
  • 项目地址:https://github.com/yaoxingcheng/TLM

预训练语言模型因其强大的性能被广泛关注,基于预训练 - 微调(pretraining-finetuning)的范式也已经成为许多 NLP 任务的标准方法。然而,当前通用语言模型的预训练成本极其高昂,这使得只有少数资源充足的研究机构或者组织能够对其展开探索。这种 「昂贵而集权」的研究模式限制了平民研究者们为 NLP 社区做出贡献的边界,甚至为该领域的长期发展带来了障碍。

近期,为了缓解这一现状,来自清华大学的研究者们提出的一种完全不需要预训练语言模型的高效学习框架。这一框架从通用语料中筛选出与下游任务相关的子集,并将语言建模任务与下游任务进行联合训练。研究者们称之为 TLM (Task-driven Language Modeling)。相较于传统的预训练模型(例如 RoBERTa),TLM 仅需要约 1% 的训练时间与 1% 的语料,即可在众多 NLP 任务上比肩甚至超出预训练模型的性能(如图 1 所示)。研究者们希望 TLM 的提出能够引发更多对现有预训练微调范式的思考,并推动 NLP 民主化的进程。

无需大规模预训练,清华提出高效NLP学习框架TLM

语言模型会「抱佛脚」吗? 任务驱动的语言建模

无需大规模预训练,清华提出高效NLP学习框架TLM

TLM 提出的动机源于一个简单的观察:人类可以通过仅对关键信息的学习,以有限的时间和精力快速掌握某一任务技能。例如,在临考抱佛脚时,焦虑的学生仅需要根据考纲复习浏览若干相关章节即可应对考试,而不必学习所有可能的知识点。类似地,我们也可以推测:预训练语言模型在下游任务上的优良表现,绝大多数来源于语料中与下游任务相关的数据;仅利用下游任务相关数据,我们便可以取得与全量数据类似的结果。

为了从大规模通用语料中抽取关键数据,TLM 首先以任务数据作为查询,对通用语料库进行相似数据的召回。这里作者选用基于稀疏特征的 BM25 算法[2] 作为召回算法。之后,TLM 基于任务数据和召回数据,同时优化任务目标和语言建模目标 (如下图公式所示),从零开始进行联合训练。

无需大规模预训练,清华提出高效NLP学习框架TLM

1% 的算力 + 1% 的语料即可比肩预训练语言模型

为了测试 TLM 的性能,研究者们在 8 个 NLP 分类任务上从三个不同规模展开了对比实验。这 8 个任务涵盖了计算机科学、生物医药、新闻、评论等 4 个领域,包括了训练样本数量小于 5000 的低资源任务(Hyperpartisan News, ACL-ARC, SciERC, Chemprot)和训练样本数量大于 20000 的高资源任务(IMDB, AGNews, Helpfulness, RCT),覆盖了话题分类,情感分类,实体关系抽取等任务类型。从实验结果可以看出,和对应预训练 - 微调基准相比,TLM 实现了相当甚至更优的性能。平均而言,TLM 减少了两个数量级规模的训练计算量 (Training FLOPs) 以及训练语料的规模。

无需大规模预训练,清华提出高效NLP学习框架TLM

任务驱动的语言建模(TLM) vs 预训练语言模型(PLMs)

无需大规模预训练,清华提出高效NLP学习框架TLM

表格 1 直接对比了 TLM 和 PLM。整体来说,PLM 以极高的成本学习尽可能多的任务无关的知识,而 TLM 以非常低的成本针对每个任务学习相关知识。对比 TLM 和 PLM 有如下几个方面特点。

1.推动 NLP 研究公平化和民主化(Democratization)

预训练本身严重依赖大量的计算资源,这一限制使得大多数 NLP 研究者专项对微调算法的研究。然而微调性能上限很大程度上受预训练模型性能的约束。而 TLM 使得大多数研究人员可以以较低的代价和较高的效率,基于最先进的解决方案对模型架构、损失函数、算法等方面进一步自由探索。

2. 高效性(Efficiency)

TLM 在平均每个任务的 FLOPs 消耗方面显著优于 PLM。当我们有少数目标任务需要解决的时候(例如研究人员希望对少量几个数据集进行研究),TLM 会是非常高效的;然而当需要一次性解决大量任务时(例如工业界构建一个 NLP 平台为多方提供相似的服务),PLM 仍然具有优势。

3. 灵活性(Flexibility)

TLM 是任务驱动的,所以可以给研究人员更大的自由度,从而自定义策略进行标记、序列长度、数据表示、超参数的调整等等,从而达到提高性能和效率的目的。

4. 通用性(Generality)

PLM 学习与任务无关的一般性表示,可用于小样本和零样本学习,而 TLM 通过学习任务相关的表示一定程度牺牲通用型换取效率。从这个意义上,TLM 需要在通用型方面进一步提升。此外也可以 PLM 和 TLM 结合从而在通用性和效率之间实现更好的权衡。

深入观察 TLM:让更多参数为下游任务服务

无需大规模预训练,清华提出高效NLP学习框架TLM

为了深入了解 TLM 的工作机制,研究人员对模型每个注意力头所输出的注意力分数进行了可视化。可以观察到,TLM 的注意力模式中包含了更多的「对角线」模式(图 3 红框),也即大多 token 都将注意力分数集中赋予了其邻近 token,这种模式已在前人的工作 [1] 中被证明对模型的最终预测有着重要贡献。而预训练模型(BERT, RoBERTa)中则包含了大量「垂直」模式的注意力头(图 3 灰色区域),也即大多 token 都将注意力分数集中赋予了 [CLS],[SEP] 或者句号这种毫无语义或者句法信息的词汇上。这一现象表明 TLM 中参数利用率要显著高于预训练语言模型,TLM 或许针对下游任务学习到了更加富有语义信息的表示。

总结

TLM 的提出让 NLP 研究跳脱出预训练微调范式成为了可能,这使得 NLP 研究者们可以更为自由地探索新兴的模型结构与训练框架,而不拘泥于大规模预训练模型。在未来,更多有趣的研究可以在 TLM 的基础上展开,例如:如何经济地达到更大规模预训练模型的表现效果;如何提升 TLM 的通用性与可迁移性;可否利用 TLM 进行小样本或零样本学习等等。

参考文献

[1] Elena Voita, David Talbot, Fedor Moiseev, Rico Sennrich, and Ivan Titov. 2019. Analyzing multi-head self-attention: Specialized heads do the heavy lifting, the rest can be pruned. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pages 5797–5808, Florence, Italy. Association for Computational Linguistics.

[2] Stephen E. Robertson and Hugo Zaragoza. 2009. The probabilistic relevance framework: BM25 and beyond. Found. Trends Inf. Retr., 3(4):333–389.

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/86265.html

(0)

相关推荐

  • 海航集团及相关企业破产重整案件的各项重整计划(草案)均已表决通过。

    e公司讯,10月23日15时,海南省高级人民法院组织联合工作组、管理人、债权人代表、出资人代表、债务人代表及职工代表等各相关方,对《海南航空控股股份有限公司及其十家子公司重整计划(草案)》、《海航基础设施投资集团股份有限公司及其二十家子公司重整计划(草案)》、《供销大集集团股份有限公司及其二十四家子公司重整计划(草案)》及《海航集团有限公司等三百二十一家公司实质合并重整案重整计划(草案)》等海航集团及相关企业破产重整案的各重整计划草案表决情况进行核查。按照《中华人民共和国企业破产法》第八十四、八十六条的规定,根据核查结果,海航集团及相关企业破产重整案的各重整计划(草案)均已获得表决通过。

    生活 2021年10月23日
  • 降糖主食第一关!教你怎么吃荞麦!收藏备用

    荞麦,降糖减脂的食物,降糖减脂主食!

    生活 2021年10月15日
  • 防疫管理下的心理调节

    1989年,世界卫生组织提出了21世纪健康新概念:“健康乃是一种在身体上、精神上的完满状态以及良好的适应力,而不仅仅是没有疾病和衰弱的状态”。一个人在躯体健康、心理健康、社会适应良好和道德健康四个方面都健全,才是完全健康的人。新型冠状病毒给全国人民一个措手不及,防疫管理也打乱了我们的步伐,应激之下难免会形成各种负面情绪和症状,像抑郁、焦虑、强迫、失眠等,消极的心理因素影响人的工作生活,同时也能引起躯体症状,我们一定要排解不良情绪,调整心情,以最好的状态面对工作和生活。我们要乐观看待这次变故,我们为何不能趁此期间,慢节奏生活,陪陪家人,反省一下自己呢,我觉着趁此做个心灵的疗愈和修整非常有必要,缓解或消除心理不良情绪,保持情绪正能量不妨从生理和精神两个方面入手:一、生理放松法1、腹式呼吸,经常深呼吸能缓解不良情绪,平静心情,如果经常进行深呼吸的练习,就能让人拥有一个处乱不惊的平静心境;2、饮食调节,多吃新鲜蔬菜、水果,荤素搭配,多补充钙质和维生素,按时吃早饭,喜欢吃享受吃是热爱生活的体现,要保持兴趣和热情,生活才能有滋有味;3、规律生活,可以制定个日常计划,列明工作生活的时刻表,都基本按照一个规律表来,形成良好的习惯,有规律的生活能有利于修养身心,当然生活也需要仪式感,生活中来点幸福的涟漪也是很不错的;4、保证良好睡眠,早睡早起身体好,睡眠好了一切问题都不是事;5、亲近大自然,多外出晒晒太阳,看看绿色,既能补钙又能愉悦身心,是个非常不错的缓解情绪的方法;6、养宠物,养个小猫小狗,在遛狗撸猫过程中你会体会到无尽的温暖和感动;7、多运动,可以晨跑、跳绳、骑行,也可以瑜伽、游泳,试一试也许不难,而且运动带来的快感和成就感也是很值得期待的,运动给身体也会带来意想不到的保健和免疫力,年轻时运动就是给年老时储存健康能量。二、精神放松法1、冥想法,平时找个安静的地方反省一下自己,梳理一下工作和生活的计划,总结一下近期的工作和生活,或者做做白日梦感觉也不错啊;2、注意力转移法,培养一个兴趣爱好,不管是绘画、唱歌,还是弹琴、打球,填充起自己的业余时间,陶冶心情、愉悦身心很不错啊;3、出去旅游,从自己呆腻的地方去别人呆腻的地方去看一看,开阔一下心胸,心有多大,舞台就有多大;4、相信信仰和目标的力量,或者树立个学习工作目标为之奋斗,或者树立个偶像和信仰,这些都能是你精神世界的寄托,能让你脱离你目前难以脱身的负面情绪和能量,能充满正面能量的去追求你的目标或者信仰;5、听听音乐,心灵疗伤除了时间,优美的乐曲也是良药啊,能激起你内心的涟漪,平复你的伤痛和烦恼;6、树立良好的自我认知,正确认知、悦纳自我、顺其自然、为所当为,进自己最大的努力,管好自己的事情,其他不能左右的事情就随缘吧;7、多与人沟通交流,要广交朋友,经常找朋友聊天,推心置腹的交流或倾述不但可增强人们的友谊和信任,更能使你精神舒畅,烦恼尽消。抑郁情绪是大脑对过去的投射,焦虑情绪是大脑对未来的投射,我们不能沉溺过去中不能自拔,因为这样无济于事,也不能过于担忧未来的事情,因为大部分我们所担忧的都没有发生,即使发生也没有向我们大脑里想的那样严重(黑箱效应--当个体获得的某事物信息太少或者没有信息时,个体容易往坏的方面思考),我们要关注当下,把握现在,为所当为,做好当前的点点滴滴,细微感知当下的世界,把想法付诸于行动,在行动中获得感悟和提升。 世界上有三种事情,老天爷的事情,别人的事情和自己的事情,我们做好自己的事情,不要过度干涉别人的事情,当然更不用忧虑老天爷的事情,当你用积极的心态去面对生活和工作,生活或工作就用正能量回应你,当你用消极负面的情绪面对生活和工作,那么负能量、糟糕的事情就会找上门(墨菲定理--如果你担心某种情况发生,那么它就更有可能发生)。 心若改变,态度就会改变,态度改变,习惯就改变,习惯改变,人生就会改变。今天是我们剩下生命中最年轻的一天,我们要能量满满的过好今天,那么过好每一个今天,我们的日子过得就不会差,我们的生命就会绽放属于自己的独特精彩。春有百花秋有月,夏有凉风冬有雪,若无闲事挂心头,便是人生好时节。凡事都是在恰当的时节恰好出现,我们要积极进取,做最好的自己,同时对于烦恼之事我们要怀着自信乐观的心态看待庭前花开花落、遥望天上云卷云舒,岁月很长,生命很短,我们既要只争朝夕,不负韶华,又要淡泊宁静,宠辱不惊。

    生活 2021年10月11日
  • 这样的手机是不是很多人心中期待的样子?

    最近结合了很多人在后台私信的留言以及网上对智能手机用户期待的样子做了一个简单的汇总,发现大多数用户追求的产品更多的并不是所谓的高端旗舰,所以今天也根据统计的结果从智能手机的性能、续航、影像、屏幕以及系统等这几个主要部分来刻画一部大家理想中的产品,当然也希望各大手机厂商看到用户心中真正想要的产品到底是什么样。

    科技 2021年11月6日
  • 怀孕建档是怎么回事,怀孕为什么建档

    当你知道自己怀孕的那一刻,你是什么心情呢?激动、喜悦还是无措?我相信大多数人都是非常高兴的。知道自己怀孕以后,一定要记得定期产检,这是非常必要的,那么什么时候做什么检查呢?

    生活 2021年11月21日