【Google】高效Transformer综述，Efficient Transformers: A Survey - 专知VIP

会员服务 ·

32

Transformer · 综述论文 ·

2022 年 3 月 17 日

【Google】高效Transformer综述，Efficient Transformers: A Survey

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

由于其在语言、视觉和强化学习等领域的有效性，Transformer模型架构最近获得了巨大的兴趣。例如，在自然语言处理领域，Transformer 已经成为现代深度学习堆栈中不可或缺的重要组成部分。最近，出现了令人眼花缭乱的“X-former”模型——Reformer、Linformer、Performer、Longformer等等——它们改进了原始Transformer架构，其中许多都围绕计算和内存效率进行了改进。为了帮助热心的研究人员在这一热潮中导航，本文列举了大量深思熟虑的近期高效的“X-former”模型，为跨多个领域的现有工作和模型提供了一个有组织的、全面的概述。

成为VIP会员查看完整内容

66

相关内容

Transformer

Transformer是谷歌发表的论文《Attention Is All You Need》提出一种完全基于Attention的翻译架构

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

Google最新《高效Transformers》2022综述大全，阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，阐述九大类提升Transformers效率方式

专知会员服务

97+阅读 · 2022年3月18日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

专知会员服务

196+阅读 · 2021年6月10日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

70+阅读 · 2020年1月17日

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

新智元

3+阅读 · 2022年4月7日

深度学习模型压缩算法综述

深度学习模型压缩算法综述

极市平台

1+阅读 · 2021年12月3日

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

PaperWeekly

0+阅读 · 2021年11月21日

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述

极市平台

6+阅读 · 2021年11月16日

Transformers在计算机视觉概述

Transformers在计算机视觉概述

专知

3+阅读 · 2021年4月18日

基于主动轮廓模型的自然图像分割研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向GPU的电力系统电磁暂态并行计算方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

图的若干参数及算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于压缩感知的多机器人主动同步定位与地图构建研究

国家自然科学基金

1+阅读 · 2011年12月31日

含控制器的电力系统递阶（结构化）模型研究

国家自然科学基金

0+阅读 · 2010年12月31日

Learned Queries for Efficient Local Attention

Arxiv

0+阅读 · 2022年4月19日

Hierarchical Transformers Are More Efficient Language Models

Arxiv

3+阅读 · 2022年4月16日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

VIP会员

相关主题

相关VIP内容

Google最新《高效Transformers》2022综述大全，阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，阐述九大类提升Transformers效率方式

专知会员服务

97+阅读 · 2022年3月18日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

复旦最新「Transformers全面综述」论文，40页pdf概述Transformers各种变体模型与应用

专知会员服务

196+阅读 · 2021年6月10日

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

【Google】最新《高效Transformers》综述大全，Efficient Transformers: A Survey

专知会员服务

113+阅读 · 2020年9月17日

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

Google AI博客解读论文《Reformer: The Efficient Transformer》，百万量级注意力机制

专知会员服务

70+阅读 · 2020年1月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向真实世界音视联合语音识别的可扩展框架

《通过仿真与开源数据提升战略决策：机遇与局限》最新报告

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

评估大语言模型在科学发现中的作用

相关资讯

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

Google最新《高效Transformers》2022综述大全，39页pdf阐述九大类提升Transformers效率方式

新智元

3+阅读 · 2022年4月7日

深度学习模型压缩算法综述

深度学习模型压缩算法综述

极市平台

1+阅读 · 2021年12月3日

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

Swin Transformer升级版来了！30亿参数，刷榜多项视觉任务

PaperWeekly

0+阅读 · 2021年11月21日

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述

中国科学院、东南大学等联合发表最新的视觉 Transformer 综述

极市平台

6+阅读 · 2021年11月16日

Transformers在计算机视觉概述

Transformers在计算机视觉概述

专知

3+阅读 · 2021年4月18日

相关基金

基于主动轮廓模型的自然图像分割研究

国家自然科学基金

0+阅读 · 2013年12月31日

面向GPU的电力系统电磁暂态并行计算方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

图的若干参数及算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于压缩感知的多机器人主动同步定位与地图构建研究

国家自然科学基金

1+阅读 · 2011年12月31日

含控制器的电力系统递阶（结构化）模型研究

国家自然科学基金

0+阅读 · 2010年12月31日

相关论文

Learned Queries for Efficient Local Attention

Arxiv

0+阅读 · 2022年4月19日

Hierarchical Transformers Are More Efficient Language Models

Arxiv

3+阅读 · 2022年4月16日

A Survey of Transformers

Arxiv

103+阅读 · 2021年6月8日

A Survey on Visual Transformer

Arxiv

19+阅读 · 2020年12月23日

Efficient Transformers: A Survey

Arxiv

23+阅读 · 2020年9月16日

微信扫码咨询专知VIP会员