多语言机器翻译学习语言专用分网络 (Learning Language Specific Sub-network for Multilingual Machine Translation)

Multilingual neural machine translation aims at learning a single translation model for multiple languages. These jointly trained models often suffer from performance degradation on rich-resource language pairs. We attribute this degeneration to parameter interference. In this paper, we propose LaSS to jointly train a single unified multilingual MT model. LaSS learns Language Specific Sub-network (LaSS) for each language pair to counter parameter interference. Comprehensive experiments on IWSLT and WMT datasets with various Transformer architectures show that LaSS obtains gains on 36 language pairs by up to 1.2 BLEU. Besides, LaSS shows its strong generalization performance at easy extension to new language pairs and zero-shot translation.LaSS boosts zero-shot translation with an average of 8.3 BLEU on 30 language pairs. Codes and trained models are available at https://github.com/NLP-Playground/LaSS.

翻译：多语言神经机器翻译旨在学习多种语言的单一翻译模式。这些经过联合培训的模型往往因丰富资源语言对口的性能退化而受损。我们把这种退化归因于参数干扰。我们在本文件中建议拉SS联合培训单一统一的多语言MT模型。拉SS为每个语言对口学习语言特定子网络(LaSS)以对抗参数干扰。关于IWSLT和WMT数据集的各种变异结构的全面实验显示,拉SS在36对语言上取得了高达1.2BLEU的收益。此外,拉SS在容易扩展为新语言对口和零速译时展示了强大的普及性性表现。拉SS促进零速翻译,平均为30对语言对口8.3 BLEU。可在https://github.com/NLP-Playground/LSS上查阅守则和经过培训的模型。

相关内容

Machine Translation

关注 209

机器翻译（Machine Translation）涵盖计算语言学和语言工程的所有分支，包含多语言方面。特色论文涵盖理论，描述或计算方面的任何下列主题:双语和多语语料库的编写和使用，计算机辅助语言教学，非罗马字符集的计算含义，连接主义翻译方法，对比语言学等。官网地址：http://dblp.uni-trier.de/db/journals/mt/

近期必读的六篇 ICML 2020【元学习（Meta Learning）】相关论文

专知会员服务

45+阅读 · 2020年9月25日

史上最全！358篇机器学习&自然语言处理综述论文！都这儿了

专知会员服务

129+阅读 · 2020年7月18日

零样本文本分类，Zero-Shot Learning for Text Classification

专知会员服务

97+阅读 · 2020年5月31日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

167+阅读 · 2020年3月18日