Text generation systems are ubiquitous in natural language processing applications. However, evaluation of these systems remains a challenge, especially in multilingual settings. In this paper, we propose L'AMBRE -- a metric to evaluate the morphosyntactic well-formedness of text using its dependency parse and morphosyntactic rules of the language. We present a way to automatically extract various rules governing morphosyntax directly from dependency treebanks. To tackle the noisy outputs from text generation systems, we propose a simple methodology to train robust parsers. We show the effectiveness of our metric on the task of machine translation through a diachronic study of systems translating into morphologically-rich languages.


翻译:在自然语言处理应用程序中,产生文本的系统是普遍存在的。然而,对这些系统的评估仍然是个挑战,特别是在多语种环境中。在本文中,我们提议L'AMBRE -- -- 使用其依赖性分析法和该语言的形态分析法规则来评价文本的形态化完善性。我们提出了一个方法,可以直接从依赖性树库中自动提取关于形态化法的各种规则。为了解决文本生成系统产生的噪音,我们提议了一个简单的方法来培训强大的分析员。我们通过对形态化语言转换系统进行对等时间化研究,展示了我们机器翻译任务衡量标准的有效性。

0
下载
关闭预览

相关内容

机器翻译(Machine Translation)涵盖计算语言学和语言工程的所有分支,包含多语言方面。特色论文涵盖理论,描述或计算方面的任何下列主题:双语和多语语料库的编写和使用,计算机辅助语言教学,非罗马字符集的计算含义,连接主义翻译方法,对比语言学等。 官网地址:http://dblp.uni-trier.de/db/journals/mt/
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
【ACL2020放榜!】事件抽取、关系抽取、NER、Few-Shot 相关论文整理
深度学习自然语言处理
18+阅读 · 2020年5月22日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
stackGAN通过文字描述生成图片的V2项目
CreateAMind
3+阅读 · 2018年1月1日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
VIP会员
Top
微信扫码咨询专知VIP会员