做PPT需要复杂的多模态推理技能,以总结关键概念,并以逻辑和视觉上令人愉悦的方式呈现它们。机器能学会模仿这个费力的过程吗?我们提出了一种新的任务和方法来生成文档到幻灯片。解决这一问题涉及文档摘要、图像和文本检索、幻灯片结构和布局预测,以便以适合展示的形式安排关键元素。我们提出了一个层次序列到序列的方法,以端到端方式解决我们的任务。我们的方法利用文档和幻灯片的固有结构,并结合释义和布局预测模块来生成幻灯片。为了加速这一领域的研究,我们发布了一个关于6K配对文档和幻灯片组的数据集,用于我们的实验。我们证明了我们的方法优于强基线,并产生了具有丰富内容和对齐图像的幻灯片。

https://www.zhuanzhi.ai/paper/3078b811fd7aeb94fd538d646503840e

成为VIP会员查看完整内容
50

相关内容

【NAACL2021】长序列自然语言处理, 250页ppt
专知会员服务
62+阅读 · 2021年6月7日
【CMU博士论文】可控文本生成,附107页pdf与Slides
专知会员服务
57+阅读 · 2021年4月21日
【AAAI2021】生成式Transformer的对比三元组提取
专知会员服务
51+阅读 · 2021年2月7日
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
37+阅读 · 2021年1月24日
专知会员服务
326+阅读 · 2020年11月24日
【教程】如何使用深度学习为照片自动生成文本描述?
GAN生成式对抗网络
20+阅读 · 2017年11月19日
Arxiv
49+阅读 · 2021年9月11日
Arxiv
14+阅读 · 2018年5月15日
VIP会员
相关主题
相关VIP内容
【NAACL2021】长序列自然语言处理, 250页ppt
专知会员服务
62+阅读 · 2021年6月7日
【CMU博士论文】可控文本生成,附107页pdf与Slides
专知会员服务
57+阅读 · 2021年4月21日
【AAAI2021】生成式Transformer的对比三元组提取
专知会员服务
51+阅读 · 2021年2月7日
【AAAI2021】时间关系建模与自监督的动作分割
专知会员服务
37+阅读 · 2021年1月24日
专知会员服务
326+阅读 · 2020年11月24日
相关论文
Arxiv
49+阅读 · 2021年9月11日
Arxiv
14+阅读 · 2018年5月15日
微信扫码咨询专知VIP会员