模态是指事物发生或存在的方式,如文字、语言、声音、图形等。多模态学习是指学习多个模态中各个模态的信息,并且实现各个模态的信息的交流和转换。多模态深度学习是指建立可以完成多模态学习任务的神经网络模型。多模态学习的普遍性和深度学习的热度赋予了多模态深度学习鲜活的生命力和发展潜力。旨在多模态深度学习的发展前期,总结当前的多模态深度学习,发现在不同的多模态组合和学习目标下,多模态深度学习实现过程中的共有问题,并对共有问题进行分类,叙述解决各类问题的方法。具体来说,从涉及自然语言、视觉、听觉的多模态学习中考虑了语言翻译、事件探测、信息描述、情绪识别、声音识别和合成,以及多媒体检索等方面研究,将多模态深度学习实现过程中的共有问题分为模态表示、模态传译、模态融合和模态对齐四类,并对各问题进行子分类和论述,同时列举了为解决各问题产生的神经网络模型。最后论述了实际多模态系统,多模态深度学习研究中常用的数据集和评判标准,并展望了多模态深度学习的发展趋势。

成为VIP会员查看完整内容
220

相关内容

最新《多任务学习》综述,39页pdf
专知会员服务
266+阅读 · 2020年7月10日
专知会员服务
235+阅读 · 2020年5月6日
专知会员服务
157+阅读 · 2020年4月21日
Graph Neural Networks 综述
计算机视觉life
30+阅读 · 2019年8月13日
人工智能顶刊TPAMI2019最新《多模态机器学习综述》
人工智能学家
29+阅读 · 2019年1月19日
Arxiv
15+阅读 · 2019年6月25日
Arxiv
136+阅读 · 2018年10月8日
Deep Learning for Generic Object Detection: A Survey
Arxiv
14+阅读 · 2018年9月6日
Arxiv
4+阅读 · 2018年3月30日
VIP会员
相关VIP内容
最新《多任务学习》综述,39页pdf
专知会员服务
266+阅读 · 2020年7月10日
专知会员服务
235+阅读 · 2020年5月6日
专知会员服务
157+阅读 · 2020年4月21日
相关论文
Arxiv
15+阅读 · 2019年6月25日
Arxiv
136+阅读 · 2018年10月8日
Deep Learning for Generic Object Detection: A Survey
Arxiv
14+阅读 · 2018年9月6日
Arxiv
4+阅读 · 2018年3月30日
微信扫码咨询专知VIP会员