多标签文本分类涉及到从标签集中为每个给定文档分配其最相关标签的问题。通常,给定文档的元数据和标签的层次结构在实际应用是可用的。然而,现有的研究大多只关注于文本信息的建模,也有少数尝试使用元数据或层次信号,但没有同时使用它们。在本文中,我们通过在一个大的标签层次结构(例如,有成千上万个标签)中形式化元数据感知文本分类的问题来弥补这一差距。为了解决这个问题,我们提出了MATCH解决方案——一个利用元数据和层次结构信息的端到端框架。为了整合元数据,我们预先训练文本和元数据在同一空间的嵌入,并利用完全连接的注意力来捕捉它们之间的相互关系。为了充分利用标签层次结构,我们提出了不同的方法来规整每个子标签的参数和输出概率。在两个具有大规模标签层次的大规模文本数据集上进行的大量实验证明了在最先进的深度学习基线上匹配的有效性。

https://www.zhuanzhi.ai/paper/f6f0aa93aec55dee2e115f8c40147b79

成为VIP会员查看完整内容
17

相关内容

专知会员服务
33+阅读 · 2021年4月6日
专知会员服务
40+阅读 · 2021年4月5日
【WWW2021】兴趣感知消息传递图卷积神经网络的推荐
专知会员服务
45+阅读 · 2021年2月23日
【WWW2021】充分利用层级结构进行自监督分类法扩展
专知会员服务
16+阅读 · 2021年2月7日
【WSDM2021】弱监督下的分层元数据感知文档分类
专知会员服务
11+阅读 · 2020年11月16日
一文综述经典的深度文本分类方法
AI100
12+阅读 · 2019年6月8日
通过时空模型迁移学习的无监督的跨数据集行人重新识别
统计学习与视觉计算组
8+阅读 · 2018年10月23日
如何匹配两段文本的语义?
黑龙江大学自然语言处理实验室
7+阅读 · 2018年7月21日
Few-shot Learning: A Survey
Arxiv
363+阅读 · 2019年4月10日
Next Item Recommendation with Self-Attention
Arxiv
5+阅读 · 2018年8月25日
Arxiv
5+阅读 · 2017年4月12日
VIP会员
相关VIP内容
专知会员服务
33+阅读 · 2021年4月6日
专知会员服务
40+阅读 · 2021年4月5日
【WWW2021】兴趣感知消息传递图卷积神经网络的推荐
专知会员服务
45+阅读 · 2021年2月23日
【WWW2021】充分利用层级结构进行自监督分类法扩展
专知会员服务
16+阅读 · 2021年2月7日
【WSDM2021】弱监督下的分层元数据感知文档分类
专知会员服务
11+阅读 · 2020年11月16日
相关资讯
一文综述经典的深度文本分类方法
AI100
12+阅读 · 2019年6月8日
通过时空模型迁移学习的无监督的跨数据集行人重新识别
统计学习与视觉计算组
8+阅读 · 2018年10月23日
如何匹配两段文本的语义?
黑龙江大学自然语言处理实验室
7+阅读 · 2018年7月21日
相关论文
Few-shot Learning: A Survey
Arxiv
363+阅读 · 2019年4月10日
Next Item Recommendation with Self-Attention
Arxiv
5+阅读 · 2018年8月25日
Arxiv
5+阅读 · 2017年4月12日
微信扫码咨询专知VIP会员