成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
1
【直播】清华 ACL 2020 长文:知识驱动的中文多轮对话数据集
2020 年 5 月 8 日
AI科技评论
ACL 2020 高校实验室系列直播
第三期·第三场
知识驱动的对话系统,由于缺少包含多话题的、带有知识标注的多轮对话数据集,在很大程度上会受到限制。
针对这一问题,清华大学交互式人工智能(CoAI)组周昊等人在发表于 ACL 2020 的论文《
KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation
》中,提出了一个中文多领域知识驱动的对话数据集KdConv,
它将多轮对话中的话题转化为了知识图谱
。
这个语料库包含来自三个领域(电影、音乐和旅行)的4.5K个对话,以及平均轮次为19.0,总共86k 条语句。这些对话包括相关话题的深入讨论和多个话题之间的自然过渡。
KdConv在音乐领域的一个样本
为了便于后续对该语料库的研究,作者还提供了几个基准模型。比较结果表明:
1)引入背景知识可以增强模型,但利用知识对多轮对话建模仍有很大的研究空间;
2)不同领域之间存在明显的性能差异,值得进一步探讨迁移学习和域适应问题。
语料库和基准模型现已公开。
论文链接:
https://arxiv.org/pdf/2004.04100.pdf
语料库链接:
https://github.com/thu-coai/KdConv
AI 科技评论邀请论文一作
周昊
来给我们详细讲解其研究过程及语料库细节。
主题:
KdConv:
知识驱动的中文
多
轮
对话
数据集
主讲人:周昊
清华大学计算机系201
6
级
博
士生,
交互式人工智能(CoAI)组成员,师从朱小燕教授。主要研究方向为对话系统,
在
ACL、
AAAI、IJCAI
、WWW
等
国际
会议发表
论文
数篇。
时间:
2020年5月8日(周五)晚20:00整
分享提纲:
1、知识驱动的多轮对话数据集概述
2、KdConv数据集的统计指标与构造方法
3、Baseline模型的性能分析
4、知识驱动的多轮对话竞赛简介
直播/回放地址:
https://mooc.yanxishe.com/open/course/814
(回放一般在直播后1~2个工作日)
入群获取资料及更多直播预告——
扫码关注[ AI研习社顶会小助手] 微信号,发送关键字“ACL 2020+直播”,即可进群观看直播和获取课程资料。
更多直播:
ACL 2020原定于2020年7月5日至10日在美国华盛顿西雅图举行,因新冠肺炎疫情改为线上会议。为促进学术交流,方便国内师生提早了解自然语言处理(NLP)前沿研究,AI 科技评论将推出「ACL 实验室系列论文解读」内容,同时欢迎更多实验室参与分享,敬请期待!
点击"阅读原文",直达“ACL 交流小组”了解更多会议信息。
登录查看更多
点赞并收藏
1
暂时没有读者
3
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
知识驱动
关注
0
ACL2020接受论文列表公布,571篇长文208篇短文
专知会员服务
67+阅读 · 2020年5月19日
近期必读的五篇顶会ACL 2020【图神经网络 (GNN) 】相关论文
专知会员服务
81+阅读 · 2020年5月5日
自然语言处理顶会ACL2020放榜了,你的论文中了吗?因新冠将在线举办
专知会员服务
36+阅读 · 2020年4月5日
【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型(A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data)
专知会员服务
29+阅读 · 2019年11月15日
六篇 EMNLP 2019【图神经网络(GNN)+NLP】相关论文
专知会员服务
72+阅读 · 2019年11月3日
【EMNLP2019】最新5篇论文推荐,BERT,对话系统,知识图谱,注意力机制等
专知
32+阅读 · 2019年8月17日
ACL 2019 接收论文榜单发布,我们做了可视化分析
机器之心
17+阅读 · 2019年6月13日
【干货】ACL 2018 鲁棒、无偏的NLP训练方法
专知
4+阅读 · 2018年7月25日
干货 | 为你解读34篇ACL论文
数据派THU
8+阅读 · 2018年6月7日
大会 | 清华对话式人工智能课题组六篇长文被ACL、IJCAI-ECAI录用
AI科技评论
10+阅读 · 2018年4月25日
Story Realization: Expanding Plot Events into Sentences
Arxiv
3+阅读 · 2019年9月8日
Eliciting Knowledge from Experts:Automatic Transcript Parsing for Cognitive Task Analysis
Arxiv
3+阅读 · 2019年6月26日
A BERT Baseline for the Natural Questions
Arxiv
8+阅读 · 2019年3月21日
Unsupervised Multilingual Word Embeddings
Arxiv
4+阅读 · 2018年9月6日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
知识驱动
多轮对话
ACL 2020
ACL
数据集
语料库
相关VIP内容
ACL2020接受论文列表公布,571篇长文208篇短文
专知会员服务
67+阅读 · 2020年5月19日
近期必读的五篇顶会ACL 2020【图神经网络 (GNN) 】相关论文
专知会员服务
81+阅读 · 2020年5月5日
自然语言处理顶会ACL2020放榜了,你的论文中了吗?因新冠将在线举办
专知会员服务
36+阅读 · 2020年4月5日
【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型(A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data)
专知会员服务
29+阅读 · 2019年11月15日
六篇 EMNLP 2019【图神经网络(GNN)+NLP】相关论文
专知会员服务
72+阅读 · 2019年11月3日
热门VIP内容
开通专知VIP会员 享更多权益服务
大语言模型中的事件抽取:方法、模态与未来展望的全面综述
美海军作战管理系统:变革战场空间的二十年
【MIT博士论文】以语言为中心的医学影像理解
俄罗斯“沙希德”/“天竺葵”攻击无人机
相关资讯
【EMNLP2019】最新5篇论文推荐,BERT,对话系统,知识图谱,注意力机制等
专知
32+阅读 · 2019年8月17日
ACL 2019 接收论文榜单发布,我们做了可视化分析
机器之心
17+阅读 · 2019年6月13日
【干货】ACL 2018 鲁棒、无偏的NLP训练方法
专知
4+阅读 · 2018年7月25日
干货 | 为你解读34篇ACL论文
数据派THU
8+阅读 · 2018年6月7日
大会 | 清华对话式人工智能课题组六篇长文被ACL、IJCAI-ECAI录用
AI科技评论
10+阅读 · 2018年4月25日
相关论文
Story Realization: Expanding Plot Events into Sentences
Arxiv
3+阅读 · 2019年9月8日
Eliciting Knowledge from Experts:Automatic Transcript Parsing for Cognitive Task Analysis
Arxiv
3+阅读 · 2019年6月26日
A BERT Baseline for the Natural Questions
Arxiv
8+阅读 · 2019年3月21日
Unsupervised Multilingual Word Embeddings
Arxiv
4+阅读 · 2018年9月6日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
大家都在搜
Palantir
蓝牙安全攻防
大型语言模型
多域作战
基础模型
机场
反恐
朱克爱德华兹家族
智能座舱
从传统方法到深度学习—— bilateral filter 到 HDRNet的演进
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top