Event data are prevalent in diverse domains such as financial trading, business workflows and industrial IoT nowadays. An event is often characterized by several attributes denoting the meaning associated with the corresponding occurrence time/duration. From traditional operational systems in enterprises to online systems for Web services, event data is generated from physical world uninterruptedly. However, due to the variety and veracity features of Big data, event data generated from heterogeneous and dirty sources could have very different event representations and data quality issues. In this work, we summarize several typical works on studying data quality issues of event data, including: (1) event matching, (2) event error detection, (3) event data repair, and (4) approximate pattern matching.


翻译:事件数据在金融交易、商业工作流程和工业性IoT等不同领域十分普遍,活动的特点往往是若干属性,说明相应的发生时间/时间的相关含义。从企业的传统操作系统到网上网络服务系统,事件数据都是不间断地从实体世界生成的。然而,由于大数据的多样性和真实性特点,来自不同和肮脏来源的事件数据可能会有非常不同的事件表现和数据质量问题。在这项工作中,我们总结了研究事件数据数据质量问题的一些典型工作,包括:(1)事件匹配,(2)事件错误检测,(3)事件数据修复,(4)大致模式匹配。

1
下载
关闭预览

相关内容

机器学习模型安全与隐私研究综述
专知会员服务
113+阅读 · 2020年11月12日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
综述 | 事件抽取及推理 (上)
开放知识图谱
87+阅读 · 2019年1月9日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
Arxiv
36+阅读 · 2019年11月7日
Learning From Positive and Unlabeled Data: A Survey
Arxiv
5+阅读 · 2018年11月12日
Arxiv
5+阅读 · 2017年4月12日
VIP会员
相关资讯
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
人工智能 | SCI期刊专刊信息3条
Call4Papers
5+阅读 · 2019年1月10日
综述 | 事件抽取及推理 (上)
开放知识图谱
87+阅读 · 2019年1月9日
Unsupervised Learning via Meta-Learning
CreateAMind
43+阅读 · 2019年1月3日
相关论文
Arxiv
36+阅读 · 2019年11月7日
Learning From Positive and Unlabeled Data: A Survey
Arxiv
5+阅读 · 2018年11月12日
Arxiv
5+阅读 · 2017年4月12日
Top
微信扫码咨询专知VIP会员