时间序列数据是众多高影响力领域(包括医疗健康、电子商务与教育)的基础组成部分。尽管其在实际应用中极为普遍,但由于其固有的结构复杂性,对真实世界时间序列的建模仍然面临诸多挑战。观测值可能存在缺失或采样不规律、数据分布可能在不同领域间发生漂移,而原始输入往往与任务的预测或决策目标存在错配。这些问题削弱了标准深度学习方法的可靠性、泛化性与可解释性。

本论文针对这些真实世界约束,提出了一系列旨在推进时间序列建模的方法。首先,我们通过概率模型来推断潜在的时间动态,以应对缺失与不规则时间间隔等结构性问题。在重症监护领域中,我们提出了一种可在患者数据不完整的情况下进行实时风险评估的建模框架。随后,我们将相同的建模原理扩展至电子商务的用户行为建模中,捕获长期依赖与隐藏行为阶段,从而预测用户流失并实现及时干预。

接着,我们探讨了时间序列模型在不同领域(人口特征、上下文或测量方式不同)之间的泛化能力。为此,我们提出了一种对比学习框架,通过跨领域对齐共享语义来学习领域不变表示。该方法支持多变量时间序列的无监督领域自适应,并在目标领域标签缺失的场景下取得显著性能提升。

随后,我们聚焦于提升时间序列输入本身的质量。在许多教育平台中,学生的学习历史通常表示为题目编号序列,这类输入缺乏语义信息。我们提出了一种框架,通过自动为题目标注可解释的知识概念并利用对比学习目标学习其表示,从而丰富输入语义。当该方法集成到现有学生学习建模体系中时,显著提升了预测精度。 最后,我们展示了改进的时间序列建模如何支持更复杂与交互式的任务。基于前述进展,我们开发了一个基于强化学习的个性化学习内容推荐系统。该系统通过模拟学生对未见题目的响应,并以语义表示为决策基础,从而实现可扩展且自适应的教学策略。

综合而言,这些研究贡献提出了一种结构化的时间序列建模视角,使模型能够在数据缺失、不规则事件时间、跨领域变化等条件下保持鲁棒性,并通过语义结构实现增强。通过应对阻碍时间序列模型实际部署的核心挑战,本论文为发展智能、具备上下文感知能力的序列系统提供了方法论工具与概念性洞见。希望本研究能够为机器学习与真实世界时间序列应用交叉领域的进一步探索奠定基础。

成为VIP会员查看完整内容
1

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【NUS博士论文】视频语义理解中的因果模型
专知会员服务
36+阅读 · 2024年10月30日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
172+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
489+阅读 · 2023年3月31日
Arxiv
177+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员