视频域泛化旨在通过在源域中训练来学习对未见目标域具有普适性的视频分类模型。视频域泛化的一个关键挑战是在识别目标视频时防御对从源域中提取的特定域线索的过度依赖。为此,我们提议感知视频中的多种时空线索,旨在除特定域线索外发现潜在的域不变线索。我们贡献了一个名为时空多样化网络(STDN)的新模型,它从视频数据的空间和时间维度提高了多样性。首先,我们的STDN提议通过空间分组发现单个帧内的各种类型的空间线索。然后,我们的STDN提议通过时空关系建模在多个时空尺度上明确地建模视频内容之间的时空依赖性。对三种不同类型的基准的大量实验证明了我们方法的有效性和多功能性。 https://arxiv.org/pdf/2310.17942.pdf

成为VIP会员查看完整内容
21

相关内容

【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
专知会员服务
26+阅读 · 2021年10月20日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【CVPR2021】跨模态检索的概率嵌入
专知
17+阅读 · 2021年3月2日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
494+阅读 · 2023年3月31日
Arxiv
81+阅读 · 2023年3月26日
VIP会员
相关VIP内容
【AAAI2023】用于复杂场景图像合成的特征金字塔扩散模型
UTC: 用于视觉对话的任务间对比学习的统一Transformer
专知会员服务
14+阅读 · 2022年5月4日
专知会员服务
26+阅读 · 2021年10月20日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
相关论文
微信扫码咨询专知VIP会员