随着机器学习(ML)与人工智能(AI)模型不断深入高风险领域(如医疗保健与科学研究),模型不仅需要具备高精度,还应具备 可解释性 。在现有的可解释方法中, 反事实解释(counterfactual explanation) 通过识别能够改变模型预测结果的最小输入改变量,从而提供更深入的解释性洞见。然而,当前的反事实生成方法仍存在关键性局限,包括 梯度消失 、 潜在空间不连续 ,以及 过度依赖学习到的决策边界与真实决策边界的一致性 等问题。 为克服上述限制,我们提出了一种基于 条件流匹配(conditional flow matching) 的全新反事实解释算法—— LEAPFACTUAL 。该方法能够在真实与学习的决策边界不一致的情况下,生成 可靠且信息丰富的反事实样本 。遵循模型无关(model-agnostic)的设计理念,LEAPFACTUAL不仅适用于具有可微损失函数的模型,还能处理 人类参与式系统(human-in-the-loop systems) ,从而将反事实解释的应用范围扩展到需要人工标注者参与的领域,如 公民科学(citizen science) 。 我们在多个基准与真实世界数据集上进行了大量实验,结果表明:LEAPFACTUAL能够生成 准确且分布内(in-distribution) 的反事实解释,为模型提供 可操作性洞见(actionable insights) 。例如,我们观察到,所生成的与真实标签一致的可靠反事实样本可作为新的训练数据,用于进一步提升模型性能。总体而言,所提出的方法具有广泛的适用性,不仅促进了 科学知识发现 ,也增强了 非专业用户的可解释性理解。

成为VIP会员查看完整内容
0

相关内容

【ICCV2025】《AdsQA:面向广告视频理解》
专知会员服务
8+阅读 · 9月11日
【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应
专知会员服务
15+阅读 · 8月5日
【CVPR2025】基于组合表示移植的图像编辑方法
专知会员服务
8+阅读 · 4月5日
【CVPR2025】CoLLM:面向组合图像检索的大语言模型
【KDD2024】CAFO:基于特征的时间序列分类解释
专知会员服务
25+阅读 · 2024年6月5日
【NeurIPS2022】通过模型转换的可解释强化学习
专知会员服务
38+阅读 · 2022年10月4日
专知会员服务
22+阅读 · 2021年10月8日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【KDD2020】动态知识图谱的多事件预测
专知
88+阅读 · 2020年8月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
484+阅读 · 2023年3月31日
Arxiv
79+阅读 · 2023年3月26日
Arxiv
175+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【ICCV2025】《AdsQA:面向广告视频理解》
专知会员服务
8+阅读 · 9月11日
【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应
专知会员服务
15+阅读 · 8月5日
【CVPR2025】基于组合表示移植的图像编辑方法
专知会员服务
8+阅读 · 4月5日
【CVPR2025】CoLLM:面向组合图像检索的大语言模型
【KDD2024】CAFO:基于特征的时间序列分类解释
专知会员服务
25+阅读 · 2024年6月5日
【NeurIPS2022】通过模型转换的可解释强化学习
专知会员服务
38+阅读 · 2022年10月4日
专知会员服务
22+阅读 · 2021年10月8日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员