模型编辑旨在在无需重新训练的前提下,修正大型语言模型(LLMs)中的错误知识、更新过时信息并融入新数据。该任务在终身学习场景中尤为具有挑战性,因为编辑操作需要持续进行,以满足真实世界应用的需求。尽管部分编辑方法在纯语言模型中展现出较强的稳健性,但视觉语言模型(Vision LLMs, VLLMs)由于引入了视觉模态,无法直接适配现有的语言模型编辑器。

为弥合终身LLM编辑与VLLM之间的差距,本文提出LiveEdit,一种用于终身VLLM知识编辑的新方法。我们首先训练一个“编辑专家生成器”,能够为每次编辑实例独立生成低秩专家,旨在修正VLLM的相关输出响应。为此,我们设计了一种硬过滤机制,利用视觉语义知识在推理阶段粗略剔除与输入查询视觉无关的专家。随后,我们引入一种基于文本语义相关性的软路由机制,以融合多个视觉相关专家,从而实现多专家信息整合。

为评估方法有效性,我们构建了一个用于终身VLLM编辑的基准测试集。大量实验证明,LiveEdit在终身VLLM编辑任务中具有显著优势,进一步实验也验证了各模块设计的合理性与有效性。

https://arxiv.org/pdf/2411.15432

成为VIP会员查看完整内容
14

相关内容

【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
46+阅读 · 2022年7月10日
专知会员服务
30+阅读 · 2020年9月18日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
494+阅读 · 2023年3月31日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
相关资讯
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
相关论文
微信扫码咨询专知VIP会员