用于扩散模型微调的迭代倾斜方法 (Iterative Tilting for Diffusion Fine-Tuning) - 专知论文

会员服务 ·

0

模型微调 · 微调 · 扩散模型 · 梯度 · 分解 ·

Iterative Tilting for Diffusion Fine-Tuning

翻译：用于扩散模型微调的迭代倾斜方法

Jean Pachebat,Giovanni Conforti,Alain Durmus,Yazid Janati

from arxiv, 14 pages

We introduce iterative tilting, a gradient-free method for fine-tuning diffusion models toward reward-tilted distributions. The method decomposes a large reward tilt $\exp(λr)$ into $N$ sequential smaller tilts, each admitting a tractable score update via first-order Taylor expansion. This requires only forward evaluations of the reward function and avoids backpropagating through sampling chains. We validate on a two-dimensional Gaussian mixture with linear reward, where the exact tilted distribution is available in closed form.

翻译：我们提出了迭代倾斜方法，这是一种无需梯度的扩散模型微调技术，旨在使模型向奖励倾斜分布对齐。该方法将较大的奖励倾斜项 $\\exp(\\lambda r)$ 分解为 $N$ 个连续的小倾斜步骤，每一步通过一阶泰勒展开获得可处理的分数更新。该方法仅需对奖励函数进行前向计算，避免了在采样链中进行反向传播。我们在具有线性奖励的二维高斯混合模型上进行了验证，该场景下精确的倾斜分布具有闭式解。

0

相关内容

模型微调

【ICML2025】免费的Fisher？通过回收平方梯度累加器近似Fisher信息矩阵

【ICML2025】免费的Fisher？通过回收平方梯度累加器近似Fisher信息矩阵

专知会员服务

12+阅读 · 7月28日

UnHiPPO：面向不确定性的状态空间模型初始化方法

UnHiPPO：面向不确定性的状态空间模型初始化方法

专知会员服务

11+阅读 · 6月6日

【NeurIPS2022】黎曼扩散模型

【NeurIPS2022】黎曼扩散模型

专知会员服务

42+阅读 · 2022年9月15日

NeurIPS 2021 | 寻找用于变分布泛化的隐式因果因子

NeurIPS 2021 | 寻找用于变分布泛化的隐式因果因子

专知会员服务

17+阅读 · 2021年12月7日

【ICML2021】随机傅立叶特征的量化算法

专知会员服务

25+阅读 · 2021年7月31日

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

19+阅读 · 2021年3月28日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

图节点嵌入(Node Embeddings)概述，9页pdf

图节点嵌入(Node Embeddings)概述，9页pdf

专知

15+阅读 · 2020年8月22日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

基于径向基函数无网格离散的快速多水平算法

国家自然科学基金

0+阅读 · 2015年12月31日

Schr？dinger-Poisson方程守恒DDG方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

光滑函数类的熵数估计

国家自然科学基金

0+阅读 · 2015年12月31日

一般误差分布下若干半参数模型的复合分位数方法

国家自然科学基金

0+阅读 · 2014年12月31日

Poisson流形上的修正Hamilton方法

国家自然科学基金

0+阅读 · 2014年12月31日

Optimization and Regularization Under Arbitrary Objectives

Arxiv

0+阅读 · 11月24日

An improved approximation algorithm for k-Median

Arxiv

0+阅读 · 11月15日

A Provably-Correct and Robust Convex Model for Smooth Separable NMF

Arxiv

0+阅读 · 11月10日

A Spectral LOD Method for Multiscale Problems with High Contrast

Arxiv

0+阅读 · 11月8日

Beyond State Space Representation: A General Theory for Kernel Packets

Arxiv

0+阅读 · 11月6日

VIP会员

文章信息

相关主题

相关VIP内容

【ICML2025】免费的Fisher？通过回收平方梯度累加器近似Fisher信息矩阵

【ICML2025】免费的Fisher？通过回收平方梯度累加器近似Fisher信息矩阵

专知会员服务

12+阅读 · 7月28日

UnHiPPO：面向不确定性的状态空间模型初始化方法

UnHiPPO：面向不确定性的状态空间模型初始化方法

专知会员服务

11+阅读 · 6月6日

【NeurIPS2022】黎曼扩散模型

【NeurIPS2022】黎曼扩散模型

专知会员服务

42+阅读 · 2022年9月15日

NeurIPS 2021 | 寻找用于变分布泛化的隐式因果因子

NeurIPS 2021 | 寻找用于变分布泛化的隐式因果因子

专知会员服务

17+阅读 · 2021年12月7日

【ICML2021】随机傅立叶特征的量化算法

专知会员服务

25+阅读 · 2021年7月31日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】面向真实世界音视联合语音识别的可扩展框架

《通过仿真与开源数据提升战略决策：机遇与局限》最新报告

【AAAI2026】善始则事半功倍：基于前缀优化的大语言模型推理强化学习

评估大语言模型在科学发现中的作用

相关资讯

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

【CVPR2021】CausalVAE: 引入因果结构的解耦表示学习

专知

19+阅读 · 2021年3月28日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

图节点嵌入(Node Embeddings)概述，9页pdf

图节点嵌入(Node Embeddings)概述，9页pdf

专知

15+阅读 · 2020年8月22日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

13+阅读 · 2020年4月1日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

相关论文

Optimization and Regularization Under Arbitrary Objectives

Arxiv

0+阅读 · 11月24日

An improved approximation algorithm for k-Median

Arxiv

0+阅读 · 11月15日

A Provably-Correct and Robust Convex Model for Smooth Separable NMF

Arxiv

0+阅读 · 11月10日

A Spectral LOD Method for Multiscale Problems with High Contrast

Arxiv

0+阅读 · 11月8日

Beyond State Space Representation: A General Theory for Kernel Packets

Arxiv

0+阅读 · 11月6日

相关基金

基于径向基函数无网格离散的快速多水平算法

国家自然科学基金

0+阅读 · 2015年12月31日

Schr？dinger-Poisson方程守恒DDG方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

光滑函数类的熵数估计

国家自然科学基金

0+阅读 · 2015年12月31日

一般误差分布下若干半参数模型的复合分位数方法

国家自然科学基金

0+阅读 · 2014年12月31日

Poisson流形上的修正Hamilton方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员