大规模文本到图像扩散模型,如DALL-E 2,Imagen和Stable Diffusion,在文本到图像生成任务上取得了相当大的成功。然而,它们仅提供有限的灵活性和可控性,仅通过文本进行条件控制,对最终用户来说有所不足。为了提高这种自由度,我们需要更好地调整生成过程的方法。本演讲将讨论一些最有前景和有效的方法,用于控制文本到图像扩散模型。这些方法将包括训练时和推断时技术的混合应用。

成为VIP会员查看完整内容
31

相关内容

国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
Arxiv
174+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
494+阅读 · 2023年3月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
29+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
相关论文
微信扫码咨询专知VIP会员