CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
来源:机器之心
时间:2024-04-09 12:09:21 446浏览 收藏
亲爱的编程学习爱好者,如果你点开了这篇文章,说明你对《CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题》很感兴趣。本篇文章就来给大家详细解析一下,主要介绍一下,希望所有认真读完的童鞋们,都有实质性的提高。

为扩散模型的训练样本,训练样本的分布可以表示为:

,
,
,
随着时间单调的从 1 变化到 0。考虑到刚刚定义的训练样本分布,
的单时刻边际概率密度可以表示为:
由此,可以通过贝叶斯公式计算逆过程的条件分布:

然而,经过的分布是混合高斯分布,难以用网络进行拟合。因此,主流的扩散模型通常假设这一分布可以由单个高斯分布拟合。

为了验证这一假设,该研究在 Proposition 1 中估计了这一拟合的误差。
也将趋近于 1,误差无法忽略。因此,Proposition 1 并不能证明 t=1 时的逆向高斯特性。为了解决这一问题,该研究给出了新的命题:
将趋近于 0。由此,该研究证明了包含奇点时刻的逆过程全过程都符合高斯特性。
=0,下面的采样公式将出现分母除 0 的情况:

,使用 「x - 预测」,来解决的初始奇点处的采样问题。
。这样的奇异性会使得采样过程收敛到正确的数据
上。因此,t=0 处的奇点是扩散模型良好的性质,并不需要规避。

SingDiffuion 的算法如下图所示:

,该方法训练了一个 Unet
来拟合
。损失函数表示为:
采样
。
符合 1-ε 时刻的数据分布
,从而解决了平均灰度问题。在这一步骤之后,就可以使用预训练的模型执行后续的采样步骤,直到生成
。值得注意的是,由于该方法仅参与第一步的采样,与后续的采样过程无关,因此 SingDiffusion 可以应用在绝大多数已有的扩散模型中。另外,为了避免无分类器指导操作导致的数据溢出问题,该方法还使用了以下的归一化操作:





可以看出,该研究所提出的方法仅需进行一次训练,即可轻松地应用到已有的扩散模型中,解决平均灰度问题。

从结果中可以看出,该方法能有效解决 ControlNet 的平均灰度问题。
到这里,我们也就讲完了《CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于工程的知识点!
声明:本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
474 收藏
-
301 收藏
-
482 收藏
-
277 收藏
-
409 收藏
-
379 收藏
-
403 收藏
-
213 收藏
-
281 收藏
-
147 收藏
-
355 收藏
-
190 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习