Stability AI 推出 Stable Diffusion XL Turbo 模型
来源:搜狐
时间:2023-11-30 18:42:12 326浏览 收藏
学习科技周边要努力,但是不要急!今天的这篇文章《Stability AI 推出 Stable Diffusion XL Turbo 模型》将会介绍到等等知识点,如果你想深入学习科技周边,可以关注我!我会持续更新相关文章的,希望对大家都能有所帮助!
IT之家于11月30日报道,Stability AI最近推出了Stable Diffusion XL Turbo(SDXL Turbo),这是之前SDXL模型的改进版本。据称,SDXL Turbo采用了“对抗性扩散蒸馏技术(Adversarial Diffusion Distillation)”,使得图片生成的迭代步骤从原来的50步减少到了1步,据称“只需进行一次迭代步骤即可生成高品质图像”
据悉,Stable Diffusion XL Turbo 模型的最大特点,就是上述“一次迭代生成图像”,号称可以进行“即时文字转图像输出”,并能够保证图片的质量。
需要进行改写的是:其中一项被称为“对抗性扩散蒸馏技术”,它是利用现有的大型图像扩散模型作为“教师网络”,指导生成过程的技术。这项技术结合了“蒸馏技术”和“对抗训练”,其中“蒸馏技术”是指将大型模型的知识浓缩到更小的模型中,以精简模型的输出。而对抗性训练可以改进模型,使其能够更好地模仿教师模型的输出
此前的模型蒸馏技术难以兼顾效率和品质,这是因为快速采样通常会削弱输出品质,因此本次 Stable Diffusion XL Turbo 模型在通过“对抗性扩散蒸馏技术”在高效生成高品质图像方面,是一个重要的进步。
官方将 Stable Diffusion XL Turbo 与多个不同的模型变体进行比较,包括 StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL,并进行了两项实验,第一个实验要求模型评估人员随机查看两项模型的输出,并选择出其中最符合提示词的输出图像,第二项实验则与第一项实验执行大致相同,模型评估要求选择模型中输出者图像品质最佳的一方。
▲ 图片来源于 Stability AI 博客
经实验结果显示,Stable Diffusion XL Turbo 能够在显著降低计算需求的同时,依然保持出色的图像生成质量。相较于经过 4 次迭代的 LCM-XL,该模型仅需一次迭代即可超越。而经过 4 次迭代的 Stable Diffusion XL Turbo 则可轻松击败之前需要经过 50 次迭代配置的 Stable Diffusion XL。在使用 A100 GPU 进行 512x512 分辨率的图像计算时,仅需 207 毫秒即可完成
IT之家注意到,目前 Stability AI 已经将相关代码公布在 Hugging Face,供个人和非商业用途使用,感兴趣的小伙伴们可以点此访问。
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
207 收藏
-
118 收藏
-
252 收藏
-
380 收藏
-
397 收藏
-
299 收藏
-
204 收藏
-
203 收藏
-
159 收藏
-
221 收藏
-
193 收藏
-
485 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习