在 2024 年 2 月 12 日,Stability.Ai 公司发布了新模型 Stable Cascade。
上线了一段时间的新模型,小伙伴们体验感如何呢?这篇文章和你深度聊聊~
模型下载地址:https://pan.baidu.com/s/1U42-Do-sE5HMn2B8R0Lc1g?pwd=ilw1
往期介绍:
新模型 Stable Diffusion 3 与 Stable Cascade 全面解析
大家好,我是花生~ 最近 Stability AI 又接连推出了 2 个新的模型:Stable Diffusion 3 和 Stable Cascade,在图像生成效率和质量上比半年前推出的 SDXL 1.0 有了明显提升,今天就为大家介绍一下 2 款新模型的特点和用法。
Stable Cascade 模型最大的优点是
- 是能生成带有文字的图片,文字出错率相比以前模型少很多;
- 其次是硬件要求降低,甚至与 sd1.5 相比,该架构比之前版本实现了 16 倍的成本降低;
- 最后一大亮点是模型更加理解提示词语义。
这篇文章带大家详细了解 Stable Cascade 模型。最后我整理打包了此模型,「Stable cascade 模型+安装方法+工作流」整套放在了文章最后,伙伴们自行下载~
新模型发布:Stable Cascade 在研究预览中发布,采用三阶段方法,提高了质量、灵活性、微调能力和效率,同时进一步降低了硬件要求。
技术细节:Stable Cascade 包括三个阶段(A、B、C),通过分层压缩图像,实现了使用高度压缩的潜在空间达到显著的输出效果。
训练和微调:提供了针对不同阶段的训练和微调脚本,特别是 Stage C,可以单独进行训练或微调,显著降低成本。
参数规模与效率:Stage C 提供 10 亿与 36 亿参数两种模型,Stage B 提供 7 亿与 15 亿参数两种模型,强调了效率和质量的平衡。