Stability AI 开源 Stable Diffusion，基于文本生成图像的 AI 模型 - 代码天地

Stability AI 开源 Stable Diffusion，基于文本生成图像的 AI 模型

业界资讯 2022-08-15 20:00:23 阅读次数: 0

从文本描述生成图像的人工智能自 2021 年初以来一直在快速发展。从 OpenAI 的 DALL-E 1 和 CLIP ，到 2022 年发布的DALL-E 2，谷歌推出了 Imagen 和 Parti，而 Craiyon 的 AI 图像在社交媒体已然泛滥。

而近日，Stability AI 宣布发布 Stable Diffusion，Stability AI 成立于 2020 年，旨在培育开源 AI 研究社区。此次开源的 Stable Diffusion 是 Stability AI、RunwayML、LMU Munich、EleutherAI 和 LAION 等知名 AI 实验室的研究人员合作的结果。

Stable Diffusion 是一个类似 DALL-E 2 的系统，可以从文本描述生成对应的图像。目前相关代码和经过训练的模型都在 GitHub 上开源，还有一个带有 Web 界面的托管版本可供用户测试。

Stable Diffusion 在 LAION-5B 数据库子集的 512x512 图像上训练潜在扩散模型，并使用 CLIP ViT-L/14 文本编码器来根据文本提示调整训练模型。凭借其 860M UNet 和 123M 文本编码器，该模型相对轻量级，但硬件方面最低也要 10GB VRAM 的 GPU。

与 DALL-E 2 不同，Stable Diffusion 的限制更宽松，它可以生成 DALL-E 2 中禁止的名人图像和其他敏感主题的图像。当然，Midjourney 或 Pixelz.ai 等其他 AI 系统也可以做到这一点，但它们无法达到 Stable Diffusion 中的高度多样性。此外，其他系统都不是开源的。

（下图为网友使用 Stable Diffusion 训练的“DALL-E 2 禁止的名人图像”）

除了基于文本生成图像，Stable Diffusion 还能修复图像，比如小朋友随便画一张草图，能修复成大师级油画。

输入：

输出：

相关论文：High-Resolution Image Synthesis with Latent Diffusion Models（具有潜在扩散模型的高分辨率图像合成）

猜你喜欢

转载自www.oschina.net/news/206691/stable-diffusion-open-sources

Stability AI 开源 Stable Diffusion，基于文本生成图像的 AI 模型

Stability AI 开源视频生成模型 Stable Video Diffusion

Stability AI推出Stable Diffusion XL 1.0，文本到图像模型

Stability AI发布基于稳定扩散的音频生成模型Stable Audio

Stability.ai开源ChatGPT基因的大模型

再炸AI绘图圈：2秒文成图，最快的移动端Stable Diffusion模型；Stability AI推出Uncrop Clipdrop更新一键扩图

Stability AI 发布最新语言模型：Stable LM 3B

IDPChat：探索基于LLaMA和Stable Diffusion的「开源」中文多模态AI大模型

Stability AI 发布 StableStudio，DreamStudio 的开源版本

AI图像（AIGC for PIC）大模型实战|Stable Diffusion

Stable Diffusion 图片生成AI模型 Windows Mac部署指南

Stable Diffusion Online：AI图像生成工具

AI绘画Stable Diffusion

刷新AI作图速度，最快的开源Stable Diffusion出炉

开源风暴吞噬AI界？从Stable Diffusion的爆火说起

Window下部署使用Stable Diffusion AI开源项目绘图

Stable Diffusion 多租户开源框架AI8

Stable Diffusion"偷"代码建起10亿美元帝国？Stability AI创始人骗局被扒皮

【Blender】Stability AI插件 - AI生成图像和动画

Stable Video Diffusion重磅发布：基于稳定扩散模型的AI生成视频

Stable Doodle：Stability AI推出的一款零门槛AI绘画神器

AI 绘画 stable diffusion webui 常见模型汇总及简介

每周 AI 和 NLP 新闻 2023 年 8月1日：Stack Overflow 宣布推出 OverflowAI、Stability AI 发布 Stable Diffusion XL 1.0

Stability AI，新人工智能背景下的开源先锋

Stability AI发布FreeWilly系列开源LLM，实力不输ChatGPT

【stability.ai】SDXL：改进高分辨率图像合成的潜在扩散模型

Stable Diffusion AI绘图教学

要点初见：开源AI绘画工具Stable Diffusion代码分析（文本转图像）、论文介绍（下）

要点初见：开源AI绘画工具Stable Diffusion代码分析（文本转图像）、论文介绍（上）

[AI绘图教程]stable-diffusion webui加载模型与插件. 实战AI绘画

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)