Stability AI 提供对 Stable Diffusion 模型家族的 API 访问——这些是开源的文本生成图像基础模型。REST API 覆盖文本生成图像、图像生成图像、修复、放大和视频生成。Stable Diffusion 3.5 Large 提供媲美商业模型的照片级真实质量。基于积分的定价对于大批量使用来说非常经济。Stable Diffusion 的开源特性还使其能够通过如 Automatic1111 等平台独特地在本地部署。广泛应用于游戏、电商、营销和开发者工具。
API 详情
类别
常见问题
Stability AI 提供 Stable Diffusion 3.5(最新旗舰版)、SDXL 1.0(强大的通用型)、SD 1.6(轻量级)、Stable Video Diffusion(视频生成)以及 Stable Audio(音乐/音频生成)。所有模型均可通过 Stability AI REST API 使用,按每张图片或每秒计费。
Stability AI 托管的 API 并非免费——它采用积分系统,您需要购买积分($10 = 1,000 积分;大多数图片消耗 3–6 积分)。但 Stable Diffusion 模型本身是开源的,可以免费在本地运行。使用 ComfyUI、Automatic1111 或 InvokeAI,您可以在自己的硬件上无限制生成图片。
Stability AI 提供更多灵活性——支持自定义宽高比、修补(inpainting)、扩图(outpainting)、图生图、ControlNet 以及 LoRA 微调。DALL-E 3 在提示词遵循和图片中文字方面表现更好,但灵活性较低。由于成本更低且开源,Stability AI 更适合创意工作流、角色一致性和大批量生成。
可以。Stable Diffusion 支持 LoRA(低秩适应)和 DreamBooth 微调,可以生成特定风格、特定人物或自定义产品的图片。这是相较于 DALL-E 3 的一大优势。微调可以在本地完成,也可以通过 Replicate、RunPod 或 Stability AI 自有的微调 API 等服务完成。
