DALL-E 3 是 OpenAI 的旗舰图像生成模型,直接集成在 OpenAI API 中。它能够根据文本描述生成高度细致、逼真且具有艺术感的图像,对提示的遵循度极高——这是对 DALL-E 2 的重大改进。定价按图像质量和尺寸收费(标准 1024×1024 图像为 $0.040)。支持图像修补、扩展和变体生成功能。与 ChatGPT Plus 原生集成,广泛易用。非常适合开发内容创作工具、营销平台和创意应用的开发者。
API 详情
类别
常见问题
DALL-E 3 的定价取决于质量和尺寸。标准质量 1024×1024 的价格为每张图片 $0.040。高清质量 1024×1024 的价格为每张图片 $0.080。更大尺寸(1792×1024 或 1024×1792)标准质量为每张图片 $0.080,高清质量为每张图片 $0.120。没有订阅费——您只需为生成的每张图片付费。
DALL-E 3 在提示遵循度、图像内文本渲染和整体质量方面远超 DALL-E 2。DALL-E 3 能够准确地在图像中包含文本——这是 DALL-E 2 及大多数其他模型的主要弱点。DALL-E 3 还原生集成在 ChatGPT 中,使其成为最广泛使用的图像生成模型。
DALL-E 3 目前仅支持图像生成(文本转图像)。如需修补(编辑图像的特定区域),您需要通过 /v1/images/edits 端点使用 DALL-E 2。如果这是核心需求,Midjourney 和 Stable Diffusion 提供更高级的图像编辑工作流。
可以。DALL-E 3 支持三种尺寸:1024×1024(正方形)、1792×1024(横向)、1024×1792(纵向)。您可以在 API 请求中指定 size 参数。如果需要任意宽高比或更高分辨率,可以考虑 Stability AI 的 API,它提供更多灵活性。
