图像生成

Ideogram 4.0

由 Ideogram 提供

Ideogram 的开源权重图像模型。图内文字、版面控制、2K 输出。

Ideogram 4.0

核心功能

技术规格

开源权重

在 Hugging Face 与 GitHub 公开,附商用许可

0.97 OCR

图内文字的 X-Omni 英文 OCR 得分

16 色

最多用 16 个 HEX 色值约束输出

最高 2K

每边 256 至 2048 像素,宽高比灵活

应用场景

海报与包装

标题、广告语、小字说明都必须清晰可读的设计。文字渲染成形,不会糊成形状。

多语言营销

版面与色板保持不变,按语言替换文字元素,让同一支视觉素材适配各个市场。

品牌锁定视觉

把品牌的 HEX 色板写进提示词,从社交图到横幅,每次生成都守在品牌色之内。

特殊版式

方形缩略图、1920×1088 宽幅、2048×768 超宽横幅、社交头图,一套权重全部覆盖。

程序化生成

JSON 提示词天生适合代码。用脚本批量生成目录或广告变体,每个元素都先经过校验。

自托管部署

无法把提示词发给第三方 API 的团队,可以微调开源权重,在自有基础设施内运行模型。

提示词示例

活动海报

活动海报

爵士音乐节海报,顶部大标题,底部排出清晰可读的阵容

Edit prompt
包装

包装

咖啡豆袋正面,衬线体烘焙坊名称,清晨柔光

Edit prompt
品牌色板

品牌色板

锁定青绿、沙色与铁锈色品牌色板的产品发布横幅

Edit prompt
超宽横幅

超宽横幅

超宽网站横幅,黎明的山脊,标题排在左侧

Edit prompt
多语言招牌

多语言招牌

挂着准确日文招牌的东京店面,细雨,傍晚灯光

Edit prompt
杂志封面

杂志封面

建筑杂志封面,顶部刊名,右侧对齐排列的封面标题

Edit prompt

简单定价

今天就免费开始,随时可以升级或取消。

Basic

$0/
账单金额为 $0 每年

900 每月 信用

1 个用户

所有模型

工作流

Standard

$0/
账单金额为 $0 每年

3200 每月 信用

1 个用户

所有模型

工作流

Pro

$0/
账单金额为 $0 每年

6200 共享 每月 信用

1 用户

+ 最多 4 人额外付费可增加

所有模型

工作流

Pro Max

$0/
账单金额为 $0 每年

24000 共享 每月 信用

1 用户

+ 最多 9 人额外付费可增加

所有模型

工作流

Enterprise

更高的限制

自定义

定价和账单条款

无限信用
自定义席位限制
所有模型
工作流
Pricing Gradient

Free

For playing around

$0

forever free

最多 20 积分
仅1个用户
部分模型
工作流

常见问题

Ideogram 4.0 是什么?
Ideogram 4.0 是 Ideogram 于 2026 年 6 月 3 日发布的 93 亿参数开源权重文生图模型。它主打精准的图内文字渲染、边界框版面控制、调色板约束和最高 2K 的输出,权重可在商用许可下下载使用。
Ideogram 4.0 是开源的吗?
Ideogram 4.0 是开源权重,而非完全开源。权重、推理代码和提示词指南都公开在 Hugging Face 与 GitHub 上,商用部署由按规模匹配的许可覆盖。你可以下载、微调并自托管这个模型。
Ideogram 4.0 的文字渲染有多准?
文字渲染是这个模型的招牌能力。Ideogram 公布其在 X-Omni 英文 OCR 基准上得分 0.97,该基准衡量生成图像中的文字是否真正可读、拼写是否正确,而且模型对多语言文字的处理与英文同样出色。
Ideogram 4.0 的版面控制是如何工作的?
你在提示词中给元素附上边界框,每个框配一句平实的描述,模型就会把对应物体放进指定区域。Ideogram 公布其在 7Bench 版面基准上的 mIoU 得分为 0.69,该指标衡量生成物体落在边界框内的贴合程度。
什么是结构化 JSON 提示词?
Ideogram 4.0 的提示词不是一长句话,而是一个 JSON 对象:整体场景描述、负责美学与光线的样式块、可带边界框的独立元素、写明确切渲染文字串的文本元素,以及最多 16 个 HEX 色值的可选色板。参考实现会在生成前按 schema 校验每条提示词。
Ideogram 4.0 支持哪些分辨率?
Ideogram 4.0 的生成范围是每边 256 至 2048 像素,宽高比灵活。一套权重覆盖 1024 方形、1536×1024 的横竖构图、1920×1088 宽幅、2048×768 超宽、手机壁纸,以及 1584×396 的社交横幅。
Turbo、Default、Quality 预设是什么?
这是三档在速度与精度之间取舍的采样预设:Turbo 跑 12 步去噪,Default 跑 20 步,Quality 跑 48 步。常见流程是先用 Turbo 快速探索构图,再把选中的提示词用 Quality 重跑,得到最终素材。
我能在自己的硬件上运行 Ideogram 4.0 吗?
可以。Ideogram 除了完整权重和推理代码,还发布了能装进单张 24 GB GPU 的 fp8 和 nf4 量化检查点。团队也可以用自己的品牌或产品数据微调模型,部署在自有环境中。
Ideogram 4.0 和 GPT Image 2 相比如何?
在 Ideogram 公布的设计师偏好 ELO 排行榜上,Ideogram 4.0 得分 1062,仅次于闭源的 GPT Image 2 的 1141,领先其余所有开源权重模型。实际差别在于获取方式:GPT Image 2 只能通过 API 调用,而 Ideogram 4.0 可以下载、微调并自行托管。