Ideogram 4.0
Ideogram 提供
Ideogramのオープンウェイト画像モデル。画像内テキスト、レイアウト制御、2K出力。

主な機能
技術仕様
オープン
Hugging FaceとGitHubで公開、商用ライセンス付き
0.97 OCR
画像内テキストのX-Omni英語OCRスコア
16色
最大16色のHEXカラーで出力を条件付け
最大2K
一辺256〜2048ピクセル、柔軟なアスペクト比
活用事例
ポスターとパッケージ
タイトル、キャッチコピー、注記まで全部読めることが前提のデザイン。文字が崩れず、きちんと描画されます。
多言語キャンペーン
レイアウトとパレットは固定したまま、言語ごとにテキスト要素だけ差し替えて1つのビジュアルを各市場へ展開。
ブランド準拠のビジュアル
ブランドのHEXパレットをプロンプトに渡せば、SNSタイルからバナーまで毎回ブランドカラーに収まります。
変則フォーマット
正方形サムネ、1920×1088のワイド、2048×768のウルトラワイドバナー、SNSヘッダーまで1つのウェイトで対応。
プログラムによる生成
JSONプロンプトはコードと相性抜群。カタログや広告バリエーションをスクリプトで生成し、各要素を事前検証。
自社ホスティング運用
外部APIにプロンプトを送れないチームも、オープンウェイトを微調整して自社インフラ内でモデルを運用できます。
プロンプト例






シンプルな料金体系
今すぐ無料で始めて、いつでもアップグレードまたはキャンセルできます。
Basic
500 月 クレジット
1 ユーザーのみ
すべてのモデル
ワークフロー
Standard
2800 月 クレジット
1 ユーザーのみ
すべてのモデル
ワークフロー
Pro
6000 共有 月 クレジット
1 ユーザー
すべてのモデル
ワークフロー
Pro Max
24000 共有 月 クレジット
1 ユーザー
すべてのモデル
ワークフロー
Enterprise
より高い制限のために
カスタム
料金と請求条件

Free
For playing around
$0
forever free
よくある質問
Reve 2.0
Reve AI
Reve AIのレイアウト優先の画像モデル。すべての要素を手作業で配置し、結果をデザインファイルのように編集し、最大4Kで鮮明なテキストを描画する。
Bernini
ByteDance
指示ベースの編集に対応したByteDanceのオープンソース動画モデル。フレームの他の部分は固定され、被写体の同一性も保たれる。
Grok Imagine v1.5
xAI
ネイティブの同期音声を備えたxAIの画像から動画モデル。あらゆる静止画を、音、セリフ、音楽付きのクリップにアニメート。
Veo 4
Google DeepMind
Google DeepMindの次世代動画モデル。ネイティブ4K、より長いクリップ、マルチショットでのキャラクター一貫性、シネマティックなカメラ言語をひとつのプロンプトで実現。