DALL-E 2

DALL-E 2とは?

DALL-E 2はOpenAI第二のAI画像モデルで、前身より鋭く高解像度の画像を生み出し、既存画像の編集、拡張、バリエーション作成の能力を加えました。

ひと目で分かる

Type of model
インペインティングとアウトペインティングの能力を備えたテキストから画像への拡散モデル
Developed by
OpenAI
Key capability
向上した品質でテキストプロンプトから1024x1024の画像を生成し、加えてインペインティング、アウトペインティング、画像バリエーション生成を行う
How it fits in AI workflow
クリエイティブおよび制作ワークフローでテキストから画像への生成、画像編集、コンテンツ拡張、バリエーション探索に使われる。現在のほとんどのプロ用途ではDALL-E 3に引き継がれた

創ってみませんか?

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。

他の概念との比較

他の概念との比較

Compared with related concepts

DALL-E 2対Stable Diffusion 1.


プロのヒント

DALL-E 2のインペインティングとアウトペインティングの能力は、新しい生成モデルが生の画像品質でこれを上回っても、特定の編集タスクでは依然として有用です。既存画像を拡張する必要があるとき、または特定の領域を周囲のスタイルに合うAI生成コンテンツに置き換える必要があるとき、これらの編集モードは、生成のみのワークフローでプロンプトエンジニアリングだけで同じタスクを試みるよりも制御しやすいことがあります。

種類とバリエーション

テキストから画像への生成は、書かれたプロンプトから新しい画像を生み出します。インペインティングは、既存画像のマスクされた領域を選択し、テキスト記述に基づいてそれを埋める新しいコンテンツを生成します。アウトペインティングは、画像を元の端を越えて拡張し、周囲のスタイルと文脈に合う一貫した新しいコンテンツを生成します。画像バリエーションは、テキストプロンプトなしに、アップロードされた画像の代替バージョンを元のスタイルで生成します。各モードは同じ基盤モデルを使いますが、異なる条件入力と生成目標を用います。

Morphicで最初のシーンを作ってみませんか?

Morphicを試す

主な活用シーン

デザインプロジェクト、マーケティングキャンペーン、コンテンツ制作のワークフローのためのコンセプト画像の生成。写真から不要な要素を除去したり、AI生成の代替物に置き換えたりするためのインペインティングの使用。イラストや写真を元の境界を越えて拡張し、より広い構図を作るためのアウトペインティングの使用。A/Bテストやクリエイティブな探索のための、既存画像のスタイルが一貫したバリエーションの生成。OpenAIのAPIを介して開発ワークフローと統合し、カスタムアプリケーションに画像生成能力を埋め込むこと。

創ってみませんか?

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。

FAQ

DALL-E 2とは何ですか?

DALL-E 2は、2022年4月にリリースされたOpenAIの第二世代テキストから画像へのモデルです。拡散ベースのアーキテクチャを使って元のDALL-Eより高解像度の画像を生み出し、インペインティング、アウトペインティング、画像バリエーションの能力を加えています。

DALL-E 2は元のDALL-Eとどう違いますか?

DALL-E 2はトランスフォーマーの自己回帰アーキテクチャから拡散モデルに切り替え、より高解像度で鋭い画像を生み出しました。また、元のモデルが提供しなかったインペインティングやアウトペインティングを含む画像編集機能も加えました。

DALL-E 2のインペインティングとは何ですか?

インペインティングは、既存画像内の領域を選択し、その領域を何に置き換えるべきかをテキストで記述することをユーザーに可能にします。モデルは選択された領域を埋める新しいコンテンツを、画像の周囲のスタイルと文脈に合わせながら生成します。

DALL-E 2のアウトペインティングとは何ですか?

アウトペインティングは、既存画像を元のキャンバスの境界を越えて拡張し、元の画像のスタイル、照明、視覚的文脈を拡張された領域へと続ける新しいコンテンツを生成します。

DALL-E 2はどの解像度で生成しますか?

DALL-E 2は最大解像度として1024x1024ピクセルで画像を生成し、低解像度の出力だった元のDALL-Eから大幅に向上しています。

DALL-E 2は今日でも使われていますか?

DALL-E 2はほとんどの生成タスクでDALL-E 3に大きく取って代わられました。DALL-E 3はプロンプト遵守と画像品質が大幅に優れているからです。ただし、DALL-E 2のインペインティングとアウトペインティングの能力は、特定の編集ワークフローのために依然としてアクセスされることがあります。

DALL-E 2はプロンプトの理解をどう扱いますか?

DALL-E 2は、言語理解を視覚コンテンツ生成に結びつけるCLIPベースのテキスト画像整合システムを使います。幅広いプロンプトの種類を扱いますが、特に複雑な構図的指示については、DALL-E 3よりプロンプト遵守の精度が低くなります。

DALL-E 2にはどんな安全機能がありますか?

DALL-E 2は、有害、露骨、または権利を侵害するコンテンツの生成を防ぐコンテンツフィルターを含みます。特定の文脈での実在の人物の顔の生成を制限し、悪用を防ぐよう設計されたフィルターを適用し、これらの保護はAPIレベルで強制されます。

Can't find what you are looking for?
Contact us and let us know.
bg