Question 1

DALL-E 2とは何ですか？

Accepted Answer

DALL-E 2は、2022年4月にリリースされたOpenAIの第二世代テキストから画像へのモデルです。拡散ベースのアーキテクチャを使って元のDALL-Eより高解像度の画像を生み出し、インペインティング、アウトペインティング、画像バリエーションの能力を加えています。

Question 2

DALL-E 2は元のDALL-Eとどう違いますか？

Accepted Answer

DALL-E 2はトランスフォーマーの自己回帰アーキテクチャから拡散モデルに切り替え、より高解像度で鋭い画像を生み出しました。また、元のモデルが提供しなかったインペインティングやアウトペインティングを含む画像編集機能も加えました。

Question 3

DALL-E 2のインペインティングとは何ですか？

Accepted Answer

インペインティングは、既存画像内の領域を選択し、その領域を何に置き換えるべきかをテキストで記述することをユーザーに可能にします。モデルは選択された領域を埋める新しいコンテンツを、画像の周囲のスタイルと文脈に合わせながら生成します。

Question 4

DALL-E 2のアウトペインティングとは何ですか？

Accepted Answer

アウトペインティングは、既存画像を元のキャンバスの境界を越えて拡張し、元の画像のスタイル、照明、視覚的文脈を拡張された領域へと続ける新しいコンテンツを生成します。

Question 5

DALL-E 2はどの解像度で生成しますか？

Accepted Answer

DALL-E 2は最大解像度として1024x1024ピクセルで画像を生成し、低解像度の出力だった元のDALL-Eから大幅に向上しています。

Question 6

DALL-E 2は今日でも使われていますか？

Accepted Answer

DALL-E 2はほとんどの生成タスクでDALL-E 3に大きく取って代わられました。DALL-E 3はプロンプト遵守と画像品質が大幅に優れているからです。ただし、DALL-E 2のインペインティングとアウトペインティングの能力は、特定の編集ワークフローのために依然としてアクセスされることがあります。

Question 7

DALL-E 2はプロンプトの理解をどう扱いますか？

Accepted Answer

DALL-E 2は、言語理解を視覚コンテンツ生成に結びつけるCLIPベースのテキスト画像整合システムを使います。幅広いプロンプトの種類を扱いますが、特に複雑な構図的指示については、DALL-E 3よりプロンプト遵守の精度が低くなります。

Question 8

DALL-E 2にはどんな安全機能がありますか？

Accepted Answer

DALL-E 2は、有害、露骨、または権利を侵害するコンテンツの生成を防ぐコンテンツフィルターを含みます。特定の文脈での実在の人物の顔の生成を制限し、悪用を防ぐよう設計されたフィルターを適用し、これらの保護はAPIレベルで強制されます。

DALL-E 2

DALL-E 2とは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ