DALL-E
DALL-Eとは?
DALL-Eは、テキスト記述から画像を生成できたOpenAI初のAIモデルで、コンピューターが書かれた指示から新しい絵を作れることを証明しました。
ひと目で分かる
- Type of model
- テキストから画像への生成モデル
- Developed by
- OpenAI
- Key capability
- 訓練中に見ていない概念の新しい組み合わせを含め、自然言語のプロンプトから一貫した画像を生成
- How it fits in AI workflow
- 元のDALL-Eはテキストから画像への生成を実用的な手法として確立し、現在の制作クリエイティブワークフローで使われるDALL-E 2およびDALL-E 3の祖先である
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
他の概念との比較
Compared with related concepts
DALL-E対Stable Diffusion:DALL-EはOpenAIが開発・管理する独自のモデルで、彼らのAPIや製品を通じてアクセスされます。Stable Diffusionはオープンソースのモデルで、その重みが公開されており、コミュニティによるカスタマイズ、ローカルでの展開、ファインチューニングされた変種の広いエコシステムを可能にします。DALL-Eは商用上の安全性と使いやすさを優先し、Stable Diffusionは開放性、柔軟性、コミュニティによる拡張を優先します。
プロのヒント
DALL-Eの歴史的役割を理解すると、テキストから画像への生成分野全体を文脈づける助けになります。2021年や2022年のAI画像生成に関する文献、チュートリアル、議論に出会ったとき、DALL-Eへの言及は通常、元のモデルまたはDALL-E 2を意味します。三つの世代を発表の文脈で区別すると、古い能力の主張を現在のモデル性能と比べて評価する際の混乱を避けられます。
種類とバリエーション
元のDALL-Eはトランスフォーマーベースの自己回帰アーキテクチャを使い、後継機に比べて低解像度の出力を生み出しました。DALL-E 2はアーキテクチャを拡散ベースの手法に置き換え、品質を大幅に向上させ、インペインティングとアウトペインティングを可能にしました。DALL-E 3はプロンプト遵守、テキストレンダリング、構図の洗練をさらに進めました。各バージョンは異なる能力を持つ別個のモデルですが、同じ創設概念と命名の系譜を共有しています。
Morphicで最初のシーンを作ってみませんか?
Morphicを試す主な活用シーン
元のモデルの歴史的意義と基礎的な能力が研究対象となる、研究や教育の文脈。より高品質な後継機が利用可能になる前に、コンセプト探索やアイデア出しにDALL-Eの出力が使われた初期の商用クリエイティブワークフロー。テキストから画像への生成に不慣れな観客へのAIクリエイティブ能力の実演。元のDALL-Eは現在の制作作業ではあまり使われず、それらは通常DALL-E 2、DALL-E 3、またはサードパーティモデルに依存します。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。