Question 1

DALL-Eとは何ですか？

Accepted Answer

DALL-Eは、2021年1月にリリースされたOpenAI初のテキストから画像への生成モデルです。画像とテキストのペアで訓練されたAIが、訓練データに存在しない概念の新しい組み合わせを含め、自然言語の記述から一貫した新しい画像を生成できることを実証しました。

Question 2

DALL-Eは誰が作りましたか？

Accepted Answer

DALL-EはOpenAIが開発しました。この名前はサルバドール・ダリとPixarのキャラクターWALL-Eへの言及を組み合わせたもので、プロジェクトの創造的・技術的な野心を反映しています。

Question 3

DALL-EはDALL-E 2やDALL-E 3とどう違いますか？

Accepted Answer

元のDALL-Eはトランスフォーマーベースの自己回帰アーキテクチャを使い、低解像度の出力を生み出しました。DALL-E 2は品質を大幅に向上させるために拡散ベースの手法に切り替えました。DALL-E 3はプロンプト遵守とテキストレンダリングに大きな進歩を加えました。それぞれが異なる能力を持つ別個のモデルです。

Question 4

DALL-Eはどんなアーキテクチャを使っていますか？

Accepted Answer

元のDALL-Eは、画像トークンとテキストトークンを共同のシーケンスとして一緒に処理するトランスフォーマーアーキテクチャを使いました。DALL-E 2とDALL-E 3は拡散ベースのアーキテクチャを使い、これがテキストから画像への生成で支配的な手法となっています。

Question 5

DALL-Eはオープンソースですか？

Accepted Answer

いいえ。DALL-Eとその後継機は、OpenAIが開発・管理する独自のモデルです。ダウンロード可能なモデルの重みとして利用可能なのではなく、OpenAIのAPIや統合された製品を通じてアクセスされます。

Question 6

なぜDALL-Eはリリース時に重要だったのですか？

Accepted Answer

DALL-Eは、開かれた自然言語の記述から一貫した創造的な画像を大規模に生成できる、初めて公に実証されたAIシステムの一つだったため重要でした。生成AIの創造的可能性への広範な関心を呼び起こし、画像生成のための創造的インターフェースとして自然言語を確立しました。

Question 7

DALL-Eは今日何に使われていますか？

Accepted Answer

元のDALL-Eは今日、主に歴史的・教育的な意義を持ちます。現在のクリエイティブワークフローは通常、ChatGPTやMicrosoftのクリエイティブツールに統合されたDALL-E 3、または品質と能力で元のモデルを上回ったサードパーティモデルを使います。

Question 8

元のDALL-Eはどんな種類の画像を生成できましたか？

Accepted Answer

元のDALL-Eは、異常な形や設定の物体など新しい概念の組み合わせを含め、テキストプロンプトから幅広い画像を生成できました。その出力は現在のモデルより解像度と一貫性が低かったものの、言語から画像への構成的な汎化という核心的な原理を実証しました。

DALL-E

DALL-Eとは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ