Question 1

AI画像生成におけるエンベディングとは何ですか？

Accepted Answer

エンベディングとは、少数のサンプル画像で訓練された、視覚的概念・スタイル・被写体のコンパクトな数値表現である。訓練済みのトリガーワードをプロンプトに含めることで、学習した視覚的特徴を生成プロンプトで参照でき、埋め込まれた概念に一致するコンテンツを生成するようモデルを導く。

Question 2

エンベディングとLoRAはどう違いますか？

Accepted Answer

エンベディングは、生成を導くテキスト条件付けベクトルのみを変更し、ベースモデルの既存の能力の範囲内で動作する。LoRAは、モデルの層に直接適用される追加の重み調整を訓練し、より包括的なカスタマイズを提供する。エンベディングは軽量で訓練が速く、LoRAはより強力で柔軟な結果を提供する。

Question 3

textual inversionとは何ですか？

Accepted Answer

textual inversionは、ほとんどのStable Diffusionエンベディングの基礎となる技法である。少数のサンプル画像で新しいトークンのエンベディングベクトルを訓練し、モデルの重みを変更せずに、被写体の視覚的特徴を最もよく捉えるモデルの埋め込み空間内の位置を見つける。

Question 4

エンベディングの訓練には何枚の画像が必要ですか？

Accepted Answer

textual inversionは、慎重に選んだわずか3〜10枚の画像で有用な結果を生み出せる。画像が多いほど被写体のさまざまな側面のカバー範囲が向上するが、この技法は少数のサンプルしか利用できないfew-shotのケースのために特別に設計されている。

Question 5

ネガティブエンベディングとは何ですか？

Accepted Answer

ネガティブエンベディングは、奨励するのではなく抑制したい視覚的品質を表すよう訓練される。生成中にネガティブプロンプト欄に置くと、埋め込まれた特徴が出力に現れる可能性を下げ、再利用可能な品質フィルターとして機能する。

Question 6

Stable Diffusion用のコミュニティエンベディングはどこで見つけられますか？

Accepted Answer

Civitaiのようなコミュニティプラットフォームは、Stable Diffusionコミュニティが共有するキャラクター、スタイル、視覚的概念の大規模なエンベディングライブラリをホストしている。これらはダウンロードして、ファイルを正しいディレクトリに置きプロンプトでトリガーワードを参照することで、個人の生成環境で使用できる。

Question 7

エンベディングはすべてのAI画像生成モデルと互換性がありますか？

Accepted Answer

特定のベースモデルで訓練されたエンベディングは、一般に同じベースのファインチューニング派生モデルと互換性があるが、アーキテクチャが異なるモデルとは互換性がない。Stable Diffusion 1.5で訓練されたエンベディングは、再訓練なしではSDXLや他のアーキテクチャ的に異なるモデルでは機能しない。

Question 8

エンベディングとAIの広義のエンベディング概念にはどんな関係がありますか？

Accepted Answer

AI分野全般において、エンベディングとは離散的な対象の意味的性質を捉える任意の数値ベクトル表現である。画像生成モデルのテキストエンコーダはプロンプトをエンベディングベクトルに変換する。Stable Diffusionコミュニティのtextual inversionエンベディングは、この一般原理の特定の応用であり、その技法を用いて新しい視覚的概念を既存のモデル空間内のベクトルとして表現する。

エンベディング

エンベディングとは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ