Question 1

AI生成の文脈における推論とは何ですか？

Accepted Answer

推論は、訓練済みのAIモデルを実行し、プロンプトや参照画像といったユーザー入力から新しい出力（画像、動画、テキスト、その他のコンテンツ）を生成するプロセスです。訓練に続く運用フェーズであり、クリエイターが生成を要求したときに実際に起きることを表します。

Question 2

推論は訓練とどう違いますか？

Accepted Answer

訓練は、大規模なデータセットにモデルを触れさせ、多くの反復にわたってパラメータを調整することでモデルの能力を構築するプロセスで、計算量が膨大な一度きりのプロセスです。推論は、すでに訓練済みのモデルを使って新しい出力を生成するプロセスで、比較的計算負荷は小さいものの、大規模モデルでは依然としてかなりのGPUリソースを必要とします。

Question 3

なぜ推論には時間がかかるのですか？

Accepted Answer

推論時間は、モデルが実行する処理ステップの数、出力の解像度、モデル自体のサイズによって決まります。複数のデノイジングステップにわたってノイズを反復的に精緻化する拡散モデルは特に計算負荷が高く、各ステップでモデルの完全な順伝播を実行する必要があり、このプロセスを1回の生成あたり数十回から数百回繰り返さなければならないからです。

Question 4

推論速度に影響する要因は何ですか？

Accepted Answer

主な要因は、モデルサイズ（大きなモデルはステップあたりより多くの計算を必要とする）、デノイジングステップの数（ステップが多いほど品質は良くなるが生成時間は長くなる）、出力解像度（高解像度はより多くのメモリと計算を必要とする）、利用できるハードウェア（優れたGPUは推論時間を大幅に短縮する）です。

Question 5

AI生成プラットフォームで推論コストはどう機能しますか？

Accepted Answer

ほとんどのプラットフォームは推論を実行する計算コストに基づいて生成あたり課金し、これはモデル品質、出力解像度、動画の生成時間によって変わります。出力品質が高いプレミアムモデルは、推論中により多くの計算を消費するため、通常は生成あたりのコストが高くなります。

Question 6

モデル蒸留とは何で、推論とどう関係しますか？

Accepted Answer

モデル蒸留は、より大きく高性能なモデルの挙動を近似する、より小さく高速なモデルを作る技術です。蒸留されたモデルは元の品質の大部分を維持しようとしながら、推論を大幅に高速かつ低コストで実行します。多くのプラットフォームは、最大限の品質よりも速度が重要なユースケース向けに、蒸留モデルのバリアントを提供しています。

Question 7

推論品質はユーザーが制御できますか？

Accepted Answer

はい。ほとんどのプラットフォームで、ユーザーはサンプリングステップの数、ガイダンススケール、サンプラーの選択といったパラメータを通じて推論品質を制御できます。一般にステップが多いほど、生成時間が長くなる代わりに高品質になります。一部のプラットフォームはこれらの制御を、基盤となる推論設定を自動的に調整するシンプルな品質プリセット（ドラフト、標準、高品質）に抽象化しています。

Question 8

「リアルタイム推論」とはどういう意味ですか？

Accepted Answer

リアルタイム推論は、インタラクティブな用途に十分な速さ、場合によってはほぼ瞬時に出力を生むよう最適化された設定を指します。リアルタイム推論の実現には通常、より小さい蒸留モデルを使い、出力解像度や品質を下げることが必要で、最終制作よりもライブプレビュー、インタラクティブな体験、迅速な反復に適しています。

推論

推論とは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ