Question 1

CogVideoを作ったのは誰ですか？

Accepted Answer

CogVideoは、CogView画像生成モデルやGLMシリーズの言語モデルでも知られる中国のAI研究企業、Zhipu AIによって開発されました。

Question 2

CogVideoは無料で使えますか？

Accepted Answer

CogVideoとCogVideoXはオープンソースモデルとしてリリースされており、ウェイトは研究や多くの商用利用のために公開されています。リリースによって条件が異なるため、使用するバージョンの具体的なライセンスを確認してください。

Question 3

CogVideoはRunwayやKlingのような商用ツールと比べてどうですか？

Accepted Answer

商用ツールは一般に、より洗練されたインターフェースと追加の制御機能を備え、より高品質な出力を生み出します。CogVideoはその洗練度の一部をオープンさと引き換えにします。ローカルで実行し、微調整し、クローズドな商用ツールが許さない方法でカスタムパイプラインに統合できます。

Question 4

CogVideoとCogVideoXの違いは何ですか？

Accepted Answer

CogVideoXは拡散トランスフォーマーアーキテクチャを使う改良された後継で、元のCogVideoより長く高品質な動画を生み出します。ほとんどの実用的な用途では、CogVideoXが一般にこのモデルファミリーの現在の最先端を表します。

Question 5

CogVideoを自分のコンピューターで実行できますか？

Accepted Answer

はい、CogVideoXのウェイトはHugging Faceで利用でき、適切なPythonライブラリを使ってローカルで実行できます。ただし、動画生成は計算負荷が高く、実用的な使用には通常、高VRAMのGPUが必要です。

Question 6

CogVideoにはどんなプロンプトが最も適していますか？

Accepted Answer

被写体、アクション、環境、カメラの視点を指定する明確で記述的なテキストプロンプトが最良の結果を生む傾向があります。ほとんどのテキストから動画へのモデルと同様に、CogVideoは映画的な言語と具体的な動きの記述によく反応します。

Question 7

CogVideoのモデルウェイトはどこで見つけられますか？

Accepted Answer

CogVideoとCogVideoXのモデルウェイトは、THUDM組織の下でHugging Faceにホストされています。リポジトリには、モデルカード、使用方法、コミュニティの微調整へのリンクが含まれています。

CogVideo

CogVideoとは？