Omnihuman
Omnihumanとは?
Omnihumanは、人物の静止写真を、音声トラックやモーションデータによって駆動し、リアルに動かし話させることができる、ByteDanceによるAIモデルです。
ひと目で分かる
- Type of model
- 画像、音声、モーションの入力によって駆動される人物映像生成・アニメーションモデル
- Developed by
- ByteDance Research
- Key capability
- 音声駆動のリップシンクと身体アニメーション、またはモーション転送を伴う、単一画像からの全身人物映像生成
- How it fits in AI workflow
- アニメーション付きのデジタルヒューマンプレゼンター、AIアバター映像、トーキングヘッドや全身のアニメーション、映像制作におけるモーション転送の作成に使われる
- 関連用語
- SynthesiaTalking headMotion captureDigital humanLip sync
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
他の概念との比較
Compared with related concepts
Omnihuman対Synthesia:どちらも比較的最小限の入力から人物映像を生み出すが、Synthesiaは、事前に構築された、またはカスタムのアバターを使ってビジネスコミュニケーション向けのAIプレゼンター映像に焦点を当てた商業プラットフォームであるのに対し、Omnihumanは、より広い汎化をもって任意の単一画像から全身人物アニメーションの技術的進歩に焦点を当てた研究モデルである。
プロのヒント
Omnihumanのようなモデルを使って単一の画像から人物をアニメーション化するとき、画像の品質は大きな意味を持つ。最も自然で一貫したアニメーション出力を得るには、顔と全身がはっきり見える、高解像度で十分に照明された参照画像を使うこと。
種類とバリエーション
Omnihumanは、別個の変種モデルのファミリーではなく、多様な条件を扱うよう設計された統一モデルとして提示されている。異なる駆動信号(音声、モーション、またはその組み合わせ)を受け入れる能力により、トーキングヘッド映像から全身モーションアニメーションまで、単一のアーキテクチャ内で異なるユースケースにわたる柔軟性を持つ。
Morphicで最初のシーンを作ってみませんか?
Morphicを試す主な活用シーン
Omnihumanは、単一の写真からアニメーション付きのAIプレゼンターやアバターを作ること、コンテンツ制作のためにトーキングヘッドや全身の映像を生み出すこと、バーチャル試着やファッションのアニメーション、ローカライゼーションのワークフローのための吹き替えと音声駆動の顔・身体アニメーション、そしてAI映画制作ツールにおける人物映像生成能力の研究の参照点として関連する。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。