GFPGAN
GFPGANとは?
GFPGANは、高品質な顔がどう見えるべきかを内蔵した理解を使って、ぼやけたり傷んだりした画像や動画の顔を鮮明にし、復元するAIツールです。
ひと目で分かる
- Type of model
- 顔の事前分布を用いた敵対的生成ネットワークによる顔復元モデル
- Developed by
- Tencent ARC(応用研究センター)
- Key capability
- 事前学習済みGANの顔事前分布を使い、劣化した・ぼやけた・低解像度の画像から高品質なブラインド顔復元を行う
- How it fits in AI workflow
- AI生成画像、アップスケールした映像、写真や動画の復元において顔品質を高める後処理ステップとして適用される
- 関連用語
- CodeFormerFace restorationGANStyleGANUpscaling
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
他の概念との比較
Compared with related concepts
GFPGANとCodeFormerの違い:どちらも生成AIを使って劣化した顔を復元しますが、GFPGANは復元中に注入されるStyleGAN2の事前分布に依存するのに対し、CodeFormerはトランスフォーマーベースの選択を伴う離散的なコードブックを使います。CodeFormerは一般により極端な劣化をうまく扱い、明示的な忠実度制御を提供しますが、GFPGANはより高速で、中程度の顔の強化タスクには確かな選択肢であり続けます。
プロのヒント
GFPGANは、顔が復元の主たる被写体であることが明確な場合に最もうまく機能します。顔が小さな要素として写っているシーン全体の画像に適用すると、シーンの他の部分が歪む可能性があるため、複雑な構図を扱う際は処理前に顔の領域に切り抜くかマスクをかけましょう。
種類とバリエーション
GFPGANは複数のバージョンでリリースされており、GFPGAN v1.
Morphicで最初のシーンを作ってみませんか?
Morphicを試す主な活用シーン
GFPGANは、古い写真や傷んだ写真の復元、AI生成のポートレート画像の強化、AI動画出力の顔品質の向上、アーカイブ動画素材のフレームごとの処理、そして自動写真補正アプリケーションの構成要素として、広く使われています。特に、消費者向けの写真復元ツールや、AI画像生成インターフェースに統合されたオプションとして人気があります。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
FAQ
GFPGANはGenerative Facial Prior Generative Adversarial Network(顔の生成事前分布を用いた敵対的生成ネットワーク)の略です。事前学習済みの顔GANを使って、復元過程で高品質な顔のディテールの事前分布を供給する顔復元モデルです。
GFPGANはTencent ARC(応用研究センター)の研究者によって開発され、オープンソースプロジェクトとしてリリースされました。
GFPGANは、顔がはっきりと見えるものの、ぼやけ、低解像度、圧縮アーティファクト、損傷によって劣化している画像で最も性能を発揮します。顔が非常に小さい、大きく隠れている、または極端な角度にある場合は効果が低くなります。
はい。GFPGANはその速度と、中程度の顔復元タスクにおける確かな性能により、今も広く使われています。CodeFormerや同様の新しいモデルは、ひどく劣化した顔ではより良い結果を生むことが多いですが、GFPGANはより高速で、日常的な強化のニーズの多くには十分です。
GFPGANは個々の動画フレームに適用して、動画素材全体の顔品質を高めることができます。各フレームでGFPGANを実行してこのプロセスを自動化するツールがさまざまにありますが、GPUによる高速化がないと相当な処理時間を要します。
GFPGANはGitHub上でオープンソースのモデルとして入手でき、AUTOMATIC1111 Stable Diffusion Web UIを含む人気のAI画像ツールに統合されています。いくつかのオンライン写真復元サービスもGFPGANを内部で使っています。