AIモデル
on Morphic

Morphicで利用可能なすべてのAIモデルを探索。画像・動画生成から音声制作、アップスケーリングまで。

icons
画像

Reve 2.0

Reve AI

Reve Image 2とも呼ばれる、Reve AIのレイアウト優先の画像モデル。要素を手作業で配置し、結果をデザインファイルのように編集し、最大4Kで鮮明なテキストを描画する。

テキストから画像レイアウトベースの制御画像編集マルチリファレンス構成+2件
動画

Bernini

ByteDance

ByteDanceによる、AI動画編集と生成のためのオープンソース統合モデル。クリップ内の要素を追加、削除、スタイル変更しても他の領域は固定され、被写体の同一性を保つsubject-to-videoも備える。

動画編集Subject-to-videoリファレンスガイド編集テキストから動画+1件
動画

Grok Imagine v1.5

xAI

xAIの画像から動画モデルがMorphicに。静止画を、ネイティブの同期音声、リップシンクされたセリフ、効果音、音楽を備えたクリップに変換。高いプロンプト追従性と動画延長にも対応します。

画像から動画テキストから動画ネイティブの同期音声リップシンクされたセリフ+4件
動画

Veo 4

Google DeepMind

Google DeepMindの次世代動画モデル。Veo 4はVeo 3.1の8秒ウィンドウを超え、より長いネイティブ4Kクリップ、ロックされたマルチショットキャラクター、ストーリーボードシーケンス、シネマティックなカメラ言語、マルチスピーカーのネイティブ音声を実現します。

テキストから動画画像から動画フレームから動画リファレンスから動画+5件
画像

MAI-Image-2.5

Microsoft

MorphicでMicrosoftのテキスト画像生成モデルを利用。MAI-Image-2.5はArenaのテキスト画像リーダーボードに3位で初登場。ポスター、ラベル、商業ビジュアル向けに、より鮮明な文字レンダリングとスタイライズドイラストを実現。

テキスト画像生成画像内テキストレンダリングスタイライズドイラスト商業ビジュアル+4件
マルチモーダル

Gemini Omni

Google DeepMind

Googleのany-to-anyマルチモーダルモデルがMorphicに。Gemini Omni Flashはテキスト、画像、音声、動画を1本の動画に変換し、一貫したキャラクター、正確な物理表現、会話による編集、SynthIDウォーターマークを提供します。

any-to-any入力テキストから動画画像から動画音声から動画+6件
画像

Recraft V4.1 Pro

Recraft

Recraftのフラッグシップ・ラスターティア。より静かなフォトリアル、より柔らかなグラデーション、そして短いプロンプトをクリエイティブディレクターのように読むモデル。2Kネイティブ出力、デザイン品質の構図。

テキストから画像画像から画像
動画

Happy Horse 1.0

Alibaba

映像と音声を一度の生成で同時に出力するAlibabaの動画モデル。7言語のネイティブなリップシンク、1080p出力、参照ベースの制御を備え、リリース時にArtificial Analysis Video ArenaのEloで1位を獲得。

テキストから動画画像から動画参照から動画動画編集+3件
画像

ChatGPT Images 2.0

OpenAI

ネイティブな推論、最大2K出力、キャラクターの一貫性を保つマルチ画像バッチ、図表・ポスター・デザイン作業向けの強力な多言語テキスト描画を備えたOpenAIの画像モデル。

テキストから画像画像から画像思考モードマルチ画像バッチ+2件
動画

Sync V3

Sync

Syncの旗艦リップシンクモデル。Sync V3(sync-3)はショット単位の理解、遮蔽対応、極端なアングル対応を備え、ちらつきのない4Kリップシンクを生成します。

リップシンク音声駆動の動画生成
動画

Wan 2.7

Alibaba

Thinking Modeによるプロンプト推論、映画的な1080p出力、ショット間で参照に基づくキャラクターの一貫性を備えた、Alibabaのフラッグシップ Wan 動画モデル。

テキストから動画画像から動画参照から動画動画編集
動画

LTX 2.3

Lightricks

Lightricksのオープンソース音声映像動画モデル。LTX 2.3は同期した映像と音声を一度の処理で生成し、最大4Kのネイティブ縦型出力に対応します。

テキストから動画画像から動画音声から動画ネイティブ音声生成
画像

Nano Banana 2

Google DeepMind

Google DeepMindのGemini 3.1 Flash Image。プロ級の画像生成をFlash速度で実現します。最大5キャラクターと14オブジェクトにわたる被写体の一貫性、リアルタイムのウェブグラウンディング、正確なテキスト描画、最大4Kの解像度に対応します。

テキストから画像画像から画像マルチターン編集被写体の一貫性+3件
動画

Kling 3.0

Kling

Kuaishou のプロンプト重視フラッグシップ動画モデル。Kling 3.0(V3)は写実的なモーション、マルチショットのディレクターモード、ネイティブな多言語オーディオを、ネイティブ 1080p と 4K の 30fps で提供します。

テキストから動画画像から動画マルチショットのディレクターモードネイティブオーディオ
画像

Recraft V4 Pro

Recraft

Recraftの高解像度ラスター画像モデル。デザインセンス、洗練された人体表現、バランスの取れた構図、2Kネイティブ出力での編集向けディテールを軸に再構築されています。

テキストから画像画像から画像
画像

Seedream 5.0 Lite

ByteDance

ByteDanceの推論重視の画像モデル。Seedream 5.0 Liteは熟考型の生成と組み込みのオンライン検索を組み合わせ、最新の出来事に関連するプロンプトをリアルタイムの文脈で描き出します。

テキストから画像推論ベースの生成オンライン検索の文脈
画像

Qwen Edit Angles

Alibaba Qwen

AlibabaのQwen-Image-Editマルチアングルモデル。1枚の入力画像から、同じ被写体を異なるカメラ視点で生成し、ジオメトリ・ライティング・アイデンティティを一貫させます。

画像から画像へ新規視点合成カメラ認識編集
動画

Seedance 1.5 Pro

ByteDance

ByteDanceのネイティブな音声・映像動画モデル。Seedance 1.5 Proは同期した映像と音声を一度の生成で出力し、多言語リップシンクと映画的なカメラ制御に対応します。

テキストから動画画像から動画ネイティブ音声生成多言語リップシンク
画像

Seedream 4.5

ByteDance

ByteDanceの強化版画像モデル。プロンプトへの忠実度、複数参照画像の処理、密な文字レンダリングを向上させ、テキストから画像生成と画像編集を1つのモデルに統合します。

テキストから画像画像から画像複数参照画像
画像

Nano Banana Pro

Google DeepMind

Google DeepMindのGemini 3 Pro Image。被写体の一貫性、プロ品質のテキスト描画、ウェブに基づく正確さ、14のアスペクト比で最大4Kの解像度を備えた、スタジオ品質の画像生成と編集。

テキストから画像画像から画像マルチターン編集被写体の一貫性+3件
動画

Veed Fabric 1.0

Veed

Veedのトーキングビデオモデル。Fabric 1.0は1枚の静止画と1つの音声ファイルから、口、頭、体、手の動きが同期したトーキングビデオを生成します。

画像からトーキングビデオへ音声駆動アニメーションリップシンク
ユーティリティ

Crystal Image

Morphic

高速・高効率なAI画像アップスケーリング。最大4倍の解像度向上と優れた品質対速度比で、日常的な画像高画質化ワークフローに最適です。

画像アップスケールディテール強化高速処理
ユーティリティ

Crystal Video

Morphic

高速・高効率なAI動画アップスケーリング。最大4倍の解像度向上とフレーム補間を優れた処理速度で提供し、日常的な動画高画質化に最適です。

動画アップスケールフレーム補間高速処理
音声

ElevenLabs

ElevenLabs

ElevenLabsの業界最先端AI音声合成モデル。自然で表現力豊かなテキストから音声の生成と、プロ品質の音声クローニングを提供します。

テキストから音声音声クローニング
画像

Flux

Black Forest Labs

Black Forest Labsの高品質AI画像生成モデル。テキストから画像生成で、写実的な画像から芸術的な作品まで対応する標準モデルです。

テキストから画像
画像

Flux 2 Pro

Black Forest Labs

Black Forest Labsのプレミアムアイ画像生成モデル。プロフェッショナル用途に最適な最高品質の出力、優れたディテール、色精度、プロンプト適合性を提供します。

テキストから画像
画像

Gemini Image

Google

GoogleのGeminiモデルによるAI画像生成。Googleの高度なAI技術を活用し、テキストから高品質な画像を生成する汎用画像モデルです。

テキストから画像画像から画像
画像

Gemini Image Pro

Google

GoogleのプレミアムAI画像生成モデル。Geminiの最高品質画像出力で、最大2K解像度の写実的な画像、テキストレンダリング、高度な編集を提供します。

テキストから画像画像から画像
画像

GPT Image 1.5

OpenAI

OpenAIの高度なAI画像生成モデル。最高クラスのテキストレンダリング、卓越した指示遵守、洗練された画像編集機能を備えています。

テキストから画像画像から画像テキストレンダリング画像編集
マルチモーダル

Grok Imagine

xAI

xAIのクロスモーダルAIモデル。テキストから画像・動画、画像編集、動画変換の5つのモードで、画像と動画の両方を一つのモデルで生成します。

テキストから画像画像から画像テキストから動画画像から動画+1件
動画

Hailuo 2.3

MiniMax

MiniMaxの最新AI動画モデル。テキストから動画、画像から動画に対応し、高品質な出力と優れた被写体一貫性で多様なクリエイティブニーズに応えます。

テキストから動画画像から動画
動画

Hailuo I2V-02

MiniMax

MiniMaxの画像から動画特化AIモデル。静止画像を高品質な動画にアニメーション化し、モーションの自然さと時間的一貫性に優れた出力を提供します。

画像から動画
動画

Kling

Kling

Klingの標準AI動画モデル(v2.6 Pro)。テキストから動画、画像から動画の生成に対応し、強力なスタイライゼーション機能と安定した品質を提供します。

テキストから動画画像から動画
動画

Kling Motion Control

Kling

Klingの精密モーション制御AI動画モデル。カメラパスとモーション軌道を直接制御し、プロの映像制作のような精密な動きの動画を生成します。

テキストから動画画像から動画モーション制御
動画

Kling O1

Kling

Klingの動画編集特化AIモデル。動画から動画の変換に特化し、既存映像のスタイル変換、視覚的リメイク、モーション保持型の動画編集を実現します。

動画から動画画像から動画
動画

Kling O3

Kling

Klingの最新フラッグシップAI動画モデル。テキスト、画像、リファレンスから動画を生成し、Klingシリーズ最高品質と最も幅広い機能を提供します。

テキストから動画画像から動画リファレンスから動画
画像

Kontext

Black Forest Labs

Black Forest Labsの先進的なコンテキスト対応AI画像編集モデル。テキスト指示による精密な画像編集、スタイル変換、要素の追加・削除を実現します。

テキストから画像画像から画像
動画

Luma

Luma AI

Luma AIの高品質AI動画モデル(Ray 2 Flash)。テキストから動画、画像から動画に対応し、高速処理と優れた3D空間理解で効率的な動画生成を提供します。

テキストから動画画像から動画
動画

Runway Gen-4 Aleph

Runway ML

Runway MLの最新フラッグシップAI動画モデル。業界をリードする品質で、テキスト、画像、リファレンスからシネマティックなAI動画を生成します。

テキストから動画画像から動画リファレンスから動画
画像

Runway Gen-4 Image

Runway ML

Runway MLの最新AI画像生成モデル。映画制作グレードの品質で、テキストから画像、画像から画像の生成に対応する高品質画像モデルです。

テキストから画像画像から画像
動画

Seedance

ByteDance

ByteDanceのAI動画モデル。表現力豊かなキャラクターアニメーション、ダンス振付、人体モーションに優れ、ネイティブオーディオとマルチ入力生成をサポートします。

テキストから動画画像から動画フレームから動画ネイティブオーディオ
動画

Seedance 2.0

ByteDance

ByteDanceの次世代マルチモーダルAI動画モデル, 画像、動画、オーディオ、テキストの同時入力に対応。超リアルなモーション、カメラ制御、ネイティブオーディオ合成、音楽ビート同期、シームレスな動画延長を実現。最大12アセットの同時入力。

テキストから動画画像から動画動画から動画オーディオから動画+7件
画像

Seedream

ByteDance

ByteDanceの高品質AI画像生成モデル。鮮やかで詳細な出力と、テキストから画像、画像から画像の両モードで最大2K解像度に対応します。

テキストから画像画像から画像
動画

Sora

OpenAI

OpenAIの画期的なAI動画生成モデル。テキストプロンプトから3D空間、物理法則、クリエイティブなストーリーテリングを深く理解した高品質な動画を生成します。

テキストから動画画像から動画
ユーティリティ

Topaz Image

Topaz Labs

Topaz Labsのプロ仕様AI画像アップスケーリング。最大4倍の解像度向上と、インテリジェントなディテール復元、ノイズ除去、アーティファクト除去を提供します。

画像アップスケールディテール復元ノイズ除去
ユーティリティ

Topaz Video

Topaz Labs

Topaz Labsのプロ仕様AI動画アップスケーリング。最大4倍の解像度向上、フレーム補間、スタビライゼーション、ディテール強化を提供します。

動画アップスケールフレーム補間スタビライゼーションディテール強化
動画

Veo 3.1

Google DeepMind

Google DeepMindの最先端動画生成モデル。業界をリードする物理精度、ネイティブオーディオ合成、4K解像度でフォトリアリスティックな出力を実現します。

テキストから動画画像から動画フレームから動画リファレンスから動画+1件
動画

Vidu Q2

Shengshu Technology

Shengshu Technologyの高忠実度AI動画モデル。テキスト、画像、リファレンスから高品質動画を生成し、優れた視覚的一貫性とシーン安定性を提供します。

テキストから動画画像から動画リファレンスから動画
動画

Vidu Q3

Shengshu Technology

Shengshu Technologyの最新AI動画モデル。Q2からの品質向上とモーション改善で、より高品質な動画生成を提供するViduシリーズの最新版です。

テキストから動画画像から動画リファレンスから動画
動画

Wan 2.6

Alibaba / Tongyi Lab

Alibaba/Tongyi Labのオープンソースベース高品質AI動画モデル。テキストから動画、画像から動画に対応し、優れたコストパフォーマンスと安定した品質を提供します。

テキストから動画画像から動画
画像

Z-Image Turbo

fal.ai

超高速AI画像生成モデル。1秒未満の生成時間で、ラピッドプロトタイピング、大量ワークフロー、即時ビジュアル探索に最適化されています。

テキストから画像