マルチモーダル

Gemini Omni

Google DeepMind 提供

Google初のany-to-any AIモデル。テキスト・画像・音声・動画を入力し、テキスト・画像・音声・動画を出力。

any-to-any入力テキストから動画画像から動画音声から動画動画から動画会話による編集キャラクターの一貫性物理的に正確なモーション音声リファレンスSynthIDウォーターマーク
Gemini Omni

主な機能

Gemini Omniが他のAIモデルと異なる点

技術仕様

主要なスペックと機能を一覧で確認

Omni Flash

GoogleのGemini Omniファミリー初のモデル

Video

画像と音声の出力はGemini Omniのロードマップに予定

Up to 10s

Flashクリップはローンチ時にアクセス拡大のため10秒上限

Text, image, audio, video

1つのGemini Omniプロンプトで任意の組み合わせが可能

Voice references

まず音声サンプルに対応、後にフル音声入力も追加予定

SynthID

すべてのGemini Omni出力に付与される知覚できないAI出所ウォーターマーク

May 19, 2026

Google I/O 2026で発表

Google DeepMind

any-to-any動画制作におけるVeoの後継的な位置づけ

活用事例

クリエイターや企業がMorphicでGemini Omniを活用する方法

マルチ入力のストーリーボード制作

キャラクター画像、ロケ写真、音楽キュー、1行のビートを投入すると、Gemini Omniがショットを組み立てます。フォローアッププロンプトで同じシーンを繰り返し改善できます。

会話型動画編集

既存のクリップを自然な言葉で編集できます。衣装変更、背景差し替え、ライティング調整、ビートのタイミング変更。Gemini Omniはショットの他の部分を安定して保ちます。

マーケティング動画

ブランドカラー、製品の形状、画面上のテキストを守った広告カットを生成。製品写真、ナレーション、設定のブリーフを1つのプロンプトで組み合わせ、完成した広告スポットに仕上げます。

教育用解説動画

物理と実世界の推論を活用して、科学、歴史、エンジニアリングの概念をビジュアル化。科学的な正しさを保ちながら、クリーンで見せられる映像を生成します。

アバター・スポークスパーソン動画

ポートレート画像と音声リファレンスを組み合わせると、Gemini Omniは複数の短い動画で同じプレゼンターを生成。コース教材、製品ウォークスルー、SNSショートに最適です。

SNSショート動画

10秒以内のクリップはYouTube Shorts、Reels、TikTokの尺にぴったり。プロンプトをやり直さず会話でバリエーションを生成し、最も刺さるバージョンを公開できます。

プロンプト例

プロンプトを開いて編集し、生成してください

シネマティックアクション

Detective walking through neon-lit Tokyo alley at night, rain reflections on wet pavement, low-angle tracking shot, gritty noir

Edit prompt

製品ローンチ

Matte-black wireless earbuds rotating above a marble pedestal, soft rim light, subtle haze, premium commercial mood

Edit prompt

自然解説

Slow-motion water droplet hitting a leaf and bouncing, macro lens, soft morning light, accurate fluid behavior

Edit prompt

アバタースポークスパーソン

Confident host in front of warm studio backdrop, eye contact, calm gestures, soft three-point lighting, broadcast feel

Edit prompt

建築ウォークスルー

Slow dolly through a minimalist concrete house at golden hour, long shadows, dust in the sunlight, calm score-ready pacing

Edit prompt

ストーリービート

Same character from earlier shot now seated by a window, reading a letter, expression shifting from worry to relief, soft natural light

Edit prompt

シンプルな料金体系

今すぐ無料で始めて、いつでもアップグレードまたはキャンセルできます。

Basic

$0/
請求額は $0

500 月 クレジット

1 ユーザーのみ

すべてのモデル

ワークフロー

Standard

$0/
請求額は $0

2800 月 クレジット

1 ユーザーのみ

すべてのモデル

ワークフロー

Pro

$0/
請求額は $0

6000 共有 月 クレジット

1 ユーザー

+ 最大 4 名まで追加費用

すべてのモデル

ワークフロー

Pro Max

$0/
請求額は $0

24000 共有 月 クレジット

1 ユーザー

+ 最大 9 名まで追加費用

すべてのモデル

ワークフロー

Enterprise

より高い制限のために

カスタム

料金と請求条件

無制限クレジット
カスタムシート制限
すべてのモデル
ワークフロー
Pricing Gradient

Free

For playing around

$0

forever free

最大20クレジット
1ユーザーのみ
一部のモデル
ワークフロー

FAQs

Gemini Omniとは何ですか?
Gemini OmniはGoogle I/O 2026で発表されたGoogle初のany-to-anyマルチモーダルモデルです。最初のリリースであるGemini Omni Flashは、テキスト、画像、音声、動画を入力として受け付け、動画を出力します。すべてのクリップに会話による編集、キャラクターの一貫性、SynthIDウォーターマークが付与されます。
Gemini Omniは画像モデルですか?
いいえ。Gemini Omniは動画を出力します。モデルはテキスト、音声、動画と並んで画像を入力として受け付けますが、生成される出力は動画クリップです。Googleは画像と音声の出力モダリティをGemini Omniのロードマップに含めると述べていますが、初回ローンチには含まれていません。
MorphicでGemini Omniをどう使いますか?
Morphicを開き、プロンプトバーをVideoモードに切り替え、モデルピッカーからGemini Omniを選びます。テキスト、画像、音声、動画を任意の組み合わせで添付してプロンプトを実行します。結果を修正したい場合は次のメッセージで指示すれば、シーンは直前のコンテキストを保ったまま編集されます。
Gemini Omniの動画はどれくらいの長さですか?
Gemini Omni Flashのクリップはローンチ時に10秒で上限が設定されています。Googleはこの上限を、モデル自体の制約ではなく初回ロールアウト中のアクセス拡大のためのデプロイメント上の判断と位置づけており、将来のリリースではGemini Omniのより長い長さも可能です。
Gemini Omniはどのような入力を受け付けますか?
Gemini Omniは1つのプロンプト内でテキスト、画像、音声、動画を任意の組み合わせで受け付けます。音声リファレンスがサポートされる最初の音声入力で、より広範な音声入力と追加の出力モダリティが予定されています。
Gemini OmniとVeo 3.1の違いは?
Veo 3.1はGoogle DeepMindの写実的な動画モデルで、4K解像度、ネイティブ音声、8秒のクリップを備え、放送品質のリアリズム向けに調整されています。Gemini Omni Flashはany-to-anyの兄弟モデルで、より短い長さ(最大10秒)、マルチ入力の推論、会話による編集、編集をまたいだ持続的なキャラクターの一貫性に焦点を当てています。Veoはリアリズムの専門家、Gemini Omniはマルチモーダルなディレクターです。
Gemini OmniとSeedance 2.0の違いは?
Gemini OmniとSeedance 2.0はどちらもマルチモーダル動画モデルです。Seedance 2.0は1回の生成で最大12個の混合アセットを受け付け、ネイティブ音声合成と音楽ビート同期を備え、1080p、4〜15秒に対応します。Gemini Omni Flashはターンごとの会話による編集と、Googleの物理と実世界の推論に焦点を当てており、現在は10秒上限です。
Gemini Omniにはウォーターマークがありますか?
はい。Gemini Omniで生成されたすべての動画には、AIの出所を示すGoogleの知覚できないSynthIDウォーターマークが付与されます。ウォーターマークは視聴者には見えず、再エンコードやリサイズなどの一般的な編集にも耐えます。
Gemini Omniはキャラクターの一貫性に対応していますか?
はい。1つのGemini Omniショットで登場したキャラクターは、同じ会話内のカットや後続の編集をまたいでも顔、衣装、声を保ち、毎回リファレンスを再アップロードする必要はありません。
Gemini Omniはいつリリースされましたか?
GoogleはGemini Omniを2026年5月19日にGoogle I/O 2026で発表しました。Gemini Omni Flashはこのファミリーの最初のリリースで、画像と音声の出力は今後追加が予定されています。

Gemini Omni をMorphicで試す

Morphicに登録してGemini Omniでクリエイションを始めましょう。ダウンロード不要、セットアップ不要。やりたいことを説明するだけで生成できます。