Question 1

Gemini Omniとは何ですか？

Accepted Answer

Gemini OmniはGoogle I/O 2026で発表されたGoogle初のany-to-anyマルチモーダルモデルです。最初のリリースであるGemini Omni Flashは、テキスト、画像、音声、動画を入力として受け付け、動画を出力します。すべてのクリップに会話による編集、キャラクターの一貫性、SynthIDウォーターマークが付与されます。

Question 2

Gemini Omniは画像モデルですか？

Accepted Answer

いいえ。Gemini Omniは動画を出力します。モデルはテキスト、音声、動画と並んで画像を入力として受け付けますが、生成される出力は動画クリップです。Googleは画像と音声の出力モダリティをGemini Omniのロードマップに含めると述べていますが、初回ローンチには含まれていません。

Question 3

MorphicでGemini Omniをどう使いますか？

Accepted Answer

Morphicを開き、プロンプトバーをVideoモードに切り替え、モデルピッカーからGemini Omniを選びます。テキスト、画像、音声、動画を任意の組み合わせで添付してプロンプトを実行します。結果を修正したい場合は次のメッセージで指示すれば、シーンは直前のコンテキストを保ったまま編集されます。

Question 4

Gemini Omniの動画はどれくらいの長さですか？

Accepted Answer

Gemini Omni Flashのクリップはローンチ時に10秒で上限が設定されています。Googleはこの上限を、モデル自体の制約ではなく初回ロールアウト中のアクセス拡大のためのデプロイメント上の判断と位置づけており、将来のリリースではGemini Omniのより長い長さも可能です。

Question 5

Gemini Omniはどのような入力を受け付けますか？

Accepted Answer

Gemini Omniは1つのプロンプト内でテキスト、画像、音声、動画を任意の組み合わせで受け付けます。音声リファレンスがサポートされる最初の音声入力で、より広範な音声入力と追加の出力モダリティが予定されています。

Question 6

Gemini OmniとVeo 3.1の違いは？

Accepted Answer

Veo 3.1はGoogle DeepMindの写実的な動画モデルで、4K解像度、ネイティブ音声、8秒のクリップを備え、放送品質のリアリズム向けに調整されています。Gemini Omni Flashはany-to-anyの兄弟モデルで、より短い長さ（最大10秒）、マルチ入力の推論、会話による編集、編集をまたいだ持続的なキャラクターの一貫性に焦点を当てています。Veoはリアリズムの専門家、Gemini Omniはマルチモーダルなディレクターです。

Question 7

Gemini OmniとSeedance 2.0の違いは？

Accepted Answer

Gemini OmniとSeedance 2.0はどちらもマルチモーダル動画モデルです。Seedance 2.0は1回の生成で最大12個の混合アセットを受け付け、ネイティブ音声合成と音楽ビート同期を備え、1080p、4〜15秒に対応します。Gemini Omni Flashはターンごとの会話による編集と、Googleの物理と実世界の推論に焦点を当てており、現在は10秒上限です。

Question 8

Gemini Omniにはウォーターマークがありますか？

Accepted Answer

はい。Gemini Omniで生成されたすべての動画には、AIの出所を示すGoogleの知覚できないSynthIDウォーターマークが付与されます。ウォーターマークは視聴者には見えず、再エンコードやリサイズなどの一般的な編集にも耐えます。

Question 9

Gemini Omniはキャラクターの一貫性に対応していますか？

Accepted Answer

はい。1つのGemini Omniショットで登場したキャラクターは、同じ会話内のカットや後続の編集をまたいでも顔、衣装、声を保ち、毎回リファレンスを再アップロードする必要はありません。

Question 10

Gemini Omniはいつリリースされましたか？

Accepted Answer

GoogleはGemini Omniを2026年5月19日にGoogle I/O 2026で発表しました。Gemini Omni Flashはこのファミリーの最初のリリースで、画像と音声の出力は今後追加が予定されています。

Gemini Omni

主な機能

any-to-any入力

会話による編集

キャラクターの一貫性

物理と実世界の推論

音声リファレンス

SynthIDウォーターマーク

技術仕様

活用事例

マルチ入力のストーリーボード制作

会話型動画編集

マーケティング動画

教育用解説動画

アバター・スポークスパーソン動画

SNSショート動画

プロンプト例

シネマティックノワール

製品ローンチ

自然解説

アバタースポークスパーソン

建築ウォークスルー

ストーリービート

シンプルな料金体系

よくある質問

Gemini Omniをもっと知る

その他のモデル