목차
- Seedance 2.0이란?
- Seedance 2.0 vs Kling vs Veo vs Sora: 기능 비교
- 주요 기능 및 역량
- Seedance 2.0 입력 사양 이해하기
- Seedance 2.0 멀티모달 참조 사용법
- Seedance 2.0 고급 기능
- Seedance 2.0 활용 사례 및 예시
- Seedance 2.0 모범 사례
- 결론
- 자주 묻는 질문
Seedance 2.0이란?
Seedance 2.0은 바이트댄스의 고급 멀티모달 AI 비디오 모델로, 이미지, 비디오, 오디오, 텍스트 입력을 결합하여 이전에 없던 창작 제어를 제공합니다. 이 완벽 가이드에서는 Seedance를 Kling, Veo, Sora와 비교하고, 전문가가 Morphic에서 멀티모달 비디오 워크플로우를 마스터하는 방법을 안내합니다.
글자로 된 프롬프트에만 의존하는 기존 텍스트-투-비디오 모델과 달리, Seedance 2.0은 시각·청각 참조를 통해 원하는 것을 AI에게 정확히 보여줄 수 있게 합니다. 참조 이미지를 업로드해 스타일과 구도를 정하고, 원하는 카메라 움직임이나 동작을 보여주는 비디오 클립을 사용하고, 분위기와 리듬을 위한 오디오를 추가한 뒤, 상세한 텍스트 프롬프트로 창작 방향을 구체화할 수 있습니다.
전문 비디오 제작을 위한 Seedance 2.0
Seedance 2.0은 AI 비디오 생성의 근본적 한계, 즉 설명과 비전 사이의 간극을 해소합니다. 복잡한 카메라 움직임, 캐릭터 디테일, 시각 효과를 글로 설명하려 하지 않고 직접 예시를 제공할 수 있습니다. 이 멀티모달 접근으로 다음을 얻을 수 있습니다.
- 정확한 시각 제어 — 이미지 참조를 통한 제어
- 정확한 동작 재현 — 비디오 참조를 통한 재현
- 리듬·분위기 동기화 — 오디오 통합
- 일관된 캐릭터와 스타일 — 여러 샷에 걸친 유지
- 연속성을 유지하는 복잡한 장면 전환
모델은 여러 참조 유형을 동시에 이해하고 결합하는 데 뛰어나 상업 제작, 콘텐츠 제작, 전문 비디오 워크플로우에 특히 유용합니다.
Seedance 2.0 vs Kling vs Veo vs Sora: 기능 비교
AI 비디오 생성 도구를 평가할 때, 각 플랫폼의 구체적 역량을 이해하면 워크플로우에 맞는 선택을 하는 데 도움이 됩니다. Seedance 2.0과 주요 대안을 비교하면 다음과 같습니다.
| 기능 | Seedance 2.0 | Kling 3.0 | Veo 3.1 | Sora |
|---|---|---|---|---|
| 멀티모달 입력 지원 | 이미지, 비디오, 오디오, 텍스트 | 이미지, 비디오, 오디오, 텍스트 | 이미지, 텍스트 | 이미지, 텍스트 |
| 최대 비디오 길이 | 최대 15초 | 최대 15초 | 최대 8초(60초 이상 확장 가능) | 최대 60초 |
| 오디오 통합 | 오디오 직접 업로드 및 참조 | 립싱크·다국어 대사 지원 네이티브 오디오 | 사운드 이펙트·대사 지원 네이티브 오디오 | 텍스트-투-오디오만 |
| 비디오 참조 역량 | 동작·카메라 완전 재현 | AI 디렉터와 동작·카메라 재현 | 스타일 전환 및 참조 이미지(최대 3개) | 제한적 |
| 공개 이용 가능성 | Morphic에서 이용 가능 | 공개 접근 | 제한적(Gemini 앱, Flow, API) | 제한적 베타 |
주요 차별점:
멀티모달 유연성: Seedance 2.0과 Kling 3.0 모두 비디오·오디오 파일 직접 업로드를 포함한 포괄적 멀티모달 지원을 제공합니다. Veo 3.1은 참조 이미지(최대 3개)를 지원하지만 오디오는 참조가 아니라 생성됩니다. Sora는 주로 텍스트·이미지 기반입니다.
비디오 참조 깊이: Seedance 2.0과 Kling 3.0은 참조 영상의 복잡한 카메라 움직임, 안무, 특수 효과 재현에 뛰어납니다. Kling 3.0의 "AI 디렉터"는 멀티샷 장면 구성을 자동화합니다. Veo 3.1은 강한 캐릭터 일관성의 이미지-투-비디오에 초점을 두며, 비디오-투-비디오 동작 재현은 상대적으로 덜 강조됩니다.
오디오 역량: Seedance 2.0은 정확한 분위기 제어와 비트 동기화를 위해 오디오 파일을 직접 업로드할 수 있습니다. Kling 3.0은 5개 언어에서 정확한 립싱크의 네이티브 다국어 오디오를 생성합니다. Veo 3.1은 오디오를 네이티브로 생성하지만 오디오 파일 참조는 받지 않습니다. Sora는 텍스트 설명에서만 오디오를 생성합니다.
길이와 확장: Sora는 단일 생성에서 최대 60초로 가장 길지만, Veo 3.1의 확장 기능으로 60초를 넘어 클립을 이어갈 수 있습니다. Seedance 2.0과 Kling 3.0은 둘 다 15초 생성과 확장을 지원합니다.
해상도와 품질: Kling 3.0과 Veo 3.1은 4K 출력을 지원해 방송급 콘텐츠에 유리합니다. Seedance 2.0은 전문가급 용도에 적합한 고품질 비디오를 생성합니다. Veo 3.1은 모바일 우선 콘텐츠를 위한 네이티브 세로(9:16) 포맷을 지원합니다.
실질적 접근성: Morphic와의 Seedance 2.0 통합과 Kling 3.0의 공개 이용으로 전문 워크플로우에 즉시 접근할 수 있습니다. Veo 3.1은 Google 생태계(Gemini 앱, Flow 또는 API) 접근이 필요하고, Sora는 제한된 베타 상태입니다.
2026년 2월 기준 정보입니다. 기능 및 이용 가능 여부는 변경될 수 있습니다.
Seedance 2.0의 주요 기능 및 역량
멀티모달 입력 시스템
Seedance 2.0은 조합하여 사용할 수 있는 네 가지 입력 유형을 지원합니다:
이미지 입력(최대 9개)
- 시각 스타일과 미적 방향 정의
- 캐릭터 외형 설정 및 일관성 유지
- 장면 구도와 프레이밍 설정
- 정확한 재현을 위한 제품 디테일 지정
- 조명, 컬러 그레이딩, 분위기 제어
비디오 입력(최대 3개 클립, 합계 15초)
- 특정 카메라 움직임과 촬영 기법 참조
- 동작 패턴과 안무 재현
- 장면 전환과 편집 리듬 복사
- 특수 효과와 시각 기법 시연
- 캐릭터 동작과 상호작용 제시
오디오 입력(MP3 포맷, 최대 3개 파일, 합계 15초)
- 음악으로 분위기와 감정 톤 설정
- 리듬과 비트 구조로 페이싱 제어
- 특정 사운드 이펙트나 앰비언트 오디오 추가
- 대사를 위한 보이스 특성 매칭
- 오디오 큐에 맞춘 시각 변화 동기화
텍스트 프롬프트(자연어)
- 내러티브와 스토리 진행 안내
- 참조에 나오지 않은 동작과 움직임 지정
- 장면 전환과 타이밍 기술
- 참조가 어떻게 적용될지 명확히
- 시각 참조 너머의 디테일 추가
중요 제한: 시스템은 모든 입력 유형을 합쳐 최대 12개 파일까지 받습니다. 이 한도에 가까워질 때는 영향이 큰 참조를 전략적으로 선택하는 것이 중요합니다.
참조 역량 아키텍처
Seedance 2.0의 핵심 혁신은 참조 이해 시스템입니다. 입력을 단순 스타일 가이드로 취급하지 않고, 모델은 각 참조에서 구체적 요소를 분석·추출합니다.
이미지에서: 구도 구조, 캐릭터 특징, 객체 디테일, 조명 설정, 색 관계, 공간 배치, 스타일 특성
비디오에서: 카메라 동선, 움직임 속도·가속도, 샷 프레이밍 변화, 피사체 동작과 타이밍, 특수 효과 구현, 전환 기법
오디오에서: 리듬·비트 패턴, 톤적 분위기, 볼륨 다이나믹스, 사운드 이펙트 타이밍, 보이스 특성
이러한 세밀한 이해로 각 참조의 어떤 측면이 생성에 반영될지 지정할 수 있어 최종 결과에 대한 정확한 제어가 가능합니다.
핵심 생성 품질 개선
멀티모달 역량 외에도 Seedance 2.0은 기반적 개선을 제공합니다.
현실적인 물리 동역학: 객체와 캐릭터가 자연스러운 물리로 움직입니다. 옷이 자연스럽게 늘어지고, 액체가 설득력 있게 흐르며, 요소 간 상호작용이 현실 규칙을 따릅니다.
부드러운 동작 연출: 끊김 없는 연속 동작으로 어색한 전환이나 모핑 아티팩트가 없습니다. 복잡한 다단계 움직임도 실행 전반에 일관성을 유지합니다.
정확한 프롬프트 이해: 시간 표시("5초 시점에"), 공간 관계("배경 뒤에"), 복잡한 다중 피사체 시나리오를 포함한 상세 지시를 정확히 해석합니다.
일관된 스타일 유지: 생성 시작 시 정해진 시각적 특성이 끝까지 안정적으로 유지됩니다. 캐릭터 외형, 조명, 미적 스타일이 장면이 진행되며 바뀌지 않습니다.
복잡한 동작 실행: 격투 안무, 손동작 디테일, 말할 때의 표정, 여러 캐릭터의 조율된 상호작용 같은 난이도 높은 시퀀스를 처리합니다.
멀티모달 제어를 체험할 준비가 되셨나요? Morphic에서 Seedance 2.0으로 제작 시작하기 →
기술 사양
| 항목 | 사양 |
|---|---|
| 생성 길이 | 4–15초(1초 단위 선택) |
| 출력 해상도 | 고품질 비디오(콘텐츠에 따라 상이) |
| 프레임 레이트 | 표준 30fps 또는 시네마틱 24fps |
| 종횡비 | 16:9, 2.35:1 와이드스크린, 세로 포맷 등 다수 |
| 오디오 출력 | 통합 사운드 이펙트 및 BGM 생성 |
| 파일 포맷 | 이미지: JPG, PNG; 비디오: 일반 포맷; 오디오: MP3 |
Seedance 2.0 입력 사양 이해하기
파일 수 및 길이 제한
생성 품질을 최적화하면서 연산 자원을 관리하기 위해 Seedance 2.0은 다음과 같은 입력 제한을 둡니다.
유형별 파일 한도:
- 이미지: 최대 9개
- 비디오: 최대 3개 클립
- 오디오: 최대 3개 파일
합산 길이 한도:
- 비디오 참조: 모든 클립 합계 15초
- 오디오 참조: 모든 파일 합계 15초
전체 시스템 한도:
- 혼합 입력 파일 총합: 최대 12개(유형 통합)
- 생성 출력 길이: 4–15초(사용자 선택)
전략적 입력 선택
12개 파일 한도 안에서 작업할 때는 최종 결과에 미치는 영향에 따라 자료를 우선순위화하세요.
우선순위 1: 핵심 시각 스타일(이미지 2–3장)
창작 방향을 정하는 기본 미학, 컬러 그레이딩, 시각적 접근을 정의합니다.
우선순위 2: 캐릭터/피사체 참조(이미지 1–3장)
캐릭터 연속성이 필요한 멀티샷 시퀀스에서 주 피사체의 일관된 외형을 확보합니다.
우선순위 3: 동작·카메라 참조(비디오 1개)
특정 카메라워크나 동작이 비전에 핵심이면, 이를 명확히 보여주는 비디오 참조 하나를 할당하세요.
우선순위 4: 오디오 기반(오디오 1개)
리듬, 분위기, 특정 사운드가 필수일 때 이 요소를 가장 잘 보여주는 오디오 참조를 포함하세요.
우선순위 5: 보조 디테일(남은 슬롯)
장면 참조, 제품 디테일, 보조 시각 요소에 추가 슬롯을 사용하세요.
실전 예시: 특정 제품 외형, 역동적 카메라워크, 경쾌한 음악이 필요한 15초 광고의 경우:
- 이미지 2장: 다양한 각도의 제품
- 이미지 1장: 원하는 컬러 그레이딩·조명 스타일
- 비디오 1개: 카메라 움직임 참조
- 오디오 1개: 페이싱용 음악
- 나머지 7슬롯: 장면 환경, 추가 제품 디테일 또는 사용하지 않음
입력 품질 가이드라인
이미지 참조:
- 정확도가 중요할 때는 선명하고 조명이 좋은 사진 사용
- 고해상도일수록 디테일 재현에 유리
- 동일 피사체의 여러 각도는 일관성 향상
- 과도하게 압축되거나 저품질 이미지는 피하기
비디오 참조:
- 참조하고 싶은 요소가 명확히 보이도록
- 여러 요소가 섞인 긴 클립보다 한 가지 측면에 집중한 짧은 클립이 유리
- 고품질 비디오가 동작 이해를 높임
- 관련 구간만 보이도록 트리밍
오디오 참조:
- 가능하면 배경 소음이 없는 깨끗한 오디오 사용
- 원하는 리듬·분위기가 분명히 드러나도록
- 목표 비디오 길이에 맞춰 대략적인 길이 확보
- 여러 목적에 쓰일 경우 비디오 파일의 오디오 활용 검토
Seedance 2.0 멀티모달 참조 사용법
Seedance 2.0은 참조 업로드와 프롬프트 작성 인터페이스를 제공하는 Morphic를 통해 이용할 수 있습니다. 업로드한 각 파일이 생성에서 어떻게 쓰일지 지정할 때 @ 멘션 구조를 사용합니다.
@ 참조 시스템
Morphic에 자료를 업로드한 뒤, @ 기호와 파일 식별자(Image 1, Video 1, Audio 1 등)를 붙여 프롬프트에서 참조합니다. 각 참조가 어떤 목적으로 쓰이는지 명시하는 것이 핵심입니다.
기본 참조 구조:
@[Material Type + Number] as/for [specific purpose], [additional context]
명확한 참조 vs 불명확한 참조:
불명확: "Use @Image 1 and @Video 1 to make a video"
명확: "@Image 1 as the opening frame showing the character's face, reference the camera push-in movement from @Video 1, use @Audio 1 for background music to establish an upbeat mood"
효과적인 멀티모달 프롬프트 작성: CRAFT 프레임워크
전문가급 결과를 위해서는 구조화된 프롬프트 작성이 필요합니다. CRAFT 프레임워크는 멀티모달 참조를 체계적으로 반영하는 방법을 제공합니다.
C - Context(맥락): 장면과 환경 설정
장소, 시대, 분위기, 전체 세팅으로 무대를 세우고, 여기서 장면 이미지를 참조하세요.
예: "In a dimly lit jazz club at night, referencing the interior atmosphere from @Image 1"
R - Reference(참조): @ 멘션과 목적 명시
어떤 참조 자료를 쓰고, 각각이 생성에 어떻게 반영될지 구체적으로 적습니다.
예: "@Image 2 for the main character's appearance and clothing, @Video 1 for the walking motion and pace, @Audio 1 for the background jazz music"
A - Action(동작): 캐릭터·객체 움직임 설명
장면에서 일어나는 일, 캐릭터 동작, 객체 상호작용, 이벤트 순서를 구체적으로 적습니다.
예: "The character walks slowly across the room, stops at the bar, picks up a glass, and takes a sip while looking toward the door"
F - Framing(프레이밍): 카메라워크와 촬영 기법 정의
샷 유형, 카메라 움직임, 앵글, 전환을 촬영 용어로 지정합니다.
예: "Start with a wide establishing shot, dolly in to a medium close-up as the character reaches the bar, then cut to an over-the-shoulder shot looking toward the door"
T - Timing(타이밍): 시간 표시 및 오디오 조율
긴 시퀀스를 시간 구간으로 나누어 페이싱을 제어하고, 특정 이벤트가 정해진 순간에 일어나도록 합니다. 타이밍 구조 안에 오디오 사양을 통합하세요.
예: "0-4 seconds: establishing shot and walk begins; 4-8 seconds: character reaches bar and picks up glass; 8-12 seconds: drinks while looking at door; 12-15 seconds: camera follows eyeline to door. Throughout: background jazz from @Audio 1 plays, with ambient room sound. At the 8-second mark, add a door opening sound effect"
CRAFT 예시 프롬프트:
Context: In a 1940s noir-style detective office at night, with venetian blind shadows across the desk, referencing the lighting and atmosphere from @Image 1. Reference: @Image 2 for the detective's appearance (fedora, trench coat), @Video 1 for the slow, deliberate walking pace and movement style. Action: The detective enters frame from the left, walks to his desk, picks up a photograph, studies it intensely, then sets it down with a heavy sigh. Framing: Open with a wide shot showing the full office space, tracking shot following the detective as he walks, push in to a close-up of his face as he examines the photograph, cut to an insert shot of the photograph in his hands, pull back to medium shot as he sets it down. Timing: 0-3 seconds: entry and walk begins; 3-7 seconds: reaches desk and picks up photo; 7-11 seconds: close examination of photo; 11-15 seconds: sets photo down and sighs. Audio: Continuous moody saxophone from @Audio 1, footsteps on wooden floor, photo sliding on desk, deep exhale at the end.
이미지 참조 기법
시각 스타일과 미적 방향 설정
이미지는 생성의 전체적인 룩앤필을 정합니다. 색 팔레트, 조명 접근, 구도 스타일, 미적 처리를 정의할 때 사용하세요.
Create a cyberpunk street scene with the visual style from @Image 1. Match the neon-lit aesthetic, wet pavement reflections, and moody blue-magenta color grading. Include the vertical architecture composition from @Image 2.
여러 샷에 걸친 캐릭터 일관성 유지
같은 캐릭터가 나오는 여러 비디오를 만들 때, 각 프롬프트에서 동일한 캐릭터 이미지를 참조해 외형 일관성을 유지하세요.
Feature the woman from @Image 1 throughout this sequence, maintaining her exact facial features, hairstyle, and clothing. She starts in the outdoor setting from @Image 2, then the scene transitions to the indoor environment shown in @Image 3. Her appearance remains consistent across both locations.
정확한 디테일의 제품 쇼케이스
상업·제품 중심 콘텐츠에서는 여러 각도와 디테일 샷을 참조해 정확한 재현을 확보하세요.
Create a product showcase for the handbag in @Image 1. The side profile should match @Image 2, the surface texture and material details should reference @Image 3, and the hardware and clasp should match @Image 4. Use smooth rotating camera movements to display all angles. Lighting should be bright and clean to show all intricate details.
비디오 참조 기법
카메라 움직임과 촬영 기법 재현
비디오 참조는 텍스트만으로 설명하기 어려운 특정 카메라 기법을 보여주는 데 적합합니다.
Place the character from @Image 1 in the corridor from @Image 2. Strictly follow all camera movement effects from @Video 1: tracking shot from behind as the character walks, camera circles around to the front with a low-angle perspective, then pans right 90 degrees to frame the doorway. Execute as a single continuous shot with no cuts.
동작 패턴과 안무 복사
댄스, 격투 시퀀스, 특정 동작 패턴에는 비디오 참조가 프레임 단위 동작 가이드를 제공합니다.
Feature the martial artist from @Image 1 performing moves in the training hall from @Image 2. The character should execute the exact kick sequence shown in @Video 1: spinning back kick, transition to roundhouse kick, ending with an aerial spinning kick. Match the speed, height, and fluidity of the reference movements.
특수 효과와 시각 기법 재현
비디오 참조로 파티클 효과, 전환, 합성 기법 등 시각 효과를 정확히 재현할 수 있습니다.
The character from @Image 1 performs a magical transformation. Reference the particle effects from @Video 1: glowing particles rise from the ground, swirl around the character, brightness intensifies, then particles burst outward revealing the transformed appearance from @Image 2.
오디오 참조 기법
BGM 통합 및 분위기 설정
오디오 참조는 음악 선택을 통해 비디오의 감정 톤과 페이싱을 정합니다.
Create a 15-second motivational fitness video featuring the athlete from @Image 1 in the gym setting from @Image 2. Use the energetic music from @Audio 1 to establish an inspiring, powerful mood. Camera movements should match the driving rhythm of the music with dynamic push-ins and motion.
시각 변화를 위한 비트 동기화
장면 전환, 컷, 시각 변화를 특정 음악 비트에 맞춰 정돈된 전문가급 페이싱을 만드세요.
The character from @Image 1 changes outfits with each musical beat from @Audio 1. First outfit from @Image 2, cut to second outfit from @Image 3 on the first beat, third outfit from @Image 4 on the second beat, fourth outfit from @Image 5 on the third beat. Each cut happens precisely on the beat. Use quick cuts with no transition effects.
보이스 톤과 대사 매칭
특정 보이스 특성이 중요할 때는 원하는 보이스 품질이 담긴 오디오 또는 비디오 파일을 참조하세요.
The narrator's voice should match the deep, authoritative timbre from @Audio 1. The narration text: "In a world transformed by technology, one person dares to question everything." Deliver with the same pacing and dramatic emphasis as the reference.
복합 다중 참조 예시
상업 제작을 위한 모든 입력 유형 결합
예: 제품 광고
Context: Modern minimalist studio with @Image 1 as the environment reference: white seamless background with dramatic side lighting. References: @Image 2 and @Image 3 show the product (wireless headphones) from front and side angles. @Video 1 demonstrates the desired camera movement: slow rotating dolly shot. @Audio 1 provides the upbeat electronic background music. Action: The headphones float in the center of frame, slowly rotating. At the 5-second mark, they gently unfold. At the 10-second mark, LED lights activate on the ear cups. Framing: Start with a wide shot establishing the product in space. Continuously dolly around the product in a circular path while simultaneously pushing in slightly, matching the camera path from @Video 1. Timing: 0-5 seconds: rotation begins, camera circles; 5-10 seconds: headphones unfold while rotation continues; 10-15 seconds: LED activation, camera completes circle and pushes to close-up. Audio: Electronic music from @Audio 1 plays throughout. Add subtle mechanical sound effect when headphones unfold at 5 seconds, soft power-on sound when LEDs activate at 10 seconds.
대사가 있는 다캐릭터 장면
예: 내러티브 장면
Context: Corporate conference room during daytime, with the modern interior from @Image 1: large windows, long table, professional setting. References: @Image 2 for the first executive's appearance (woman in navy suit), @Image 3 for the second executive's appearance (man in gray suit). @Video 1 shows the desired back-and-forth camera movement between speakers. @Audio 1 provides tense ambient music. Action: First executive stands, gestures emphatically while speaking. Second executive leans back in chair, arms crossed, then responds. First executive sits down heavily. Second executive stands and walks toward window. Framing: Start with wide shot showing both characters at opposite ends of table. Use shot-reverse-shot camera movement from @Video 1: cut to medium shot of first executive as she speaks, cut to medium shot of second executive as he responds, return to wide shot as second executive stands, follow him with smooth tracking shot as he walks to window. Timing: 0-4 seconds: first executive stands and speaks; 4-7 seconds: second executive responds from seated position; 7-10 seconds: first executive sits, second executive stands; 10-15 seconds: second executive walks to window. Audio: Tense ambient music from @Audio 1 plays at low volume throughout. First executive's dialogue (confident tone): "This merger is our only option." Second executive's dialogue (skeptical tone): "I've heard that before." Footsteps on floor as second executive walks.
Seedance 2.0 고급 기능
연속 내러티브를 위한 비디오 확장
Seedance 2.0은 기존 비디오를 이어서 스토리나 동작이 자연스럽게 계속되는 새 콘텐츠로 확장할 수 있습니다.
비디오 확장 작동 방식:
- 기존 비디오를 참조로 업로드
- 프롬프트에서 확장 길이와 일어나야 할 내용 지정
- 생성 길이를 확장 분량에 맞춤(최종 전체 길이가 아님)
- 모델이 지시에 따라 이어지는 부분을 생성
예: 카페 장면 확장
기존 비디오: 카페 테이블에 앉아 노트북을 보는 사람의 10초 클립
Extend @Video 1 by 5 seconds. The person closes the laptop, picks up their coffee cup, takes a sip while gazing out the window, then sets the cup down and stands up. Camera remains in medium shot throughout, maintaining the composition and lighting from the original video.
생성 설정: 생성 길이를 5초로 선택
모델은 참조 비디오의 마지막 프레임을 분석해 캐릭터 외형, 장면 조명, 카메라 앵글, 시각 스타일을 유지한 5초 연속 구간을 생성합니다.
확장 모범 사례:
- 연속성을 위해 확장은 상대적으로 짧게(5–8초)
- 원본 끝과 새 콘텐츠를 잇는 동작을 명확히 기술
- 일관되어야 할 요소(카메라 앵글, 조명, 캐릭터 위치) 언급
- 원본 비디오에 오디오가 있으면 확장에도 그 오디오 스타일 참조
비디오 퓨전 및 멀티클립 전환
여러 기존 비디오 클립 사이를 이어주는 콘텐츠를 생성해 자연스러운 전환을 만듭니다.
예: 두 장소 연결
기존 비디오:
- @Video 1: 도시 거리를 걷는 캐릭터(코너에 가까워지며 끝남)
- @Video 2: 같은 캐릭터가 아파트에 들어감(문 열리며 시작)
Create a 5-second transition segment between @Video 1 and @Video 2. The character from the end of @Video 1 rounds the corner, walks up exterior apartment steps visible in background of @Video 2's opening frame, reaches the door, and begins opening it (connecting to @Video 2's start). Match the character's appearance, walking pace, and movement style from both reference videos. Lighting transitions from outdoor daylight at the start to the interior lighting of @Video 2 at the end.
이렇게 하면 두 개의 별도 촬영을 부드럽게 이어 주는 브릿지 클립이 생성되어 캐릭터와 내러티브 연속성이 유지됩니다.
기존 비디오의 캐릭터 교체
비디오의 캐릭터나 피사체를 바꾸면서 카메라워크, 동작, 장면 디테일 등 나머지 요소는 그대로 유지합니다.
예: 음악 퍼포먼스 교체
In @Video 1, replace the female lead singer with the male artist from @Image 1. The performance actions should exactly replicate those in the original video: microphone handling, body movements, facial expressions, and interaction with the band. The replacement artist should match the timing and energy of the original performance frame-by-frame. All other elements remain unchanged: band members, stage, lighting, camera movements.
캐릭터 교체 활용 사례:
- 상업 컨셉에서 다른 탤런트 테스트
- 다른 배우로 같은 장면의 변형 제작
- 기존 푸티지에 새 브랜드 앰버서더 반영
- 현지 탤런트로 지역별 버전 제작
스토리라인 반전 및 내러티브 변경
기존 비디오의 시각·기술 요소는 유지한 채 내러티브 방향이나 결말을 완전히 바꿉니다.
예: 로맨스 드라마 반전
원본 비디오(@Video 1): 다리에서 남성이 여성에게 프로포즈하고, 여성이 승낙하고 포옹하는 로맨틱 장면
Subvert the storyline of @Video 1. The scene begins identically: the man kneels and opens the ring box. However, the woman's expression shifts from surprised joy to shocked realization. She steps back, shaking her head. The man's face changes from hopeful to cold and calculating. He stands slowly, his demeanor becoming menacing rather than loving. The woman says "You were lying to me from the very beginning!" The man responds with an icy smile: "This is what you owe my family." The confrontational ending replaces the original romantic embrace. Maintain all camera angles and movements from @Video 1.
이 기법으로 기존 푸티지의 촬영 기법과 제작 가치를 유지하면서 내러티브를 완전히 바꿀 수 있습니다.
원테이크 연속 롱샷
컷 없이 여러 환경을 따라가는 원테이크 시퀀스를 만듭니다.
예: 도시 추격 시퀀스
@Image 1, @Image 2, @Image 3, @Image 4, and @Image 5 depict a one-take tracking shot following a runner. Sequence: Begin at street level (@Image 1) with a wide shot as the runner enters frame from the right, running at full speed. Camera picks up and follows from behind as runner reaches the building entrance (@Image 2). Continue tracking as runner bounds up the interior staircase (@Image 3), maintaining close following distance. Emerge onto the rooftop level (@Image 4), camera still tracking from behind. Runner reaches the roof edge. Camera moves around to the front of the runner for the final frame, then cranes up to overhead perspective showing city skyline (@Image 5). Camera: Continuous handheld-style tracking throughout. No cuts. Slight camera shake for urgency and realism. Smooth movement transitions between environments. Timing: 0-3 seconds street run, 3-6 seconds enter building and start stairs, 6-10 seconds ascending stairs, 10-13 seconds emerge on roof and run to edge, 13-15 seconds crane to overhead shot.
크리에이티브 템플릿 재현
참조 비디오의 구조, 스타일, 기법을 복사한 뒤 자신의 피사체와 브랜딩으로 대체합니다.
예: 광고 스타일 적용
참조: @Video 1 — 특정 카메라 기법, 전환, 페이싱이 있는 고급 향수 광고
Create a luxury watch commercial by referencing the advertising style and structure of @Video 1. Use the same camera techniques: smooth dolly movements, dramatic lighting reveals, close-up detail focus, and elegant pacing. Replace the perfume bottle with the watch from @Image 1. Maintain the sophisticated color grading, transition timing, and rhythm from the reference. The environment should be minimalist and modern like @Image 2. Use the orchestral music from @Audio 1 to match the premium feel.
Seedance 2.0 활용 사례 및 예시
이 섹션에서는 산업과 난이도에 따른 Seedance 2.0 활용 사례를 보여줍니다. 각 산업별로 기초, 중급, 고급 예시를 통해 단계별 역량을 다룹니다.
상업·광고 제작
기초: 단일 제품 정적 쇼케이스
시나리오: 이커머스용 단순 제품 전시
Display the smartwatch from @Image 1 centered on the white background from @Image 2. Camera slowly rotates 360 degrees around the product over 10 seconds, maintaining the same distance throughout. Lighting is clean and bright with no harsh shadows. At the 8-second mark, the watch face illuminates showing the time display. Use subtle ambient electronic music from @Audio 1.
난이도: 단일 이미지 참조, 기본 카메라 움직임, 한 가지 시간 지정 이벤트
중급: 다각도 제품 데모
시나리오: 여러 기능을 보여주는 테크 제품 시연
Context: Clean studio environment with @Image 1 as lighting reference: soft, even illumination against minimal background. References: @Image 2 (front view of wireless earbuds), @Image 3 (side view), @Image 4 (charging case open). @Audio 1 for upbeat tech commercial background music. Action: 0-4 seconds: Earbuds in charging case, case lid closes automatically. 4-8 seconds: Case opens, earbuds rise slightly out of case (magnetic levitation effect). 8-12 seconds: Single earbud lifts out of case and rotates to show all angles. 12-15 seconds: LED indicator on case pulses to indicate charging. Framing: Start with overhead shot looking down at open case. Cut to front 3/4 angle as lid closes. Push in to medium shot for the opening sequence. Follow the lifted earbud with smooth tracking rotation. End with close-up of pulsing LED. Audio: Upbeat music from @Audio 1 plays throughout. Add satisfying "click" sound for case closing, subtle "whoosh" for earbud lift, soft pulse tone synced with LED.
난이도: 다중 이미지, 여러 시간 지정 이벤트, 다양한 카메라 앵글, 오디오 동기화
고급: 장면 전환이 있는 풀 광고
시나리오: 여러 환경에서 제품 사용을 보여주는 15초 라이프스타일 광고
Context: Create a lifestyle commercial for wireless headphones shown in @Image 1 and @Image 2 (different angles). Scene 1 (0-5 seconds): Urban commuter environment referencing @Image 3. Young professional walking through busy street, wearing headphones from @Image 1. Camera tracks alongside at medium distance. Street ambient noise gradually fades as subject taps headphones to activate noise cancellation: scene becomes silent except music from @Audio 1. Scene 2 (5-10 seconds): Transition to home office setting from @Image 4. Quick cut on beat of music. Same person now in video call, headphones visible. Camera push-in to close-up of headphones showing clear audio indicator LED. Split-screen effect shows clear communication on both sides of call. Scene 3 (10-15 seconds): Gym workout setting referencing @Image 5. Quick cut on music beat. Person doing intense workout, headphones stay secure. Dynamic camera movements matching the energy: quick cuts between different exercise angles, finally pulling back to wide shot. End with product logo and tagline appearing center frame. References: @Video 1 for the dynamic camera movement style in gym scene. @Audio 1 for background music that drives pacing throughout. Audio: Music from @Audio 1 provides continuity across all scenes. Scene 1: street ambient sound at start, then music only. Scene 2: soft keyboard typing and video call audio underneath music. Scene 3: gym ambient with music prominent. Framing: Cinematic 2.35:1 aspect ratio throughout. Professional color grading matching @Image 1's cool, modern tones. Smooth transitions on musical beats.
난이도: 다중 장면, 광범위한 참조(이미지 5장, 비디오 1개, 오디오 1개), 복합 오디오 레이어링, 정밀 타이밍, 전문 촬영
소셜 미디어 콘텐츠 제작
기초: 트렌드 스타일 퀵 컷 비디오
시나리오: 인기 전환 효과가 있는 단순 소셜 미디어 콘텐츠
The influencer from @Image 1 stands centered in frame against the bright background from @Image 2. She makes a quick hand gesture at the 3-second mark. On the gesture, quick jump cut to the same person wearing different outfit from @Image 3, same position and pose. At 6 seconds, another hand gesture and jump cut to third outfit from @Image 4. Use the upbeat trending music from @Audio 1. Cuts should happen exactly on the musical beats.
난이도: 다중 이미지 참조, 비트 동기화, 단순 전환 효과
중급: 다중 장소 스토리 시퀀스
시나리오: 일상 브이로그 스타일 콘텐츠
Context: Create a "day in the life" style montage for the content creator from @Image 1. References: @Image 2 (morning coffee shop), @Image 3 (co-working space), @Image 4 (outdoor park). @Video 1 shows the handheld camera movement style. @Audio 1 provides upbeat vlog background music. Sequence: 0-5 seconds: Coffee shop scene: creator enters, orders at counter, waves at camera with coffee in hand. Handheld camera style from @Video 1. 5-10 seconds: Co-working space: creator working at laptop, typing, then turns to camera and smiles. Cut to close-up of screen briefly. 10-15 seconds: Park scene: creator sitting on bench with laptop, closes it, stands and stretches with arms up, walks toward camera. Golden hour lighting. Framing: Handheld vlog style throughout referencing @Video 1's movement. Mix of medium shots and close-ups. Quick cuts between locations (cut on beat). Audio: Music from @Audio 1 throughout. Light coffee shop ambient in first segment, keyboard typing in second segment, outdoor birds and wind in third segment: all underneath music.
난이도: 다중 장소, 핸드헬드 스타일 참조, 오디오 레이어링, 개성 중심 콘텐츠
고급: 바이럴 스타일 복합 시각 효과
시나리오: 트렌드 효과가 있는 고퀄리티 소셜 미디어 콘텐츠
Context: Create a trending transformation video for the dancer from @Image 1, incorporating viral visual effects. References: @Image 2 (starting outfit casual streetwear), @Image 3 (ending outfit performance costume), @Video 1 (choreography reference for arm movements and spin), @Video 2 (particle effect transition style), @Audio 1 (high-energy music track for synchronization). Action & Effects: 0-3 seconds: Dancer stands casually in streetwear from @Image 2, urban background from @Image 4. Camera circles around dancer slowly. 3-4 seconds: Dancer performs the arm-raise movement from @Video 1. At peak of arm raise, screen glitches with digital distortion effect. 4-7 seconds: Particle effects referencing @Video 2 burst from the ground, swirling around dancer. Camera speeds up rotation. Particles intensify with music build. 7-9 seconds: Flash of light. When light fades, dancer is now in performance costume from @Image 3, mid-spin from @Video 1's choreography reference. 9-15 seconds: Complete the spin, landing in dramatic pose. Camera rotation ends at front-facing position. Environment has transformed to stage setting from @Image 5 with dramatic lighting. Music from @Audio 1 hits climax. End with freeze frame and text overlay. Framing: Start with slow cinematic camera rotation, speed up during transformation, end with dynamic front angle. 2-3 quick cuts during particle burst for impact. Audio: Music from @Audio 1 drives entire pacing. Sound effects: glitch sound at arm raise, whoosh during particle burst, impact sound on landing. Technical: Use fisheye lens effect from @Video 2 during transformation sequence. High contrast, saturated colors. Beat-synced effects.
난이도: 다중 복합 참조, 정밀 안무 매칭, 특수 효과 재현, 고급 오디오 동기화, 트렌드 스타일 통합
영화·엔터테인먼트 제작
기초: 분위기 있는 establishing shot
시나리오: 내러티브용 장면 설정 샷
Cinematic establishing shot of the abandoned mansion from @Image 1 at night. Camera starts wide, showing full building with overgrown grounds. Slowly push in toward the main entrance over 12 seconds. Dark, moody atmosphere with partial moonlight breaking through clouds. Windows are dark except for one on the second floor showing faint flickering light. Use the ominous ambient sound from @Audio 1. Add subtle wind in trees sound effect. 24fps for cinematic feel.
난이도: 단일 이미지, 기본 카메라 움직임, 분위기 구축
중급: 샷 리버스 샷 대사 장면
시나리오: 전문 커버리지가 있는 2인 대화
Context: Interior interrogation room scene with the stark environment from @Image 1: single overhead light, metal table, two chairs. Characters: Detective from @Image 2 (stern, middle-aged) sitting across from suspect from @Image 3 (nervous, young adult). Dialogue & Action: 0-5 seconds: Wide shot establishing both characters at table. Detective leans forward, hands clasped. Suspect avoids eye contact, fidgeting. 5-8 seconds: Cut to medium close-up of detective's face as he speaks: "We know you were there that night." Expression is intense, unblinking. 8-11 seconds: Cut to medium close-up of suspect's face. Brief flash of panic in eyes, then attempts to compose. Response: "I don't know what you're talking about." 11-15 seconds: Cut back to wide shot. Detective slides photograph across table toward suspect. Suspect's eyes widen seeing the photo. Detective leans back, satisfied. References: @Video 1 for the interrogation scene camera movement style and timing. @Audio 1 for tense ambient background music. Framing: Use classic shot-reverse-shot technique from @Video 1. Slightly low angle on detective for authority, slightly high angle on suspect for vulnerability. Keep lighting harsh and dramatic throughout. Audio: Tense music from @Audio 1 at low volume. Add ambient room tone. Metal chair creak when suspect shifts. Soft sound of photo sliding on metal table.
난이도: 캐릭터 이미지 2개, 특정 카메라 기법 참조, 대사 페이싱, 심리적 긴장감
고급: 복잡한 안무의 액션 시퀀스
시나리오: 특정 무술 안무가 있는 격투 장면
Context: Rooftop fight scene at sunset, environment from @Image 1 (urban rooftop with HVAC units, distant city skyline, dramatic orange sky). Characters: Hero from @Image 2 and @Image 3 (different angles showing costume details) versus three opponents from @Image 4, @Image 5, @Image 6. Choreography Reference: @Video 1 shows the specific fight sequence to replicate: hero dodges first attack, counters with spinning kick, transitions immediately to grapple with second opponent. Camera Reference: @Video 2 demonstrates the camera movement style: circling during fight, quick cuts on impacts, slow motion on key moves. Complete Sequence: 0-2 seconds: Establishing shot. Four opponents surround hero in wide circle. Camera rotates slowly around the group. Wind whips clothing. Tense standoff moment. Music from @Audio 1 builds. 2-4 seconds: First opponent charges. Camera quick-cuts to close-up of hero's face: determined expression. Then wider angle as hero dodges right, exactly matching the movement from @Video 1. 4-6 seconds: Hero executes spinning kick from @Video 1, striking first opponent. Camera follows kick in medium shot, then quick cut to opponent's impact with ground. Add impact sound effect. 6-9 seconds: Without pause, second opponent approaches. Hero drops into grapple, executing the specific move sequence from @Video 1: grab, pivot, throw. Camera circles around action as in @Video 2 reference, maintaining continuous view of fight. 9-11 seconds: Third opponent swings weapon. Slow motion as hero ducks underneath (2x slow speed). Camera follows hero's perspective looking up at weapon passing overhead. Resume normal speed as hero rises. 11-13 seconds: Hero's counter-attack: quick combination strike to third opponent. Multiple rapid cuts showing each strike from different angles, matching editing pace from @Video 2. 13-15 seconds: Hero stands victorious, three opponents on ground around them. Camera circles once more, then pushes in to close-up of hero's face. Sunset lighting creates silhouette effect. Music from @Audio 1 reaches climax. Technical Specifications: 24fps for cinematic motion, practical fight choreography matching @Video 1 exactly, camera work matching @Video 2's dynamic style, color grade warm sunset tones with high contrast, multiple quick cuts during peak action, slow motion at 2x reduction for dramatic moment. Audio Design: Music from @Audio 1 provides emotional drive throughout, impact sound effects on strikes, cloth movement sounds during spins and dodges, heavy breathing from combatants, wind sound on rooftop throughout, all sounds synced precisely with action.
난이도: 이미지 참조 6개, 비디오 참조 2개(안무+카메라 스타일), 오디오 참조, 복잡한 액션 안무, 다중 카메라 기법, 슬로우 모션, 전문 격투 편집, 정밀 오디오 동기화
전문 워크플로우 활용
프로젝트 연속성을 위한 비디오 확장
시나리오: 기존 촬영 푸티지에 추가 콘텐츠로 확장
기존 비디오: 현대적 오피스를 걸어가다 회의실 문 앞에서 끝나는 CEO 8초 샷
Extend @Video 1 by 7 seconds. The CEO from the end of the video opens the conference room door and enters. Inside, the conference room matches the design from @Image 1: large table, floor-to-ceiling windows with city view. Three executives from @Image 2, @Image 3, and @Image 4 are already seated and look up as CEO enters. CEO walks to the head of the table and sits down. Camera follows CEO through doorway with smooth tracking shot, then cuts to wide shot showing full conference room once CEO is seated. Maintain the same professional color grading and lighting style from @Video 1.
활용 사례: 리촬영 없이 기존 전문 비디오 자산에 추가
템플릿 기반 대량 콘텐츠 제작
시나리오: 일관된 스타일의 소셜 미디어 비디오 다수 제작
마스터 템플릿 프롬프트 (Video 1):
Product showcase video for [Product from @Image 1]. White background from @Image 2. Camera rotates 360 degrees around product over 10 seconds. At 7-second mark, product feature highlights with graphic callout. End with logo from @Image 3. Music from @Audio 1.
변형 프롬프트: 브랜드 일관성을 위해 @Image 2, @Image 3, @Audio 1은 유지하고 @Image 1만 다른 제품으로 교체
활용 사례: 제품 카탈로그용 확장 가능한 콘텐츠 제작, 여러 자산에 걸친 브랜드 정체성 유지
다국어 적응
시나리오: 동일 광고의 지역별 버전 제작
기본 프롬프트:
30-second commercial structure from @Video 1. Replace narration with [Language] voice matching @Audio 1's tone and pacing. Character from @Image 1 remains the same. Text overlays change to [Language] versions matching timing from @Video 1.
활용 사례: 일관된 시각 브랜딩의 현지화 버전이 필요한 국제 마케팅 캠페인
Seedance 2.0 모범 사례
CRAFT 프롬프팅 프레임워크(상세)
Seedance 2.0에서 전문가급 결과를 내려면 구조화된 프롬프트 설계가 필요합니다. CRAFT 프레임워크는 핵심 요소를 모두 지정하는 체계적 접근을 제공합니다.
C - Context(맥락): 장면과 환경 설정
동작이 어디서, 언제 일어나는지 정의합니다. 다음을 포함합니다.
- 물리적 장소와 세팅
- 시간대 또는 시대
- 분위기 조건(날씨, 조명 품질)
- 전체 무드와 톤
- 스토리에 중요한 환경 디테일
예: "In a neon-lit underground nightclub at 2 AM, with the moody atmosphere from @Image 1. Hazy air from smoke machines, walls lined with LED panels displaying abstract patterns, packed dance floor in background."
R - Reference(참조): @ 멘션과 정확한 목적 명시
멀티모달의 핵심은 여기 있습니다. 각 참조가 무엇을 기여하는지 명확히 하세요.
- @ 멘션을 분명히 적기
- 그 참조의 어떤 측면을 쓸지 정확히 지정
- 참조에 여러 요소가 있으면 쓰지 않을 것을 명시
예: "@Image 1 for the main character's facial features and hair style only, not the clothing. @Image 2 for the leather jacket costume. @Video 1 for the walking pace and confident stride pattern. @Audio 1 for the electronic background music that sets the energetic mood."
A - Action(동작): 캐릭터·객체 움직임 설명
장면에서 일어나는 일, 즉 비디오의 동사를 구체적으로 적습니다.
- 캐릭터 움직임과 제스처
- 객체 상호작용(들기, 내려놓기, 던지기)
- 표정과 감정 반응
- 여러 피사체 간 상호작용
- 물리 기반 이벤트(떨어짐, 액체 흐름, 연기 등)
예: "Character enters from frame left, walking with the confident stride from @Video 1. Eyes scan the crowd briefly, then lock onto someone off-screen. Slight smile forms. Character adjusts jacket collar with right hand, then begins moving forward through the crowd with purpose."
F - Framing(프레이밍): 카메라워크와 촬영 기법 정의
샷 구도를 지정할 때는 촬영 용어를 사용하세요.
- 샷 유형: 와이드 샷, 미디엄 샷, 클로즈업, 익스트림 클로즈업, 오버 더 숄더, POV
- 카메라 움직임: 돌리 인/아웃, 트래킹 샷, 팬 좌/우, 틸트 상/하, 크레인 상/하, 핸드헬드, 스테디캠
- 앵글: 로우 앵글, 하이 앵글, 아이 레벨, 더치 앵글
- 특수 기법: 히치콕 줌, 윕 팬, 랙 포커스, 얕은 심도
예: "Open with wide shot establishing the full nightclub environment. As character enters, camera picks up and begins tracking alongside in medium shot. When character stops to scan crowd, push in slowly to medium close-up. Cut to character's POV shot looking through crowd. Cut back to close-up of character's face as smile forms. Resume tracking shot as character moves through crowd, camera following from behind."
T - Timing(타이밍): 시간 표시 및 오디오 조율
정확한 제어를 위해 시퀀스를 시간 구간으로 나누세요.
- 초 단위 표시 사용(0–3초, 3–7초)
- 핵심 동작이 일어나는 시점 지정
- 이벤트 페이싱 제어
- 오디오를 시각 이벤트·전환과 맞추기
- 관련되면 오디오 파일 참조 및 비트 동기화
예: "0-3 seconds: establishing wide shot, character enters and begins walking. 3-6 seconds: camera tracks character, crowd scan moment. 6-9 seconds: close-up sequence with smile forming. 9-12 seconds: cut to POV shot. 12-15 seconds: resume tracking through crowd. Throughout: background music from @Audio 1 plays at moderate volume, swelling slightly at the 6-second smile moment."
CRAFT 전체 예시: 기업 교육 비디오
Context: Modern conference room during morning, natural window light streaming in from frame right. Environment matches the professional interior from @Image 1: glass walls, contemporary furniture, technology visible (screens, video conferencing equipment). Reference: @Image 2 for the business trainer's appearance (professional attire, confident demeanor). @Image 3 for the diverse group of trainees seated around the table. @Video 1 for the trainer's hand gestures and body language when explaining concepts. Action: Trainer stands at the head of the conference table, referencing the standing posture from @Video 1. She gestures toward the presentation screen on the wall, then looks at the group with an engaging smile. She walks along the side of the table while speaking, making eye contact with different trainees. Trainees show engaged body language: some lean forward, one takes notes, another nods in understanding. Trainer returns to the head of the table and concludes with a confident gesture. Framing: Begin with wide shot showing entire conference room from the corner, establishing the professional setting and all participants. Cut to medium shot of trainer from front 3/4 angle as she gestures toward screen. Cut to over-the-shoulder shot from behind trainer, showing trainees' attentive faces. Cut to medium tracking shot following trainer as she walks along table. Cut to close-up of engaged trainee taking notes. Return to medium shot of trainer at table head for conclusion. Timing: 0-3 seconds: wide establishing shot. 3-5 seconds: medium shot of trainer gesturing to screen. 5-7 seconds: over-shoulder showing trainee reactions. 7-10 seconds: tracking shot as trainer walks around table. 10-12 seconds: close-up of note-taking trainee. 12-15 seconds: medium shot of trainer concluding. Audio throughout: Corporate background music from @Audio 1 plays quietly: professional and unobtrusive. Trainer's voice is clear and confident with professional delivery matching the tone in @Video 1. Ambient sounds: subtle keyboard tapping at 10-12 seconds when showing note-taking trainee, quiet room tone. Music fades slightly during trainer's speaking moments to ensure voice is primary audio focus.
입력 준비 전략
이미지 참조 최적화
좋은 입력이 좋은 결과를 만듭니다. 이미지 참조를 전략적으로 준비하세요.
캐릭터 일관성:
- 정면이 보이는 선명하고 조명이 좋은 사진 사용
- 캐릭터가 여러 각도로 보일 경우 다양한 앵글 포함
- 참조 이미지 간 일관된 조명 확보
- 모델을 혼란시킬 수 있는 강한 필터나 효과 피하기
- 특정 의상을 입는 캐릭터라면 의상 디테일의 선명한 사진 포함
스타일과 미학:
- 원하는 시각 처리를 분명히 보여주는 이미지 선택
- 컬러 그레이딩이 최종 비전과 일치하도록
- 원하는 조명 접근을 보여주는 이미지 포함
- 텍스처·디테일 수준 고려: 고디테일 참조는 고디테일 출력을 만듦
제품과 객체:
- 초점을 위해 단순 배경에서 촬영
- 정확한 재현을 위해 여러 각도 제시
- 중요 디테일(로고, 텍스처, 특정 특징) 클로즈업 포함
- 조명이 형태와 입체감을 분명히 보이도록
비디오 참조 최적화
카메라 움직임:
- 재현하고 싶은 특정 카메라 움직임만 보이도록 비디오 트리밍
- 움직임이 액션에 가리지 않고 분명히 보이도록
- 여러 기법이 섞인 긴 클립보다 한 기법에 집중한 짧은 클립(3–5초)이 유리
- 최고 품질 비디오 사용: 압축 아티팩트가 이해를 해침
동작과 안무:
- 동작이 가림 없이 분명히 보이도록
- 조명이 몸 위치·움직임을 충분히 보이도록
- 가능하면 같은 동작의 여러 각도 활용
- 참조 클립 제작 시 빠른 동작은 느리게 촬영 검토
특수 효과:
- 재현하려는 효과만 분리
- 배경 대비 효과가 분명히 보이도록
- 효과에 특정 타이밍이 있으면 참조에 포함
오디오 참조 최적화
음악과 리듬:
- 고품질 오디오 파일 사용(저비트레이트 압축 오디오 피하기)
- 가장 관련 있는 리듬·분위기 구간으로 오디오 트리밍
- 원하는 것(비트, 페이스, 분위기)이 분명히 드러나도록
- 더 쉬운 동기화를 위해 강한 비트에서 오디오 시작 검토
보이스와 대사:
- 배경 소음이 적은 선명한 녹음 사용
- 원하는 보컬 특성이 두드러지도록
- 참조 클립은 짧게, 해당 보컬 품질에 집중
파일 우선순위 전략: 12파일 의사결정 프레임워크
12개 파일 한도에 가까워지면 이 의사결정 프레임워크로 우선순위를 정하세요.
우선순위 1단계: 기반 요소(3–4슬롯 확보)
- 주 캐릭터/피사체 외형
- 핵심 시각 스타일/미적 방향
- 필수 환경 또는 세팅
우선순위 2단계: 동작과 카메라(2–3슬롯 확보)
- 특정 촬영 기법이 핵심이면 카메라 움직임 참조
- 복잡한 동작을 위한 액션/안무 참조
- 정교한 편집 시 장면 전환 스타일
우선순위 3단계: 오디오 기반(1–2슬롯 확보)
- 분위기·페이싱용 음악
- 내러티브를 이끄는 핵심 사운드 이펙트
우선순위 4단계: 보조 디테일(남은 슬롯 사용)
- 추가 캐릭터 각도
- 환경 변형
- 2차 시각 참조
- 보조 오디오
의사결정 질문:
- "이 참조를 빼면 결과가 크게 손상되나?" → 그렇다면 유지
- "이 정보를 텍스트 프롬프트로 전달할 수 있나?" → 그렇다면 파일 제거 검토
- "이 참조가 여러 목적으로 쓰이나?" → 다목적 참조가 가장 가치 있음
- "‘있으면 좋은’ 수준인가, ‘반드시 있어야 하는’ 수준인가?" → 있으면 좋은 것부터 제거
의사결정 예시:
뮤직 비디오를 만들며 참조 후보 15개가 있습니다.
- 이미지 4장: 다양한 각도의 아티스트
- 이미지 3장: 공연 장소
- 이미지 2장: 특정 조명 설정
- 비디오 2개: 댄스 안무와 카메라 움직임
- 오디오 2개: 음악 트랙과 앰비언트 사운드
- 이미지 2장: 의상 디테일
프레임워크 적용:
- 유지 (1단계): 아티스트 이미지 2장(정면·측면으로 핵심 특징 결합)
- 유지 (1단계): 장소 이미지 1장(가장 대표적인 것 선택)
- 유지 (2단계): 비디오 참조 둘 다(둘 다 동작에 필수)
- 유지 (3단계): 음악 트랙(뮤직 비디오에 필수)
- 유지 (1단계): 조명 설정 이미지 1장(가장 독특한 것)
- 유지 (4단계): 의상 디테일 이미지 2장(남은 슬롯 채움)
- 텍스트로 기술: 두 번째 조명 설정, 앰비언트 오디오, 장소 변형 하나
결과: 9개 파일, 여유 확보
멀티샷 프로젝트의 일관성 기법
여러 생성에 걸친 캐릭터 일관성
여러 비디오 생성에서 같은 캐릭터 외형을 유지하려면 참조를 체계적으로 관리해야 합니다.
방법 1: 마스터 캐릭터 시트 모든 샷의 기반이 되는 캐릭터 참조 이미지 하나를 만듭니다.
- 무표정 정면 뷰
- 선명하고 균일한 조명
- 고해상도
- 매 프롬프트의 참조에 이 동일한 이미지를 포함
방법 2: 다각도 캐릭터 패키지 캐릭터가 여러 각도로 나올 때는 소규모 캐릭터 참조 세트를 만듭니다.
- 정면, 측면, 3/4 뷰
- 모든 생성에서 동일한 참조 세트 사용
- 각 프롬프트에서 "maintaining exact appearance from @Image [X]" 명시
Feature the detective from @Image 1 (maintain exact facial features, hairstyle, and clothing from this reference). In this scene, the detective enters the warehouse from @Image 2. All physical characteristics of the detective must match @Image 1 precisely: same face, same coat, same build.
장면 간 스타일 일관성
일관된 시각 처리가 필요한 여러 샷이 있는 프로젝트:
기법 1: 스타일 참조 템플릿 원하는 시각 스타일을 완벽히 담은 이미지 하나를 선택합니다.
- 컬러 그레이딩
- 조명 접근 방식
- 구도 스타일
- 텍스처와 디테일 수준
매 생성 프롬프트에 이 동일한 스타일 참조를 포함하세요:
Maintain the visual style from @Image 1 throughout: moody blue color grading, high contrast lighting, film grain texture, shallow depth of field.
기법 2: 이전 출력을 참조로 사용 이전에 성공한 생성물을 이후 샷의 참조로 사용합니다.
Create the next scene maintaining the exact visual style from @Video 1 (my previous generation). Color grading, lighting approach, and overall aesthetic should match precisely.
연속 샷의 시간적 연속성
순서대로 이어지는 샷을 만들 때:
기법 1: 겹침 설명 새 샷이 이전 샷과 어떻게 이어지는지 기술합니다.
This shot picks up exactly where @Video 1 ended. The character who was facing the door at the end of @Video 1 now turns toward camera and begins speaking. Position and lighting should match the final frame of @Video 1.
기법 2: 전환 명시 연결 지점을 분명히 밝힙니다.
Start this generation with the same camera angle and position where @Video 1 concluded. The character should be in the same position, mid-gesture, and this shot continues the motion smoothly.
피해야 할 흔한 함정
함정 1: 모호한 참조 사용
문제: 참조할 측면을 지정하지 않고 "@Image 1 as reference"만 사용
해결: 참조가 제공하는 것을 정확히 적기: "@Image 1 for character's facial features and expression, not the background or lighting"
함정 2: 상충하는 지시
문제: "빠른 액션 장면에 느리고 명상적인 카메라 움직임과 잔잔한 앰비언트 음악"
해결: 액션 페이스, 카메라 에너지, 음악 템포, 편집 리듬을 일관된 목표에 맞추기
함정 3: 프롬프트 과다 복잡화
문제: 차이가 거의 없는 파일 12개 업로드와 상충하는 디테일이 있는 긴 프롬프트
해결: CRAFT 프레임워크에 따른 명확·구조화된 프롬프트와 더 적고 영향 큰 참조 사용
함정 4: 길이 제한 무시
문제: 30초 분량의 상세 동작을 15초 생성에 맞추려 함
해결: 복잡한 시퀀스를 여러 생성으로 나누거나 시간에 맞게 동작 단순화
함정 5: 카메라워크 지시 부족
문제: 구체적 방향 없이 "Camera moves around"만 사용
해결: 정확한 촬영 용어 사용: "Camera dollies in from wide shot to medium close-up over 5 seconds, maintaining eye-level perspective"
함정 6: 오디오 통합 소홀
문제: 오디오를 나중 생각으로 취급하거나 "add music"만 언급
해결: 오디오 목적·타이밍·통합 명시: "@Audio 1 provides driving rhythm that should sync with visual cuts at 3-second and 7-second marks"
함정 7: 참조 품질 불일치
문제: 고해상도 전문 사진과 저품질 압축 이미지 혼용
해결: 모든 참조의 품질을 일관되게 유지하고, 저품질 참조 하나가 생성을 해치지 않도록 하기
함정 8: 모델 추론 가정
문제: "Make it look good" 또는 "you know what I mean" 수준의 지시
해결: 중요한 디테일은 모두 명시: 모델은 지시를 실행할 뿐, 모호한 의도를 해석하지 않음
빠른 문제 해결 가이드
증상: 생성마다 캐릭터 외형이 달라짐
해결: 각 프롬프트에 동일한 캐릭터 참조 이미지를 쓰고 "maintain exact appearance from @Image X"를 명시
증상: 카메라 움직임이 참조와 맞지 않음
해결: 텍스트로 카메라 움직임을 더 구체적으로 기술하고, 복잡한 움직임은 단계로 나누기
증상: 스타일이 참조와 맞지 않음
해결: 참조와 함께 스타일 요소를 텍스트로 기술: "Match @Image 1's color grading: desaturated blues, high contrast, crushed blacks"
증상: 타이밍이 어색함
해결: 초 단위로 더 구체적인 시간 표시를 넣고, 각 시점에 무엇이 일어나는지 지정
증상: 오디오가 분위기와 맞지 않음
해결: 오디오 역할을 더 명시: "@Audio 1"만이 아니라 "@Audio 1 for tense, building suspense that crescendos at 10-second mark"
결론
Seedance 2.0은 포괄적인 멀티모달 접근을 통해 AI 비디오 생성의 근본적 발전을 이룹니다. 이미지, 비디오, 오디오, 텍스트를 입력으로 받아 전문가에게 창작 과정에 대한 이전에 없던 제어를 제공하며, 텍스트 전용 프롬프트를 넘어 진정한 쇼앤텔 방식의 지시를 가능하게 합니다.
AI 비디오 생태계에서의 Seedance 2.0 위치
멀티모달 역량으로 Seedance 2.0은 경쟁 플랫폼과 구분됩니다. Kling, Veo, Sora가 인상적인 텍스트-투-비디오 역량을 제공하는 가운데, Seedance의 직접 비디오·오디오 참조 통합은 카메라워크, 동작 패턴, 리듬 동기화를 정확히 재현할 수 있게 하며, 이는 텍스트 설명만으로는 어렵거나 불가능한 수준입니다. 이로써 시각 스타일, 캐릭터 일관성, 시네마틱 연출에 대한 정밀한 제어가 필요한 전문가에게 Seedance가 최적의 도구로 자리합니다.
플랫폼은 정기적인 역량 강화와 기능 확대로 계속 발전하고 있습니다. 멀티모달 참조 시스템과 CRAFT 프롬프팅 프레임워크를 숙달하면 플랫폼이 발전할수록 더 정교한 비디오 제작의 기반을 갖추게 됩니다.
핵심 요약
멀티모달 제어: Seedance 2.0의 이미지, 비디오, 오디오, 텍스트 입력 조합으로 원하는 것을 말로만 설명하지 않고 AI에게 정확히 보여줄 수 있습니다. 이 근본적 접근 전환으로 이전에는 어렵던 명세—정확한 카메라 움직임, 특정 안무, 비트 동기화 편집—를 비교적 쉽게 달성할 수 있습니다.
전략적 비교 우위: Kling, Veo, Sora 대비 Seedance 2.0은 오디오 통합과 비디오 참조 깊이에서 독보적 역량을 제공합니다. 오디오 파일 직접 업로드 및 참조 시스템으로 정확한 분위기 제어와 비트 동기화가 가능하고, 비디오 참조 역량은 스타일 전환을 넘어 완전한 동작·카메라 재현까지 이릅니다.
CRAFT 전문가 프레임워크: 5단계 CRAFT 프롬프팅 방법론은 멀티모달 참조를 효과적으로 반영하는 체계적 접근을 제공합니다. Context, Reference, Action, Framing, Timing 구조를 따르면 멀티모달 시스템의 힘을 최대한 활용하는 포괄적 명세를 확보할 수 있습니다.
Morphic에서 이용 가능: 전문 크리에이터는 대기 목록이나 제한된 베타 없이 Morphic를 통해 즉시 Seedance 2.0에 접근할 수 있어, 현재 제작 워크플로우에 실질적으로 통합할 수 있습니다.
Frequently asked questions
사용 방법 질문
해당 캐릭터가 나오는 모든 생성에서 동일한 캐릭터 참조 이미지를 사용하세요. 프롬프트에 "maintain exact appearance from @Image X"를 명시하고, 의상·표정 등 변형은 기술하되 얼굴 특징, 체형, 기타 식별 특성은 동일하게 유지된다고 강조하세요. 최상의 결과를 위해 선명하고 조명이 좋은 정면 사진을 마스터 캐릭터 참조로 사용하세요.
원하는 카메라워크가 담긴 비디오를 업로드하고 "@Video 1 for camera movement only."처럼 구체적으로 참조하세요. 텍스트 프롬프트에서 촬영 용어(돌리 인, 트래킹 샷, 크레인 업)로 움직임을 설명하고 타이밍을 명시하세요. 복잡한 움직임은 "0-5 seconds: dolly in from wide to medium; 5-10 seconds: pan right while maintaining distance."처럼 단계로 나누세요.
음악 트랙을 업로드하고 프롬프트에서 정확한 타이밍으로 비트 동기화 이벤트를 지정하세요: "Scene change at 3-second mark (first beat), character gesture at 6-second mark (second beat), transition at 9-second mark (third beat)." 오디오를 참조하세요: "@Audio 1 provides rhythm and pacing, with visual changes synchronized to the beat structure."
비디오 확장 기능이나 퓨전 기법을 사용하세요. 확장: 기존 비디오를 업로드하고 연결 동작을 상세히 적어 "Extend @Video 1 by X seconds"로 지정하세요. 퓨전: 한 클립의 끝과 다른 클립의 시작을 참조하는 브릿지 구간을 만들고, 둘을 잇는 전환 동작을 명시적으로 기술하세요.
프롬프트에 초 단위로 시간 표시를 넣으세요: "0-3 seconds: [action 1], 3-7 seconds: [action 2], 7-12 seconds: [action 3]." 동작 길이는 현실적으로: 복잡한 움직임에는 충분한 시간이 필요합니다. 결과에서 타이밍이 촉박하면 다음 생성에서 해당 동작에 더 많은 초를 할당하세요.
결과에 가장 큰 영향을 주는 참조를 우선하세요. 텍스트로 설명하기 어려운 요소(특정 얼굴, 복잡한 카메라워크, 정확한 안무)에 집중하고, 더 단순한 요소는 텍스트 프롬프트로 기술하세요. 가능하면 관련 개념을 하나의 이미지로 합치세요: 예를 들어 조명 스타일과 컬러 그레이딩을 각각 따로가 아니라 한 이미지에 담기.
원하는 효과가 담긴 비디오를 업로드하고 "@Video 1 for the particle effect technique only."처럼 지정하세요. 텍스트 프롬프트에서 효과를 상세히 기술하세요: 언제 일어나는지, 어떻게 움직이는지, 시각적 특성. 최상의 결과를 위해 효과가 분명히 보이고 분리된 참조 클립을 사용하세요: "Reference the glowing particle swirl from @Video 1 that rises from ground level and disperses at the 5-second mark."
원하는 보이스가 담긴 오디오 또는 비디오 참조를 업로드하고 "@Audio 1 for voice timbre and delivery style."로 지정하세요. 프롬프트에서 보컬 특성을 기술하세요: "The character speaks with the deep, authoritative tone from @Audio 1, delivering the line: [your dialogue text]."
시퀀스의 모든 생성에서 참조 자료를 일관되게 유지하세요. 동일한 스타일 참조 이미지, 동일한 캐릭터 참조, 필요한 변형만 있는 유사한 프롬프트를 사용하세요. 이전에 성공한 출력을 참조하세요: "Maintain the visual style from @Video 1 (previous generation)"로 연속성을 확보하세요.
비디오 확장 기능으로 더 긴 시퀀스를 만드세요. 먼저 15초 구간을 생성한 뒤, 그 비디오를 참조로 업로드하고 "Extend @Video 1 by [duration]."으로 지정해 확장하세요. 여러 확장을 이어 더 긴 연속 콘텐츠를 만들 수 있으나, 연속성을 위해 확장마다 보통 5–10초가 적당합니다.
비교 질문
Seedance 2.0의 핵심 차별점은 오디오 파일 직접 업로드와 더 깊은 비디오 참조 역량을 포함한 포괄적 멀티모달 입력입니다. Kling이 이미지 참조를 어느 정도 지원하는 강력한 텍스트-투-비디오 생성을 제공하는 반면, Seedance는 특정 음악 트랙, 사운드 이펙트, 비디오 클립을 업로드해 분위기, 리듬, 동작을 정확히 제어할 수 있게 합니다. 이로써 정확한 오디오 동기화나 복잡한 카메라 움직임 재현이 필요한 프로젝트에 Seedance가 특히 유용합니다.
Seedance 2.0은 주요 AI 비디오 플랫폼 가운데 오디오 파일 직접 업로드를 받는 유일한 편입니다. Kling, Veo, Sora는 참조 오디오 파일을 받지 않고 텍스트 설명에서 오디오를 생성합니다. 따라서 Seedance는 특정 음악 트랙 매칭, 보이스 특성 재현, 시각 변화를 실제 음악 비트에 동기화하는 것이 가능하며, 경쟁사는 텍스트-투-오디오 생성으로 처리해 비전과 정확히 맞지 않을 수 있습니다.
Seedance 2.0은 단일 생성에서 최대 15초를 생성하며, Kling은 10초 한도입니다. Sora는(이용 가능할 때) 단일 생성에서 최대 60초까지 생성할 수 있습니다. Seedance에서 더 긴 콘텐츠는 비디오 확장 기능으로 여러 구간을 이어 만드세요. 15초는 대부분의 전문가급 용도에서 품질과 실용성을 맞춘 적정 길이이며, 상업·소셜 미디어 비디오는 긴 단일 생성보다 여러 짧은 고품질 클립을 조합하는 경우가 많습니다.
Seedance 2.0의 멀티모달 접근은 여러 참조 이미지, 스타일을 동작으로 보여주는 비디오 클립, 분위기를 정하는 오디오를 업로드할 수 있어 스타일 재현에 더 직접적인 제어를 제공합니다. 스타일을 텍스트로 설명하기보다 여러 각도에서 예시를 보여주므로, 텍스트 전용 접근보다 복잡한 스타일을 더 충실히 재현하는 경우가 많습니다.
Seedance 2.0의 이미지 참조 시스템은 프롬프트 전반에 일관된 캐릭터 이미지를 올바르게 사용할 때 강한 캐릭터 일관성을 제공합니다. 이 역량은 Kling의 캐릭터 일관성 기능과 비슷하지만 Veo나 Sora의 텍스트 기반 캐릭터 설명보다 제어가 쉽습니다. 핵심은 고품질 캐릭터 참조 이미지를 쓰고 각 생성에서 "maintain exact appearance from @Image X"를 명시하는 것입니다.
실질적 유용성은 접근성과 기능 제공 여부에 따라 달라집니다. Seedance 2.0은 Morphic를 통해 상업 제작 워크플로우에 즉시 이용할 수 있는 반면, Veo는 제한된 베타로 접근이 제한됩니다. 역량 측면에서는 Seedance의 멀티모달 오디오 통합과 비디오 참조 깊이가 정확한 브랜드 정렬, 특정 음악 동기화, 정확한 스타일 매칭이 필요한 상업 작업에 유리합니다. 다만 Veo의 확장 생성 역량은 널리 이용 가능해지면 일부 장편 용도에 더 적합할 수 있습니다.
Seedance 2.0과 Sora는 서로 다른 강점이 있습니다. Sora는 더 긴 비디오(최대 60초)를 생성하고 텍스트 프롬프트에서 물리와 복잡한 장면에 대한 인상적인 이해를 보여줍니다. Seedance 2.0은 더 짧은 클립(최대 15초)을 생성하지만 Sora에 없는 멀티모달 제어를 제공합니다: 오디오 직접 업로드, 동작 재현용 비디오 참조, 여러 시각 참조를 동시에 보여주는 기능. 스타일, 동작, 오디오 동기화에 대한 정밀 제어가 필요한 프로젝트에는 Seedance의 멀티모달 접근이 유리합니다. 텍스트에서 더 긴 원샷 생성이 필요하면 Sora가 더 적합할 수 있습니다(이용 가능할 때).
두 플랫폼 모두 모션 참조 역량을 제공하지만, Seedance 2.0의 비디오 참조 시스템이 더 깊습니다. Kling은 모션 브러시와 기본 모션 전달을 제공하는 반면, Seedance는 전체 비디오 클립 업로드와 동작 경로뿐 아니라 카메라워크, 편집 리듬, 복잡한 안무를 프레임 단위로 재현할 수 있게 합니다. 격투 시퀀스나 댄스 루틴 전체를 Seedance에 보여주면 설명하거나 모션 경로를 그리지 않고도 동작을 정확히 재현하게 할 수 있습니다.
Seedance 2.0은 대기 목록이나 제한된 베타 없이 Morphic를 통해 공개 이용 가능합니다. Sora와 Veo는 제한된 베타 프로그램에 머물러 있어 대조적입니다. 즉시 이용 가능하므로 Seedance는 접근을 기다리지 않고 현재 전문가 워크플로우와 제작 일정에 실질적으로 통합할 수 있습니다.
기술 질문
Seedance 2.0은 표준 이미지 포맷(JPG, PNG), 일반 비디오 포맷, 오디오용 MP3를 받습니다. 구체적인 포맷 호환은 Morphic 업로드 인터페이스에서 처리됩니다. 최상의 결과를 위해 고품질 소스 파일을 사용하세요: 고해상도 이미지, 압축이 적은 비디오, 고비트레이트 오디오.
시스템은 모든 입력 유형(이미지, 비디오, 오디오 합산)을 합쳐 최대 12개 파일까지 받습니다. 추가로: 이미지는 최대 9개, 비디오는 합계 15초인 클립 3개, 오디오는 합계 15초인 파일 3개로 제한됩니다. 이 한도에 가까워질 때는 영향이 큰 참조를 전략적으로 선택하는 것이 중요합니다.
Seedance 2.0은 단일 생성에서 4–15초 비디오를 생성합니다. 1초 단위로 길이를 선택할 수 있습니다. 더 긴 콘텐츠는 비디오 확장 기능으로 여러 생성을 이어가거나, 포스트에서 합칠 수 있는 별도 구간을 생성하세요.
네, Morphic를 통한 Seedance 2.0은 상업 제작에 사용할 수 있습니다. 구체적인 라이선스와 이용 권한은 Morphic 이용약관에 따릅니다. 상업적 이용, 클라이언트 작업, 귀속 표시 요구사항은 해당 약관을 확인하세요.
네, Seedance 2.0은 생성 전반에 걸쳐 일관된 해상도와 품질을 유지합니다. 출력 해상도는 전문가급 용도에 적합한 고품질 비디오이며, 구체적 해상도는 콘텐츠와 선택한 종횡비에 따라 다를 수 있습니다.
네, Seedance 2.0은 표준 16:9, 시네마틱 2.35:1 와이드스크린, 소셜 미디어용 세로 포맷 등 여러 종횡비를 지원합니다. 생성 설정이나 프롬프트에서 원하는 종횡비를 지정하세요.
Seedance 2.0은 Morphic를 통해 이용할 수 있습니다. Morphic에 접속해 계정을 만들거나 로그인한 뒤 비디오 생성 인터페이스에서 Seedance 2.0을 이용하세요. 멀티모달 입력 시스템과 @ 참조 기능이 Morphic 워크플로우에 통합되어 있습니다.
네, 생성된 비디오는 여러 방식으로 활용할 수 있습니다: 새 생성의 참조(특정 요소 수정), 비디오 확장의 입력(이어 붙이기), 비디오 퓨전 워크플로우(다른 클립과 연결), 또는 일반 편집 소프트웨어에서 편집하기 위해 내보내기. 생성된 비디오는 프로젝트에 맞는 어떤 워크플로우로든 편집·결합·다듬을 수 있습니다.
