음성 감정 제어 복사본

생성된 음성에 감정, 반응, 전달 방향을 추가하세요. 프롬프트를 어떻게 작성하느냐가 음성의 연기를 직접 제어합니다.

Morphic은 두 가지 음성 모델을 지원합니다 — ElevenLabsMiniMax입니다. 각 모델은 감정 제어에 서로 다른 문법을 사용합니다. 모델을 선택한 다음 아래 형식을 사용해 프롬프트를 작성하세요.

ElevenLabs

ElevenLabs는 대괄호 태그를 프롬프트에 직접 작성합니다. 감정, 반응, 지시를 대괄호로 감싸면 모델이 이를 음성 지시로 해석하고, 말로 읽지는 않습니다.

작동 방식

[tag] 여기에 대화 텍스트를 입력하세요.

태그는 그 뒤의 모든 내용에 영향을 주며, 새 태그가 나타날 때까지 계속 적용됩니다. 여러 태그를 조합해 텍스트의 어느 위치에든 넣을 수 있습니다.

[excited] 방금 사용자 100만 명을 돌파했어요!
[whispers][tense] 저들이 듣지 못하게 해.
[tired] 14시간째 계속 일하고 있어. [sigh] 이제는 손도 감각이 없어.

아무 태그나 사용할 수 있습니다

ElevenLabs는 열린 방식입니다. 고정된 목록은 없습니다 — 대괄호 안에 어떤 감정이나 지시든 적으면 모델이 해석을 시도합니다. 다음과 같은 태그도 [jealous], [romantic], [awkward], [suspicious tone]또는 [continues after a beat] 모두 작동합니다.

아래 태그들은 흔히 사용되며 안정적으로 효과가 있지만, 이것들에만 한정되지는 않습니다.

감정

[excited] · [happy] · [cheerfully] · [sad] · [sorrowful] · [angry] · [nervous] · [frustrated] · [calm] · [tired] · [curious] · [sarcastic] · [playful] · [mischievously] · [deadpan] · [flatly]

뉘앙스: [hesitant] · [relieved] · [tense] · [warm] · [resigned tone] · [stammers] · [regretful] · [sympathetic] · [reassuring] · [professional] · [questioning]

반응

현실감을 더하는 비언어적 소리입니다.

[laughs] · [giggles] · [sigh] · [gasps] · [gulps] · [crying] · [clears throat] · [light chuckle]

전달

[whispers] · [shouts] · [quietly] · [loudly] · [rushed] · [drawn out] · [dramatic tone]

억양

음성을 바꾸지 않고 억양만 전환합니다.

[American accent] · [British accent] · [French accent] · [Southern US accent] · [strong Russian accent] · [strong X accent]

캐릭터

[pirate voice] · [old man voice] · [robot voice]

다중 캐릭터 대화

[interrupting] · [overlapping]

일시 정지

ElevenLabs는 명시적인 일시 정지 길이를 지원하지 않습니다. 일시 정지 길이는 맥락, 태그, 문장부호에서 추론됩니다:

이렇게 쓰기
효과

[pause]

극적인 침묵(모델이 길이를 결정)

...

망설이는 듯한 끝맺음의 멈춤

짧고 분명한 멈춤

ALL CAPS

단어에 강조

새 문단

분명한 멈춤 + 억양 초기화

  • 태그는 텍스트와 잘 맞을 때 가장 효과적입니다. "안 돼... 제발 [crying] 가지 마." 가 중립적인 텍스트에 [crying] 를 추가하는 것보다 더 잘 작동합니다.

  • 태그를 조합하세요: [whispers][tense] 또는 [hesitant][nervous].

  • 선택한 음성이 중요합니다 — 차분한 음성은 소리를 지르는 데 어울리지 않고, 흥분된 음성은 속삭임에 잘 맞지 않습니다.

  • 사용 Creative 또는 Natural 의 안정성을 사용하면 태그 반응성이 가장 좋습니다. Robust는 더 일관되지만 표현력은 더 적습니다.

  • 약 250자 이하의 프롬프트는 결과가 불안정할 수 있습니다. 더 길수록 좋습니다.

MiniMax

MiniMax는 괄호형 사운드 태그를 프롬프트에 사용하고, Morphic UI의 별도 감정 선택기 를 사용합니다.

감정

생성할 때 드롭다운에서 감정을 선택하세요. 이렇게 하면 전체 출력의 전반적인 톤이 설정됩니다.

감정
효과

Auto

모델이 텍스트를 읽고 가장 적절한 감정을 선택함(기본값)

Happy

경쾌하고 긍정적

Sad

침울하고 우울함

Angry

강하고 공격적임

Fearful

불안하고 두려움

Disgusted

혐오하고 거부감이 듦

Surprised

깜짝 놀라고 경악함

Calm

차분하고 평온함

Fluent

깔끔한 방송 스타일 — 뉴스나 기술 설명에 이상적

Neutral

감정적 편향 없음

사운드 태그

괄호를 사용해 비언어적 소리를 프롬프트에 직접 추가하세요. 이는 미리 설정된 항목만 지원됩니다 — 아래에 나열된 태그만 사용할 수 있습니다.

태그
태그
태그

(laughs)

(chuckle)

(coughs)

(clear-throat)

(groans)

(breath)

(pant)

(inhale)

(exhale)

(gasps)

(sniffs)

(sighs)

(snorts)

(burps)

(lip-smacking)

(humming)

(hissing)

(emm)

(whistles)

(sneezes)

(crying)

(applause)

(yawns)

ElevenLabs와 달리, 커스텀 태그를 만들 수 없습니다. (nervous) (jealous) 또는 를 작성해도 작동하지 않습니다 — 모델이 이를 텍스트로 읽습니다. 감정적 톤은 감정 선택기를 사용하세요.

일시 정지

다음 형식으로 시간 지정 침묵을 삽입하세요 <#x#> 여기서 x 는 초 단위입니다(0.01–99.99).

  • 사운드 태그는 아껴서 사용하세요 — 너무 많으면 부자연스럽게 들릴 수 있습니다.

  • 대부분의 경우 감정을 Auto 로 설정하세요. 긴 텍스트 전체에서 일관된 톤이 필요할 때는 수동으로 재정의하세요.

  • 문장부호가 중요합니다 — 쉼표와 마침표가 모델의 속도와 억양을 안내합니다.

마지막 업데이트