语音情感控制
Morphic 上的语音情绪控制让你能够塑造生成语音的听感,从情绪语气到反应、节奏和表达风格都可调节。用合适的提示词来写你的指令,语音就会按照你的引导进行表演。
如何使用语音情绪控制
下面是一个关于如何在 Morphic 上使用语音情绪控制的快速教程:
打开 Morphic 并进入你的项目。
创建一个新文件或打开一个已有文件。
在底部的提示栏中,将模式切换为“Audio”,并选择“Speech”。
选择你的音频模型:“ElevenLabs”或“MiniMax”。
从语音选择器中选择一个声音和语言。
根据你选择的模型,使用相应的情绪控制格式编写提示词(见下文)。
点击“Generate”。
Morphic 支持两种语音模型。每种模型使用不同的情绪控制语法。请选择你的模型,然后按照下面的指南操作。
ElevenLabs
ElevenLabs 直接在提示词中使用方括号标签。将任何情绪、反应或指令包在方括号中,模型会将其解释为表演提示,而不是朗读文本。
工作原理
[tag] 你的对话文本写在这里。标签会影响其后的一切内容,直到出现新的标签。你可以在文本的任何位置放置标签,并连续组合多个标签。
我拿到这个角色了。我真的拿到了。
[excited] 我拿到这个角色了。我真的拿到了。
我们得走了。现在。
[whispers][tense] 我们得走了。现在。
我觉得这行不通。
[sad][hesitant] 我觉得这行不通。
宝藏埋在老礼拜堂下面。
[pirate voice] 宝藏埋在老礼拜堂下面。
ElevenLabs 是开放式的。没有固定列表。把任何情绪或指令写在方括号里,模型会尝试理解。像 [jealous], [romantic], [awkward], [suspicious tone],或者 [continues after a beat] 都可以。
下面的标签是常用且效果稳定的,但并不局限于这些。
标签
情绪
[excited]
高能量、热情洋溢的表达
[happy]
温暖、积极向上的语气
[cheerfully]
轻快、明亮的表达
[sad]
低落、克制的语气
[sorrowful]
深切的悲伤、哀痛
[angry]
尖锐、有力的表达
[nervous]
不确定、略带颤抖
[frustrated]
紧张、不耐烦的语气
[calm]
平稳、放松的表达
[tired]
低能量、疲惫不堪
[curious]
好奇、探问的语气
[sarcastic]
干涩、带讽刺意味的表达
[playful]
轻松、逗趣的感觉
[deadpan]
平淡、面无表情的表达
试试这个:
情绪细微变化
用于更细腻的语气转换。这些会为一句话增加层次,而不会覆盖整段表达。
[hesitant]
犹豫不决、有所保留
[relieved]
如释重负、紧张释放
[tense]
紧绷、在为某事做准备
[warm]
温柔、关怀的语气
[resigned tone]
放弃抵抗、接受失败
[stammers]
说话磕巴、局促不安
[regretful]
希望事情有所不同
[sympathetic]
富有同情心、能理解人
[reassuring]
安慰人、稳重
[awe]
被惊叹或震撼所触动
试试这个:
反应
用于在句子之间或句子内部添加更真实的非语言声音。
[laughs]
放声大笑
[giggles]
轻柔、浅浅的笑
[light chuckle]
短促、克制的笑
[sigh]
疲惫、如释重负或沮丧时的叹气
[gasps]
突然吸气,表示惊讶或震惊
[gulps]
紧张地吞咽
[crying]
带着哭腔、声音哽咽
[clears throat]
快速清嗓
试试这个:
表达方式
控制语音在生理上的表达方式,与情绪无关。
[whispers]
轻柔、气声、贴近的表达
[shouts]
大声、外放的声音
[quietly]
低音量、收敛
[loudly]
提高音量、有力地表达
[rushed]
快速、紧迫的节奏
[drawn out]
缓慢、拖长的表达
[dramatic tone]
戏剧化、强烈的表现
试试这个:
口音与角色
在不改变声音的情况下切换口音,或者赋予语音一个角色人格。
[American accent]
标准美式英语
[British accent]
标准英式英语
[French accent]
带法语口音的英语
[Southern US accent]
美国南方口音
[Australian accent]
澳大利亚英语
[strong Russian accent]
浓重的俄式口音
[strong X accent]
将 X 替换为任意国籍
[pirate voice]
粗哑的海盗式角色声音
[old man voice]
苍老、饱经风霜的表达
[robot voice]
机械、合成感的语气
[fantasy narrator]
史诗般的童话叙述
[film noir narrator]
黑暗、忧郁、愤世嫉俗的旁白
[sarcastically]
干涩、带讽刺意味的角色读法
试试这个:
多角色对话
当你在一个提示词中写有两个或更多角色的场景时,用这些标签来塑造台词之间的互动。
[interrupting]
在对方说完之前打断
[overlapping]
在另一个声音还未结束时开始说话
试试这个:
停顿与节奏
ElevenLabs 不支持明确的停顿时长。停顿长度会根据上下文、标签和标点来推断。
[pause]
戏剧性沉默(由模型决定时长)
...
犹豫、拖尾式停顿
全部大写
强调该词
新段落
明显的停顿和语调重置
试试这个:
获得更好效果的技巧
让标签与文本匹配
[crying] 别离开我。 听起来很自然。把 [crying] 加到一句随意的话里就不自然了。模型会读取整句来获取上下文。
组合标签
[whispers][tense] 或者 [hesitant][nervous] 会给模型两个提示,让它融合出更细腻的输出。
选择合适的声音
平静的声音不会有说服力地大喊。高能量的声音也不适合低声耳语。要让声音与角色匹配。
使用 Creative 或 Natural 稳定性
这些设置会给模型更多空间去表达标签。Robust 更一致,但表现力较弱。
把标点当作节奏提示
逗号会放慢节奏。句号会形成强停顿。省略号则会拖尾。模型会读取并响应标点。
MiniMax
MiniMax 使用 括号式声音标签 在你的提示词中,以及 Morphic 界面里的一个单独的 情绪选择器 。
情绪
在生成时从下拉菜单中选择情绪。这会为整个输出设置整体基调。
自动
模型读取文本并选择最合适的情绪(默认)
快乐
轻快、积极
悲伤
低落、忧郁
愤怒
有力、攻击性强
恐惧
焦虑、害怕
厌恶
反感、排斥
惊讶
受惊、震惊
平静
放松、宁静
流利
干净、播音风格——非常适合新闻或技术解说
中性
没有情绪偏向
声音标签
使用括号直接在提示词中添加非语言声音。这些是 仅限预设 ——只支持下面列出的标签。
(laughs)
(chuckle)
(coughs)
(clear-throat)
(groans)
(breath)
(pant)
(inhale)
(exhale)
(gasps)
(sniffs)
(sighs)
(snorts)
(burps)
(lip-smacking)
(humming)
(hissing)
(emm)
(whistles)
(sneezes)
(crying)
(applause)
(yawns)
与 ElevenLabs 不同,你 不能 创建自定义标签。写
(nervous)或者(jealous)不会起作用——模型会把它们当作文本朗读。情绪语气请使用情绪选择器。
停顿
使用 <#x#> 来插入定时静音,其中 x 表示秒数(0.01–99.99)。
技巧
谨慎使用声音标签——太多会显得不自然。
将情绪设置为 自动 适用于大多数情况。在需要长文本保持一致语气时,可手动覆盖。
标点很重要——逗号和句号会引导模型的节奏和语调。
最后更新于