Contrôle de l'émotion de la voix

Le contrôle de l’émotion vocale sur Morphic vous permet de façonner la manière dont la parole générée sonne, du ton émotionnel aux réactions, en passant par le rythme et le style d’interprétation. Rédigez votre prompt avec les bons indices, et la voix s’exécute comme vous le souhaitez.

Comment utiliser le contrôle de l’émotion vocale

Voici un rapide tutoriel sur l’utilisation du contrôle de l’émotion vocale sur Morphic :

  1. Ouvrez Morphic et allez dans votre projet.

  2. Créez un nouveau fichier ou ouvrez-en un existant.

  3. Dans la barre de prompt en bas, passez le mode sur « Audio » et sélectionnez « Speech ».

  4. Choisissez votre modèle audio : « ElevenLabs » ou « MiniMax ».

  5. Sélectionnez une voix et une langue dans le sélecteur de voix.

  6. Rédigez votre prompt en utilisant le format de contrôle des émotions pour le modèle sélectionné (voir ci-dessous).

  7. Cliquez sur « Generate ».

Morphic prend en charge deux modèles de parole. Chacun utilise une syntaxe différente pour le contrôle des émotions. Sélectionnez votre modèle, puis suivez le guide ci-dessous.

ElevenLabs

ElevenLabs utilise des balises entre crochets écrites directement dans votre prompt. Encadrez toute émotion, réaction ou indication entre crochets, et le modèle l’interprète comme un indice de jeu, et non comme du texte prononcé.

Fonctionnement

[tag] Votre texte de dialogue ici.

Les balises affectent tout ce qui suit jusqu’à l’apparition d’une nouvelle balise. Vous pouvez placer des balises n’importe où dans votre texte et en combiner plusieurs à la suite.

Sans balises
Avec balises

J’ai décroché le rôle. J’ai vraiment décroché le rôle.

[excited] J’ai décroché le rôle. J’ai vraiment décroché le rôle.

Nous devons partir. Maintenant.

[whispers][tense] Nous devons partir. Maintenant.

Je ne pense pas que ça va marcher.

[sad][hesitant] Je ne pense pas que ça va marcher.

Le trésor est enterré sous la vieille chapelle.

[pirate voice] Le trésor est enterré sous la vieille chapelle.

ElevenLabs est ouvert. Il n’y a pas de liste fixe. Écrivez n’importe quelle émotion ou indication entre crochets, et le modèle essaiera de l’interpréter. Des balises comme [jealous], [romantic], [awkward], [suspicious tone], ou [continues after a beat] fonctionnent toutes.

Les balises ci-dessous sont couramment utilisées et fonctionnent de manière fiable, mais vous n’êtes pas limité à celles-ci.

Balises

Émotions

Balise
Ce que cela fait

[excited]

Interprétation énergique et enthousiaste

[happy]

Ton chaleureux et enjoué

[cheerfully]

Interprétation légère et vive

[sad]

Ton abattu et assourdi

[sorrowful]

Tristesse profonde, chagrin

[angry]

Interprétation sèche et ferme

[nervous]

Incertain, légèrement tremblant

[frustrated]

Ton tendu et impatient

[calm]

Interprétation posée et détendue

[tired]

Faible énergie, épuisé

[curious]

Ton inquisitif, interrogatif

[sarcastic]

Interprétation sèche et ironique

[playful]

Énergie légère et taquine

[deadpan]

Interprétation plate, sans émotion

Essayez :

Nuance émotionnelle

Pour des variations plus subtiles de ton. Elles ajoutent de la profondeur à une ligne sans en modifier toute l’interprétation.

Balise
Ce que cela fait

[hesitant]

Hésitant, retenu

[relieved]

Poids levé, tension relâchée

[tense]

Sur le qui-vive, prêt à quelque chose

[warm]

Ton doux et attentionné

[resigned tone]

Se résignant, acceptant la défaite

[stammers]

Bafouillant, déstabilisé

[regretful]

Souhaiter que les choses soient différentes

[sympathetic]

Compatissant, compréhensif

[reassuring]

Rassurant, stable

[awe]

Saisi d’émerveillement ou d’étonnement

Essayez :

Réactions

Des sons non verbaux qui ajoutent du réalisme entre les lignes ou à l’intérieur de celles-ci.

Balise
Ce que cela fait

[laughs]

Rire franc

[giggles]

Petit rire doux

[light chuckle]

Petit rire bref et retenu

[sigh]

Soupir d’épuisement, de soulagement ou de frustration

[gasps]

Inspiration brusque, surprise ou choc

[gulps]

Déglutition nerveuse

[crying]

Voix émue, qui se brise

[clears throat]

Petite remise à zéro vocale

Essayez :

Interprétation

Contrôlez la manière dont la voix interprète physiquement la ligne, indépendamment de l’émotion.

Balise
Ce que cela fait

[whispers]

Interprétation douce, souffle court, proche

[shouts]

Voix forte, projetée

[quietly]

Faible volume, contenu

[loudly]

Volume élevé, énergique

[rushed]

Rythme rapide, urgent

[drawn out]

Interprétation lente et étirée

[dramatic tone]

Intensité théâtrale, accentuée

Essayez :

Accents et personnages

Changez l’accent sans changer la voix, ou donnez à la voix une personnalité de personnage.

Balise
Ce que cela fait

[American accent]

Anglais américain standard

[British accent]

Anglais britannique standard

[French accent]

Anglais avec accent français

[Southern US accent]

Accent traînant du sud des États-Unis

[Australian accent]

Anglais australien

[strong Russian accent]

Forte coloration russe

[strong X accent]

Remplacez X par n’importe quelle nationalité

[pirate voice]

Personnage râpeux, marin

[old man voice]

Interprétation vieillie, usée par le temps

[robot voice]

Ton mécanique, synthétique

[fantasy narrator]

Narration épique de conte

[film noir narrator]

Narration sombre, mélancolique et cynique

[sarcastically]

Lecture de personnage sèche et ironique

Essayez :

Dialogue à plusieurs personnages

Lorsque vous écrivez des scènes avec deux personnages ou plus dans un seul prompt, utilisez ces balises pour façonner les interactions entre les répliques.

Balise
Ce que cela fait

[interrupting]

Coupe la parole avant la fin de l’autre ligne

[overlapping]

Commence à parler pendant qu’une autre voix se poursuit

Essayez :

Pauses et rythme

ElevenLabs ne prend pas en charge les durées de pause explicites. La longueur des pauses est déduite du contexte, des balises et de la ponctuation.

Écrivez ceci
Ce que cela fait

[pause]

Silence dramatique (le modèle décide de la durée)

...

Pause hésitante, en suspens

MAJUSCULES

Accentuation du mot

Nouveau paragraphe

Pause nette et réinitialisation de l’intonation

Essayez :

Conseils pour de meilleurs résultats

Conseil
Pourquoi cela fonctionne

Faites correspondre les balises au texte

[crying] Ne me laisse pas. semble naturel. Ajouter [crying] à une phrase courante ne l’est pas. Le modèle lit la ligne entière pour en comprendre le contexte.

Combinez les balises

[whispers][tense] ou [hesitant][nervous] donne au modèle deux indices à fusionner pour un résultat plus nuancé.

Choisissez la bonne voix

Une voix calme ne criera pas de manière convaincante. Une voix énergique ne chuchotera pas bien. Faites correspondre la voix au rôle.

Utilisez une stabilité Creative ou Natural

Ces paramètres laissent plus de marge au modèle pour exprimer les balises. Robust est plus cohérent, mais moins expressif.

Utilisez la ponctuation comme indice de rythme

Les virgules ralentissent le tempo. Les points créent des arrêts francs. Les points de suspension laissent traîner la phrase. Le modèle lit et réagit à la ponctuation.

MiniMax

MiniMax utilise des balises sonores entre parenthèses dans votre prompt et un sélecteur d’émotion séparé dans l’interface de Morphic.

Émotion

Sélectionnez l’émotion dans le menu déroulant lors de la génération. Cela définit le ton général de toute la sortie.

Émotion
Effet

Auto

Le modèle lit le texte et choisit la meilleure émotion (par défaut)

Happy

Enjoué, positif

Sad

Abattu, mélancolique

Angry

Ferme, agressif

Fearful

Anxieux, effrayé

Disgusted

Dégoûté, rétif

Surprised

Surpris, stupéfait

Calm

Détendu, serein

Fluent

Net, style radiophonique — idéal pour les informations ou la narration technique

Neutral

Sans biais émotionnel

Balises sonores

Ajoutez directement des sons non verbaux dans votre prompt à l’aide de parenthèses. Ce sont uniquement des préréglages — seules les balises listées ci-dessous sont prises en charge.

Balise
Balise
Balise

(laughs)

(chuckle)

(coughs)

(clear-throat)

(groans)

(breath)

(pant)

(inhale)

(exhale)

(gasps)

(sniffs)

(sighs)

(snorts)

(burps)

(lip-smacking)

(humming)

(hissing)

(emm)

(whistles)

(sneezes)

(crying)

(applause)

(yawns)

Contrairement à ElevenLabs, vous ne pouvez pas inventer des balises personnalisées. Écrire (nervous) ou (jealous) ne fonctionnera pas — le modèle les prononcera comme du texte. Utilisez le sélecteur d’émotion pour le ton émotionnel.

Pauses

Insérez des silences chronométrés à l’aide de <#x#>x est le nombre de secondes (0,01–99,99).

Conseils

  • Utilisez les balises sonores avec parcimonie — en trop grand nombre, elles peuvent sonner de façon غير naturelle.

  • Réglez l’émotion sur Auto dans la plupart des cas. Remplacez-la manuellement lorsque vous avez besoin d’un ton cohérent sur un long texte.

  • La ponctuation compte — les virgules et les points guident le rythme et l’intonation du modèle.

Mis à jour