画外音(Voice-Over)

画外音(Voice-Over)是什么?

画外音是叠加在视频素材之上播放的语音旁白或音轨,而说话者不出现在画面里:像纪录片中讲解事件的旁白,或电影画面之上被念出来的角色内心想法。

一图看懂

别称
VO旁白画外旁白镜头外评述
主要用途
在纪录片画面之上提供旁白、上下文与解释在视觉序列之上传达广告信息与行动召唤在叙事电影中表达人物内心为 AI 生成的视频序列添加专业的清晰度与质感
常用工具
ElevenLabs (AI voice synthesis)Adobe audition (audio recording and editing)Audacity (open-source audio editing)DaVinci resolve (integrated audio and video editing)Pro tools (professional audio post-production)
相关术语
Voice synthesisNarrationSound designPost-productionDialogueAudio mix

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

对比与差异

对比与差异

Compared with related concepts

画外音与对白都涉及语音音频,但它们与可见画面的关系不同。对白由出现在画面中、或已知存在于该场景物理空间内的角色说出:它是内声(diegetic sound),存在于故事世界之内。画外音来自可见画面之外,通常出自旁白或一位事后回溯的角色:它存在于故事世界当下时刻之外。对白是即时而具情境性的;画外音则是反思性、解释性或全知性的。有些电影刻意模糊这一区分:一个角色以画外音的形式开始说话,而剪辑随即揭示出他正在画面中说出那些话,把内心与外在之间的距离一举折叠起来。


可以这样理解…

画外音就像一张佳作照片下方的图注:画面本身可以独立成立、传达有力,但旁边恰当的文字能锚定它的含义、加深它的情绪冲击,并把观众的理解引向摄影师所意图之处:而这些文字本身并不出现在照片之中。


实用提示

为 AI 生成的视频序列撰写画外音文案时,要顺着剪辑的节奏来写,而不是只盯着你想传达的信息来写。与剪辑节奏相抵触的画外音,,在快切处赶念、在持续画面上拖沓,,会制造出削弱二者的张力。把文案对着视觉序列的粗剪大声读出来计时,然后调整文本或剪辑,使语音在视觉关键时刻(一次剪切、一个反应、一个节拍)恰好落在停顿与换气上,从而营造出语音与画面仿佛为彼此而生的印象。

类型与变体

第三人称全知旁白对事件提供一种权威的外部视角,在纪录片、自然与历史类内容中最为常见。第一人称角色旁白让观众进入某个角色的主观内心体验,在受文学影响的叙事电影中被广泛使用。商业与广告画外音以与品牌人格相匹配的调性传达品牌信息与产品要点。教学型画外音在教育与企业内容中引导观众理解流程与信息。叙事内声评(diegetic commentary)被故事世界内的角色所听见(例如一段广播节目),处在画外音与内嵌的内声(diegetic sound)的交界处。AI 合成画外音使用文本转语音技术,从书面文案生成旁白,无需现场录制。

准备好在 Morphic 里做第一个场景了吗?

试用 Morphic

常见使用场景

画外音被用于纪录片与事实类内容,在档案素材与观察性画面之上提供旁白、上下文与专家视角。在广告与商业制作中,它在生活方式与产品画面之上传达品牌信息与产品诉求。在叙事电影中,它营造人物内心、文学调性与回溯式框架。在企业与教育视频中,它引导观众理解信息与流程。在社媒与营销内容中,它确立调性与人格。在 AI 生成工作流中,合成画外音在后期被加入,把一组组生成片段转化为完整、具有叙事结构的内容。

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

常见问题(FAQ)

什么是电影与视频制作中的画外音?

画外音是叠加在视觉内容之上的语音旁白或音轨,而说话者不出现在画框之内。它被用来在画面之上提供旁白、上下文、人物内心或商业信息,是视听制作中适用面最广的工具之一,出现在纪录片、广告、叙事电影、企业视频与社媒内容中。

画外音与旁白(narration)有什么区别?

这两个词在许多语境中可互换使用,但旁白更具体地指描述或解释事件、引导观众理解的行为:它意味着一种解释性或讲故事的功能。画外音是一个更宽泛的技术术语,指任何从画面外伴随视觉内容的语音音频,它可以包括旁白,但也涵盖广告文案、角色内心独白、教学讲解,以及并非严格叙事的品牌人格传达。

AI 语音合成在画外音制作中是如何工作的?

像 ElevenLabs 这样的 AI 语音合成系统从文本输入生成语音音频,使用在大量人声数据上训练的深度学习模型,产出听感自然的输出。用户提供一段文本文案,选择或设计具有特定特征(性别、口音、调性、语速、情绪寄存器)的声音,系统随即生成一个语音音频文件。领先系统的输出质量已足够高,可用于专业制作场景;而声音克隆则允许复制特定人声,以在多块内容之间保持一致。

什么样的画外音表演才算到位?

一段出色的画外音表演是对话式的,而非宣讲式的:说话者听起来像在对一个人说话,而不是在向一群观众致辞。语速有变化、自然,停顿被有目的地运用,而不是机械地一路念过。情绪调性与所呈现的内容以及品牌或叙事语境相匹配。在技术上,录音干净一致,没有房间混响、背景噪声或距离变化。声音的性格(温暖、权威、活力、亲密)与内容所需的感受相吻合。

画外音应如何与视觉内容对位?

画外音与视觉内容应做到:语音的节奏与剪辑的节奏彼此强化,而不是互相对抗。旁白中的停顿应落在视觉剪切或画面的关键时刻上。除非句子专门追随某个视觉过渡,否则句子不应在剪切点上起头。总的原则是,语音应与剪辑一同呼吸:让人感觉两者是一同创作出来的,而不是把一方作为事后补救叠加在另一方之上。

录制画外音最理想的环境是什么?

画外音录制需要一个经过声学处理的空间:安静、隔绝外部噪声,并有足够的吸音以避免房间混响给录音染色。专门搭建的人声录音棚最为理想;就地录制时,以软装(衣柜、挂帘的房间、垂布的角落)铺设的小房间可作为临时声学处理,效果不错。一支高质量电容麦克风、一台干净的前级放大器与一个防喷罩是必备的技术要素。以高于最终交付格式的位深与采样率录制,可为后期处理留出更大的灵活余地。

AI 画外音能取代人类配音人才吗?

AI 语音合成已经达到一种质量水平:在许多应用中其输出与人声录制难以区分,如今已用于专业的商业、教育与社媒内容制作。对于需要特定授权配音人才、需要超出当前合成能力的情感复杂度,或在合同上要求使用真人演员的内容,人类画外音仍是恰当之选。但对于绝大多数功能性画外音应用(旁白、教学、品牌内容、讲解视频),AI 合成提供了质量、速度与成本上极具吸引力的组合。

我该如何在后期把画外音与 AI 生成视频整合起来?

先生成或录制你的画外音音频,或与视觉生成并行进行,并把它作为一条独立音轨导入剪辑时间轴。可以顺着画外音的节奏来搭建你的视觉剪辑,也可以调整画外音的语速来匹配你偏好的视觉剪辑:两种做法都可行。在 DaVinci Resolve 或 Premiere Pro 中,利用音频波形识别停顿与句界,并把视觉剪切对齐到这些点上。把成片音频与任何音乐或音效设计混合到这样一个电平:语音清晰且被优先突出,同时不压过整体的视觉声场。

Can't find what you are looking for?
Contact us and let us know.
bg