【试读】《视听:幻觉的构建》视听合约

st-fm
【作者】:(法)米歇尔·希翁(Michel Chion)
【翻译】:黄英侠

【内容简介】:
这是一本极具开创性的电影声音理论经典著作,从多个层面分析了语言、声响、音乐等各种声音元素如何赋予影像时间感、空间感,起到“增值”效果,重新考察了声音在视听媒体中的地位。米歇尔·希翁首先将声音从画面中彻底独立出来,提出了三种聆听模式,而后将重新定义的声音再次纳入视听关系中,由此得出:不论是在早期有声片中,还是在利用了最新声音技术(如杜比、THX)的电影中,许多观众认为自己“用眼看到的画面”实际上是由声音构建的幻觉。

本书收录了好莱坞著名音响设计师、剪辑师沃尔特·默奇特别撰写的精彩导读,从一线创作者亲历体验出发,探讨了希翁声音理论与电影创作实践的密切关系。同时,新版增订了 100 个声音概念,这是三十年来希翁对其理论体系最全面的一次梳理和总结。

接上期内容:《视听:幻觉的构建》致中国读者

【本期试读内容】:
第1章
投射于影像之上的声音
1.1 视听幻觉

影院灯光暗下来,电影开始了。残酷而神秘的影像出现在银幕上:一台电影放映机转动着,电影的某个特写画面通过它,出现了吓人的动物祭品的影像、一个钉子被钉入手掌。然后,在更为“正常”的时间里,出现了一个停尸房。我们看到一个男孩的尸体,像其他尸体一样,但他忽然活了过来——他起身、读书、他倾向银幕前面,随后,在他的手前面,看起来一张美丽的女人脸庞正在成形。

到现在为止我们看到的是伯格曼的影片《假面》(Persona,1966)的开场段落,这是一直由像雷蒙•贝卢尔(Raymond Bellour)、大卫•波德维尔(David Bordwell)、玛丽莲•约翰斯•布莱克韦尔(MarilynJohns Blackwell)这样的人在书籍和大学课程中所分析的内容。而且,这段影片还会继续被这样分析下去。

停!让我们把伯格曼的影片倒到头,把声音关掉,忘掉我们以前看到的,重新观看影片。现在,我们看到了相当不同的内容。

首先,钉子钉入手掌的镜头:无声放映时,它形成了由三个分立的镜头所组成的感觉;而有声音时,因为声音的连接作用我们把它们看成一个镜头。不仅如此,无声时,被钉的手是抽象的;有声音时,它是可怕的、真实的。在停尸间的诸多镜头中,如果没有将它们连接在一起的滴水声,我们会发现这些镜头只是一系列静止的画面,上面只有互不相干的尸体的各个部位,失去了空间和时间。而且,那个男孩子的右手,没有伴随它的颤动的音乐来构成它探索的手势,就不会“形成”女人的面孔,而只是毫无目的地移动。整个段落已失去它的韵律与整体性。伯格曼是个被评价过高的导演吗?声音仅仅掩盖了影像的空洞、空虚吗?

下面我们来考查雅克•塔蒂(Jacques Tati)的影片《于洛先生的假期》(Monsieur Hulot’s Holiday,1953)中一个很著名的段落,在一个小海滨浴场上的巧妙小笑话引我们发笑。度假者们的极端保守、缺乏幽默以及他们的焦虑如此引人发笑!但是,让我们拿掉影像。令人吃惊的是:就像影像有一个背面,现在我们只用耳朵就“看到”了另一部影片的出现;这里有孩子们嬉戏的叫喊声、户外空间中回响的声音,这是个全然嬉戏和活力的世界。所有内容都在声音之中,而伴有影像时则不然。

现在,如果我们恢复伯格曼的声音和塔蒂的影像,所有内容都回归正常了。看到被钉的手使人感到恶心、男孩子隔空触摸并为他的人脸赋形,夏天里休假的人们看起来古怪而滑稽,那些在我们只听声音时没有特别注意的内容从影像中显现出来,就像连环画中表示对话的气泡。

现在,我们才以不同的方式理解和聆听。

作为影像艺术的电影观念只是一种幻觉吗?当然:从根本上说,它怎么能是其他东西呢?这本书就恰好是关于这种视听幻觉(audiovisualillusion)现象的,这幻觉处于声音与影像之间最重要关系的中心,正像前面所举的伯格曼的例子:我们应称为增值(added value)。

1.2 增值:定义
对于“增值”,我的意思是指富于表现力和富于信息量的价值,有了这些价值,声音可以充实一个给定的影像,以产生确切的印象,在一个人的直接或记忆的经验中已存有这种印象,那么这种信息或表达就好像“自然地”来自所看到的东西,而且已经包含在影像自身之中了。因此,正是增值给人一种(非常错误的)印象,即声音并非必须,声音仅仅复制了它在现实中自然产生的意义,要么全凭它自身产生,要么由它与影像之间的差异而产生。

增值的现象在声音/影像同步的情况下作用特别突出,凭借的是同步整合(synchresis)原理(参考第3章),即观众看到的和听到的内容之间一种立即和必要的关系的形成。银幕上大多的垮塌、击打和爆炸场面,某种程度上说都是模仿的,或是用非耐久性材料的撞击做出来的,只有通过声音来使其呈现出真实的强度感和物质性。但首先,在最基本的层次上,增值是由文字或语言添加到影像上的。

为什么这么早就提及语言呢?因为电影是一种人声中心的(vococentric),或更精确地说是词语中心的(verbocentric)奇观。

1.3 文字产生的增值
电影的人声中心与词语中心
我说电影中的声音主要以人声为中心,是指人声几乎总是被给予特权,从其他声音中突出、分隔开来。在拍摄中,声音录制时采集的总是人声——因此几乎就成了人声录制——而且只有人声在混录中是被分开的,像一件独奏乐器——对于它来说,其他的声音(音乐和音响)仅仅是伴奏。出于同样的原因,同期录音技术的发展历史,例如新型话筒和声音系统的发明等,基本上一直都集中注意力于说话(speech)的录制,因为我们所说的当然不是叫喊和呻吟的人声,而是作为词语表达媒介的人声。而且,在人声录音中所寻求的与其说是对原始音质的声学保真,不如说是对所说出的字词轻易即可获得清晰理解的追求。因此,我们所说的人声中心(vococentrism)几乎总是词语中心(verbocentrism)的。

电影中的声音是人声和词语中心的,首先因为人类的行为习惯也是如此。在任何一个特定声音环境中,你总是去听人声,那些声音较之其他声音(风吹声、音乐、交通声)更快地吸引并集中你的注意力。只有到后来,当你非常了解谁在讲话以及他们在讲什么时,你才可能把注意力从人声上转移开,去注意你听到的其他声音。所以,如果这些说话的声音是一种可以听懂的语言,你会首先寻求这种字词的意义,只有在你对于意义的兴趣得到满足之后,你才会转而去理解其他声音。

文字构成幻象
在课堂上,我经常举的一个有说服力的由文字产生增值的例子,是1984年从英格兰播送的一场航空飞行表演的电视节目,转播给法国观众时,是在一家法国演播室里由我们自己的主持人莱昂•吉特朗主持的。显然,传送给主持人的只有影像,没有解说,也没有特定的次序,尽管如此,胆大的主持人还是尽全力做了这次节目。在某个时刻,他确认说“有三架小飞机”,正如我们看到的影像,是的,在蓝天背景中有三架小飞机,这种极其多余的话总是会引人发笑。

吉特朗也会说“今天天气真不错”,这也是我们可以从影像中看到的,事实上真的没有云彩。或者:“前两架飞机在第三架前面”,然后所有人都已经看到那个情况。又或者:“那第四架哪儿去了?”——我们本以为它会出现在我们眼前,但这第四架飞机并不存在,这架飞机纯粹是吉特朗用言语的能力无中生有的。总之,主持人可以有50种其他“多余的”解说,但是它们的多余是虚幻的,因为在上述每个情形中,这种陈述都引导着我们并建构起我们的幻觉,然后我们就会在影像中“自然地”看到它们。

克里斯•马克(Chris Marker)在纪录片《西伯利亚来信》(Letterfrom Siberia,1957)中的著名示例——已经由帕斯卡尔•博尼策在另外的语境下做出了批评 ——即在相同的中性倾向影像上配以不同的政治说服宣传词(斯大林主义的、反斯大林主义的等等),它的问题在于通过这种夸张的案例,导致我们相信这仅仅是个政治意识形态问题,相信除此之外还存在着某些中性的讲话方式。由言语带给影像的增值,远远超过将政治主张简单地强加给影像的情形;增值通过严格的规划保证了幻觉的精确建构。在任何情况下,迅速消失的电影影像都没有留给我们很多时间去观看,不像墙上的绘画或书中的插图,我们可以用自己的节奏去探究,而且更容易脱离开它们的说明或评注。

因此,如果电影或电视的影像看起来在为自己“讲话”的话,它实际上是一种木偶口技表演者的言语。当蓝天背景中三架小飞机的镜头声明“有三架小飞机”时,它是由主持人的嗓音赋予生命的木偶。

1.4 音乐产生的增值
引起情感共鸣的和非情感共鸣的效果

在《电影中的声音》一书中,我阐述了一个概念,即在电影中,音乐产生与银幕上描述的情境相关的特定情绪有两种方式。一方面,通过利用场景的节奏、风格或表现方式,音乐可以表达对场景中气氛的直接参与;显然,这种音乐利用的是诸如悲伤、喜悦以及精神活动的文化编码。这种情况,我们可以说情感共鸣的音乐(empathetic music),它来自同感(empathy)这个字,来自感受他人情感的能力。

而另一方面,音乐相对于情境也可能表现出明显的无关性,以一种稳定、大无畏而不可抗拒的方式进行:在这种十足“漠不关心”的背景下,情节进行着。情节与漠视态度的音乐的这种对位,通过将情绪定位于一个广阔的背景之上,具有一种不是去凝固情绪而是加强它的效果。我称这第二种音乐为非情感共鸣的(anempathetic,即empathetic加上一个否定前缀a-)。电影中非情感共鸣的冲动通过自动钢琴、钢片琴(celesta)、八音盒以及伴舞乐队产生了那无数的音乐单元,这些音乐来源中那些经过深思熟虑的轻松和天真,纵使音乐自己假装不引人注意,却已强化了角色和观众的情绪。

诚然,这种有序的漠视效果已经出现在许多歌剧中,当情绪基调如此之高,使剧中角色呆滞而迟钝时,就引起一种精神病式的退行(psychotic regression)。因此,歌剧式癫狂行为的著名舞台惯例,就是当角色来回摇晃时,重复着愚蠢的小段音乐……但是在银幕上,非情感共鸣的音乐效果已经呈现得如此突出,我们有理由把它理解为与电影的本质密切相关——它机械的本质(mechanical nature)。

确实,因为所有电影都是以一种漠不关心的方式行进,而且投射于银幕的影像和通过扬声器传送的声音自动展开,产生运动与生命的幻影——这种展开必须自我隐藏、被忘记。如果不是去揭示这种电影的真实、它的机械面目(robotic face),那这非情感共鸣音乐是干什么的呢?非情感共鸣音乐召唤出这情绪与感觉的织体的机械结构(mechanical texture)。

最后,还存在一种既不是情感共鸣的也不是非情感共鸣的音乐情况,它或者具有一种抽象的意义,或者只起存在的作用,只有如同路标的价值:至少,它没有精确的情感共鸣。

声响的非情感共鸣
非情感共鸣效果最经常由音乐产生,但它也可能用声响来制造——例如,在非常暴力的场景中,一个角色死去之后,某些声音还继续着,如机器噪声、风扇嗡嗡声、淋浴持续响着的声音,就像什么事情也没有发生一样。这样的例子可以在希区柯克(Hitchcock)的影片《精神病患者》(淋浴声)和安东尼奥尼(Antonioni)的《过客》(ThePassenger,1975)(电风扇声)中发现。

1.5 声音对运动感知和速度感知的影响
声音运动

视觉和听觉感知具有比我们所认为的更加迥异的特性。我们之所以仅仅模糊地了解这一点,就是因为这两种感知在视听合约中相互影响,通过感染与投射,它们相互借鉴各自的属性。

首先,每种感知与动态和静止的关系完全不同,因为听觉与视觉相反,它从一开始就预先假设了运动。在含有运动元素的电影影像中,画框中许多其他事物可能保持固定不动,但声音由于它特有的性质,必定暗示一种位移或骚动,无论是多小的程度。声音确实具有暗示静止不动的方法,但只有在有限的情况下。人们说“不变的声音”就是指那些无论听到的是什么也不会引起变化的声音。这种特性只有在某些人造声源的声音中才能发现:拨电话盘的拨号声或扬声器的嗡嗡声。急流和瀑布的声音也可能产生一种隆隆的近似白噪声(whitenoise)的声音,但人们很少忽视那些哪怕是最小的无规律性和动态的痕迹。不变的声音效果也可以取一段变化的声音,把它们放在一个无限重复的循环圈中来产生。因此声音具有它自己的时间动态(temporaldynamic),就像一种运动或一个弹道的痕迹。

感知速度的差异
声音感知与视觉感知因属性不同而有着各自的平均速度,基本说来,耳朵分析、处理、合成的速度要快于眼睛。拿一个快速的视觉运动来说——一个手势——与相同时长的突发声音过程来比较,快速的视觉运动不会形成一种清晰的轮廓,它的过程不会以一个精确的影像进入记忆。同样的长度,声音过程可以成功地勾勒出清晰和确定的结构,独立、可以识别、可与其他声音区分开。

这不是注意力的问题。我们可以聚精会神地看视觉运动的镜头十次(例如,一个角色做一个复杂的手势动作),仍然无法清楚地辨别它的轮廓线。重复听十遍快速的声音段落,你对它的感知将会在精度上越来越确定。

这里有几个原因。首先,对于听别人说话,声音是语言的载体,而且说出的语句使耳朵迅速地工作;相比较而言,用眼睛来阅读就慢了许多,除了一些特殊训练的个别案例,如聋哑人。眼睛感知更慢些,因为它同时要做的事情更多一些,它必须在空间中探索,同时还要跟随时间的变化。耳朵辨别出听域(auditory field)中的一个细节,并且及时跟随着这个点或线(但如果耳边的声音是一段熟悉的音乐,听觉注意就更容易从时间线中偏离开去做空间探索)。所以大体上,在第一次与视听信息的接触中,眼睛在空间上更擅长,耳朵在时间上更胜一筹。

为“定位”视觉运动的声音与特技效果的声音
从听觉上观看(audio-viewing)一部有声电影的过程中,因为增值的干预,观众不会注意到认知本身的那些速度差异。例如,为什么在功夫片或特技影片中大量快速视觉运动不会产生令人迷惑的印象?答案就是,它们被以唿唿声、叫喊声、击打声、叮当声等形式的快速听觉标点(auditory punctuation)所“定位”,这些声音标记出了确定无疑的时刻,给观众留下了强烈的视听记忆。

无声电影已经对快速事件蒙太奇有了一定偏爱。但在它们的蒙太奇段落中,无声的摄影机很小心地将影像简化到极至,那就是,它限制了空间中探索性的感知,以便于促进时间上的感知。这意味着与草图相类似的高度程式化的视觉模式。爱森斯坦(Eisenstein)的影片《总路线》(The General Line,1929)中,奶油分离器的段落以其特写提供了一个出色的案例。

如果有声电影常常从充满很多角色和其他视觉细节的画框中心发出复杂而快速的运动,这是因为叠加在影像上的声音具有将我们的注意力引导到特定视觉轨迹上的能力。声音甚至提升了特技效果的潜力:有时它成功地使我们看到了甚至并不存在的快速移动的影像。

我们在本•波特(Ben Burtt)为《星球大战》(Star Wars,1977—1983)系列影片所做的声音设计中发现了很有说服力的例证。作为自动门打开的效果(使人想起一种六角形或是钻石形状的科幻电影中的自动门),波特设计了一种动态的并且令人信服的气动式的“唿”声。实际上它如此令人信服,在制作《星球大战2:帝国反击战》(The Empire Strikes Back,1980)时,当导演厄文•克什纳(IrvingKershner)需要一个开门的效果,他有时干脆用一个关着门的静态镜头后面接一个门开着的镜头,用本•波特的“唿”声剪辑上去后的结果是,在观众眼前出现的还是直接的切换镜头,但他们认为自己看到了门开的滑动过程。增值在这里起到了突出的作用,根据这种特别针对有声电影的现象,我们可以说声音比眼睛更快。

依赖手语长大的聋哑人,明显地发育出一种读出并组织快速视觉现象的特殊能力。这提出了一个问题,是否聋哑的情形调动了和正常人听声音时相同的大脑中心区域——这是导致我们质疑一种常识的诸多现象之一,这常识与声音和影像类别之间的区别有关。

耳朵的时间转折点
不仅如此,我们还需要更正听觉是连续发生的程式化认识。实际上耳朵聆听的是一个个短暂的声音片段,当耳朵展开声音内容时,它所感知和记忆的内容,已经存在于两到三秒的短暂声音综合体中。但是,在这两到三秒之中,它是被作为完形(格式塔[gestalt])来感知的,耳朵或耳—脑系统已经精密、严格地对其进行了调查,得出的整体事件的报告中填满了收集到的精确而具体的数据,周期性地进行传送。

这导致一种矛盾的情形:从认知声音的角度说,在我们感知到它们的很短时间之后,我们才听到声音。很响亮地拍拍你的手,去听它发出的最终的声音。听——也就是对听觉事件一个小片段的综合理解,被寄存于记忆——将很紧密地跟随着事件,但并不是完全与其同步的。

1.6 声音对于影像中时间感知的影响
时间化(temporalization)的三个方面

增值的最重要效果之一与影像中对时间的感知有关,声音会对它发挥相当大的影响。我们在上文已提到一个极端的案例,就是在《假面》的开场段落,通过水滴和脚步声将非时间性的静态镜头变为一个时间的连续流。声音通过三种方式使影像时间化。

第一,影像的时间活力(temporal animation)。在影像中,声音在不同程度上将对时间的感知渲染成精确的、详细的、即时的、明确的——或模糊的、波动的、宽泛的。

第二,声音给镜头赋予时间的线性感。在无声电影中,镜头并不总是表示时间的连续,只是镜头B中发生的事跟在镜头A展示的内容之后展示。但有了同步存在的声音,就确实产生了一种连续感。

st-620
(英格玛·伯格曼《假面》,1966)

第三,声音使镜头向量化(vectorize)或使镜头戏剧化,使它们朝向一个未来、一个目标,并且产生一种急迫感和期待。镜头向某处发展并在时间中被确定方向。我们可在《假面》的开场段落清楚地看到这种作用的效果——例如在第一个镜头中。

声音使影像时间化的必要条件
以下三类效果能否起作用,取决于被放在一起的声音和影像的性质。

第一类:影像本质上没有时间活力或向量。这是静态镜头的情况,或它的运动只是一般的波动,没有表示可能的结果——例如,波动的水。这个例子中,声音可以把影像带入一种完全由声音自身产生的时间感。
第二类:影像自身具有时间活力(角色或物体的运动、烟或光的运动、运动的构图)。这里,声音的时间感与影像中已有的时间感相结合。两者以一致或稍微对立的方式运动,就像两件乐器同时演奏的情况。

使影像时间化也取决于出现的声音类型。根据声音的强度、内部特征、音质和声音的发展变化,可以使影像的时间活力更强或更弱,并带有或多或少驱动的或抑制的节奏。下面为不同的作用因素:

(1)声音持续的方式。平滑而连续的声音比不平滑或波动的声音更少“活力”。尝试一下,先在小提琴上拉一段长音、稳定的音符以配合影像,然后以同样的音符但以快速碎弓拉一段颤音与之配合。第二种声音将引起更强的张力,以及使注意力迅速集中在影像上。
(2) 当声音进行时,具有怎样的可预见性。具有规律脉动的声音(如音乐中的通奏低音②或是机械的钟表滴嗒声)拥有很强的可预见性,它们较之不规律的、不可预见的声音产生的时间活力较弱;不可预见的声音使耳朵的注意力持续处于警觉状态。《假面》中的滴水声,以及塔可夫斯基(Tarkovsky)的影片提供了很好的范例:通过不规则的韵律使我们保持注意力。但是,一种过于规律重复的节奏也可能产生一种紧张的效果,因为听者在这种机械的规律性中期待一种变化的可能性。
(3)节奏速度。声音如何在时间性上给影像以活力,不仅仅是一个机械的节奏问题。一段快速的音乐不一定必然给影像的感知加速。使影像时间化实际上更多地取决于听觉流的规律性或非规律性,而非从音乐感觉角度所说的节奏。例如,如果音符的流动在速度上是中速的但不稳定,它的时间活力比速度快但却更规则的流动的音符要高。
(4)声音清晰度。高频丰富的声音将更强烈地控制感知,这就解释了为什么观众对许多近期电影的注意力更加集中。

使影像时间化也取决于声—画结合的模式和同步点的分布(见下文)。在这里声音激活影像的程度,也取决于它如何运用同步点(pointsof synchronization)——可预测或不可预测、变化或不变化。掌控住观众对声画关系的期待,往往能在使影像时间化(使影像具有时间感)上发挥强大的作用。

总之,要使声音对影像的时间感造成影响,最低限度的条件是必需的。首先,影像必须是适合的,不论是静态的还是在接受性上是被动的(比较《假面》中的静态镜头),或是有其自己特有的运动(可被声音 “时间化”[temporalizable]的微观韵律)。在第二种情况下,至少影像应该含有对声音流而言的结构因素——无论是和谐(agreement)、协约(engagement)、同感(如我们所说的共鸣)的因素,还是积极的抵触因素。

我说视觉的微观韵律(microrhythms),是指由诸如烟、雨、雪花的运动痕迹以及湖面、沙丘等波动在影像表面形成的快速运动——甚至是在可见时,胶片乳剂颗粒的杂乱无章的运动。这些现象产生快速和流动的韵律涵义,在影像本身之中使人逐渐产生一种振动、抖动的时间性。黑泽明(Akira Kurosawa)在他的影片《梦》(Dreams,1990)中系统性地利用了它们(开花的树上落下的花瓣雨,暴风雪中的雾和雪花)。汉斯-约根•西贝尔贝格(Hans-Jürgen Syberberg)在他静止不动的长镜头中也喜欢注入视觉的微观韵律(《希特勒》[Hitler,1977]中的烟雾,当埃迪斯•克莱维[Edith Clever]读着摩莉•布卢姆[Molly Bloom]的独白时摇曳的烛光等),曼努埃尔•德•奥利维拉(Manoel de Oliveira)也是同样(《缎子鞋》[Le Soulier de satin,1985])。看起来似乎证实了这种技巧作为现在时态微观结构的记录,确认了一种适用于有声电影的时间。

有声电影是一种时间记录法
具有历史意义的一个重要时刻一直没有被揭示:我们受惠于同步声(synchronous sound),因为它使电影成为了一种时间艺术。由于声音的出现,使得稳定的放映速度成为必需,它确实产生了远远超出任何人所能预见的结果,电影的时间不再是可变的值,这个时间原先根据放映的节奏或多或少是可变的。从此,时间具有了一个固定的值。有声电影确保了无论在剪辑中镜头是多少秒,在放映时则将具有同样精确的长度。在无声电影中,一个镜头没有精确的内在时长,风中树叶的摇曳和水面的涟漪没有绝对或固定的时间性。每次放映时,在设置放映速度的节奏时具有一定范围的自由。所以标准放映速度的、马达驱动的剪辑台直到声音时代才出现,也不算是什么偶然情况。

注意,我这里所说的是完成影片的节奏。在一部影片中当然可能有非标准速度的素材镜头——加速的或是慢速的——就像在有声电影史的不同阶段中迈克尔•鲍威尔(Michael Powell)、马丁•斯科塞斯(Martin Scorsese)、山姆•佩金法(Sam Peckinpah)或费里尼的作品中所看到的。即使这些镜头的速度并不必然重现拍摄时演员的真实运动速度,但无论如何它也是被固定在精确限定且被控制的速率上的。

所以,声音将影像使影像时间化:不仅通过增值效果,也相当明确地通过将放映速度正常化和固定化。难以想象一部塔可夫斯基的默片,他称电影为“在时光中进行雕刻的艺术”,他的长镜头利用具有韵律的抖动、震颤以及飞逝的影像为其赋予了活力,与大量克制的视觉韵律和运动一起组成了高度敏感的时间结构。因此,有声电影可以被称作“时间记录的”(chronographic)产物:被写入时间,同时也被写入运动中。

时间的线性化
当一段影像不必在它所描绘的运动中展示时间的连续性时——即我们可以同样地以共时或历时地读解它们时——现实的、叙境(diegetic)声音的添加将给这个段落施加一种真实时间感,就像一般的日常经历,但首先是一种线性而连续的时间感。

让我们看一个在默片中经常出现的场景:构成一群人反应的一组怒容或笑容特写的蒙太奇。如果没有声音,这些在银幕上出现的一个接一个的镜头,无需指明时间上相关联的动作。观众可以相当容易地将这些反应理解为是同时发生的,在一种与语法中的完成时态相似的时间中存在。但是,如果我们把这些影像配上群众的嘘声或是笑声,它们看起来就魔术般地落入了一种线性的时间连续统一体之中。镜头B中显示的是某人在镜头A中的角色之后大笑或嘲笑。

一些很早期的有声电影中群众场景的尴尬就来源于此。例如,雷诺阿(Renoir)的影片《母狗》(La Chienne,1931)中的开场,公司会餐的场景,声音(聚会者的笑声、交谈声)看起来是被附着于影像之上,这些影像被理解为铭刻于某种还不是线性的时间之中。

说话的声音,至少在当它是叙境的并且与影像同步时,具有将影像铭刻于一种真实而线性的时间之中的能力,这时间不再具有伸缩性。这一因素解释了在声音出现时,许多默片电影人在体验“日常时间”(everyday time)效果之后的沮丧。

在第3章中我们将以更长的篇幅讨论同步整合,它在线性化影像和把影像铭刻入真实时间的方面是强有力的因素。

真实时间向量
想象在一部热带地区的影片中,一个安静的镜头,一个妇女舒服地坐在走廊上一张摇椅里打着盹,她的胸脯有规律地上下起伏着。微风掀动着窗帘和挂在门口的竹风铃,香蕉树的叶子在风中翻动着。我们立即就可以接受这个诗意的镜头,而且可以很容易地将它从最后一格倒放到第一格,这基本上不会改变任何内容,看起来也很自然。我们可以说,这个镜头描绘的时间是真实的,因为它充满了重新构成现在时态结构的微小事件(microevents),但它并没有被向量化。在从过去向未来与从未来向过去的运动感之间,我们不能确定任何引人注意的差异。

现在让我们给镜头配一些声音——拍摄时录制的同期声或是事后混录的声带:妇女的喘息声、风声、竹风铃的叮当声。如果我们现在把镜头反向来放就完全不行了,特别是风铃声。为什么?因为这些叮当声中的每一声都是由一个突发的起音和随后慢慢消逝的共鸣组成的,都是具有限定性的,以一种精确而不能反向的方式,在时间中具有确定的方向。反向放映时,马上就会被认出是“反向了”。声音是被向量化了的。

《假面》开场中的滴水声也同样。最小的滴水声向我们所看到的内容施加了一种真实而不可逆向的时间,因为它在时间中呈现一种轨迹(小的冲击,而后是微小的共鸣),与引力和惯性逻辑相符。

这就是电影中声音与影像秩序之间的差异:在给定的时间尺度之下(例如两到三秒钟),听觉现象比起视觉现象在时间中具有更加特别的方向性,具有不可逆向的开始、中间过程和结束。

如果我们没有注意到这个事实,那是因为电影一直在通过利用视觉上不可逆向的事物从例外与矛盾中发掘娱悦人的内容:打碎东西的碎片飞到一起、倒塌的墙重新站起来,或是老套的游泳者从游泳池里跳出来回到跳板上的噱头。当然,展示出由不可逆向的力量造成的行为结果(重力使物体掉落、爆炸使碎片飞散)的影像,很明显具有方向性。但在电影中更经常出现的内容,如角色讲话、微笑、弹钢琴或无论其他什么内容则都是可以反向的,它们没有明确的过去或未来感。而另一方面,声音则通常由具有时间方向性现象的小段所构成。例如,不正是因为每个音符从一出现即开始消失,才由成千上万个具有真实时间指向的微小标识构成了钢琴音乐吗?

唧唧声和颤音:基于自然或文化的影响
声音给予影像的时间活力并不仅仅是物理或机械的现象:电影和文化编码在其中也起着作用。一段从文化角度理解并不“存在于”故事背景中的音乐线索或旁白,不会使影像产生摇摆。但这现象仍具有一种非文化的根据。

拿弦乐的颤音(tremolo)作为例子,这是一种在歌剧和交响乐中创造戏剧紧张感、悬念或是警示的传统手法。在电影中我们实际上利用音响效果得到同样的结果:例如,兰达•海恩斯(Randa Haines)的影片《失宠于上帝的孩子》(Children of a Lesser God,1986)中最后一场戏中夜虫的叫声。但这种环境声并不是被明确地编码为一种“颤音”,它并不存在于电影写作标准设计的正式手法编目中。但是它所具有的对时间的戏剧化感知与交响乐中颤音的作用一样,使我们集中注意力,对银幕上最微小的风吹草动变得敏感。声音剪辑师和混录师经常利用这种夜虫的环境声,就像交响乐指挥一样分配这种效果,他们通过对某些声音效果的选择录制以及混合它们的方式来创造整体的声音。显然,效果随着夜虫唧唧声的密度、它的规律或音质的起伏而变化——这就像一种交响效果。

但是,对于一个电影观众来说,在乐池中的弦乐颤音(观众将之认作是文化性的音乐过程)和昆虫的叫声(观众将之理解为从场景中自然发出的声音)之间有什么共同之处吗(当然观众没有料到后者的声音可能是分别录制再巧妙地重新合成的)?只有一种声学的一致性:尖历、高频、有点不均匀的振动,两者都使人警觉而且引人注意。看起来我们是有一种普遍而自发的感受效果在运作。但这也是一种非常脆弱的感受,即使最微小的缺陷——不好的声音平衡,由于制作中一个微小失误使观众对于视听合约失去了信任——都足以伤害它。

对于所有没有任何机械性的增值效果来说也是如此:在心理生理学的(psychophysiological)基础上构建,它们只在一定的文化、美学和情绪条件下,通过所有元素的总体互动而起作用。

1.7 增值的相互作用:恐怖声音的案例
增值是相互作用的。配上声音展示给我们的影像和单独展示给我们的影像有所不同,而配合影像的声音同样也能使我们听到和在黑暗中单独聆听不同的内容。但是,对于所有这些相互作用,银幕仍然是电影感知的主要支柱。受声音影响的影像也影响到声音本身,声音最终重新投射到影像上的是它们相互影响的产物。我们在恐怖或令人不安的声音案例中发现了这种相互作用的强有力的证据。影像在它们之上投射了一种它们自身全然没有的意义。

每个人都知道,那些回避用影像来表现某些事物的经典有声电影,都要求声音来帮忙。声音可以用比观众亲眼所见引起更强烈恐怖感的方式来表现看不见的事物。一个最典型的例子就是罗伯特•奥尔德里奇(Robert Aldrich)的杰作《死吻》(Kiss Me Deadly,1955)的开场段落,当拉尔夫•米克(Ralph Meeker)车上逃跑的搭车人被追赶她的人重新抓住并折磨时。我们看不到折磨的过程,只看到两条腿蹬着、挣扎着,同时我们听到这个不幸妇女的尖叫声。可以说,这里是一个声音运用的典型案例。当然——只要明确使尖叫声那么吓人的不是它们自身的声学特性,而是相关的叙事环境以及画面中让我们看到的内容投射到声音之上的东西。

另外一个令人难忘的听觉效果就是在莉莉安娜•卡瓦尼(LilianaCavani)的影片《皮囊》(The Skin,1981,根据马拉帕尔特[Malaparte]的小说改编)中的一个场景。一辆美军坦克意外地从一个意大利小男孩身上碾了过去,伴随着——如果我没记错的话——一声就像压碎西瓜一样的恐怖的声音。尽管观众不大可能听过在这种状况下人身体发出的真实声音,但他们会将之想象成具有这种液体的、粘稠音质的声音。显然这种声音是用拟音配上去的,也许就是用压碎西瓜的方法来做成的。

就像我们将要看到的,声音的隐喻意义本质上通常是相当不确定的。它取决于戏剧的和视觉的上下文关系,一个单一的声音可以传达多种不同的内容。对于观众来说,引导着他们把一个声音与一个事件或细节联系起来的因素,首先不是听觉真实性,甚至不是同步,第二也不是逼真性因素(逼真性并不来自于真实,而是习惯)。同样的声音可以令人信服地充当喜剧中压碎西瓜的声音,或是当作在战争片中把头打碎的声音。相同的声响在一个环境中令人愉悦,而在另一环境中令人无法忍受。

在弗朗叙(Franju)的影片《没有面孔的眼睛》(Eyes Without aFace,1960)中,我们发现观众和批评家们在看完影片之后,都在议论其中一个极其令人不安的声音:一个年轻妇女的躯体发出的声音——在一次皮肤移植实验之后,丢弃的令人恐怖的遗体——当外科医生皮埃尔•伯拉塞尔(Pierre Brasseur)和他的同谋阿莉达•瓦莉(AlidaValli)把遗体丢进一个家用地下室时,这沉重的一声(在影院中成功地使人战栗)与卡瓦尼影片中音响的共同之处就是它把人变成了一件东西,带着内脏和骨架一起,变成了面目可憎的、毫无生气的、用过即可丢弃的东西。

然而,这个音响之所以令人不安,还因为在影片的节奏中它构成了言语的中断(interruption of speech),即两个作恶者的言语缺失的时刻。在电影或真实生活中某些声音具有这种能力,因为它们发生于一个特定的地点:在语言流之中,它们形成了一个空洞。这一观念的一个令人恐怖的例子可以在塔可夫斯基的影片《安德烈•卢布廖夫》(Andrei Rublov,1966)中看到,一个俄罗斯王子出现在被鞑靼人折磨的场景中,他被绷带缠绕着,这掩盖了被严重残害的身体,只能看到他的嘴。他被放在一张床上,他诅咒着折磨他的人;后面出现了刑讯者的手拿着一个长把勺子盛满了滚开的油,这油被倒在了他的喉咙里。这一动作被刑讯人的身体遮挡着看不到,在那一时刻他仁慈地(更确切地说是明智地)挡在了观众和受害人的脑袋中间。我们听到了令人震惊的漱喉的声音,那使人起鸡皮疙瘩的声音。同样,就像使用上面提到的压碎西瓜的声音一样,这个声音也可以是彼得•塞勒斯(PeterSellers)在一部布莱克•爱德华兹(Blake Edwards)导演的喜剧中弄出的漱口的声音。

在这里,声音效果如此强而有力,是因为它表现了人的言语在其生理核心被摧毁时的情形:正被摧毁的是刚刚还在讲话的喉咙或舌头。

本文为后浪出版咨询(北京)有限责任公司官方授权刊载的电影图书试读系列,提供影迷更多接触电影知识的机会,文中内容不代表迷影网观点

(编辑:唐冶挺)

Cinephilia

迷影网(Cinephilia.net)创立于2010年,聚焦于创作和搜集最好的华语电影文字内容,翻译传播海外电影学术界和评论界的声音,用更为生活化的方式解读电影,结合所有愿意分享个体电影体验的影迷们,共同创造出中文世界里独具特色、质量兼备的电影网站。