在我上小学时候,每天早上7点,教室里的广播小喇叭就会传出一个声音:“同学们,早上好!狐狸精广播站现在开始广播啦!”我听了很久都不明白,后来终于才弄清楚,原来播音员说的是:
“红领巾广播站开始广播啦!”——这应该算是一种“空耳现象”了……
可以这样说,任何一种我们觉得新奇、有趣、费解或者习以为常的语言现象,其背后都有着一定的原理或者规律在起作用,区别只在于我们是否有了足够的研究与了解,是否透过这些表面的现象发现了隐含在其下的种种不为人知的秘密,而想对其进行一个完整而透彻的解答,往往需要多学科综合性的研究。
空耳现象当然有着一定的“语言学意义”(我个人理解为在语言学上具备研究价值,或者能从语言学角度进行分析解释),因为它涉及到语言感知(Perception of Language )的问题。研究空耳现象,人们可以从语音学、心理语言学、认知语言学、病理语言学、社会语言学等语言学诸多分支中发掘出不少研究话题,乃至于透过语言和言语感知窥探到人类认知的某些奥秘。
就我个人看来,单单直接做空耳的语料分析(比如语义、语法等),其意义可能不大,重要的是范畴感知的过程和范畴感知边界的确认。为什么、在什么条件下会把一个音素听成了另一个音素是值得揭示的,比如vot达到零点零几秒会让感知的声学提示不同(这就属于语音学、心理语言学的研究);或者,通过空耳的语料分析,能确认某个社团、群体样本所显示出的特征或倾向性(这就属于社会语言学的内容),以及等等。
这个回答主要是从心理语言学方面来分析空耳形成的原因,让人了解一下听到空耳时,人们对语言、对语音的处理经历了一个怎样的过程。至于有没有“语言学意义”,自行判断就好了。
1.语言感知
人们要使用语言来进行交际,首先必须接触和感受语言的外部形式,包括其声音和文字。语言感知包括口头语(即言语感知,Perception of Speech)和书面语(书面语感知,Perception of Written)。
空耳现象是典型的言语感知现象,言语感知又分为孤立音素感知(perception of isolated speeh)和连续性言语感知(perception of continuous speeh)。
在《语言本能》中提到了一个例子:心理学家罗伯特·雷米兹(Robert Remez)、大卫·皮索尼(Davis Pisoni)在《科学》上发表了一篇关于“正弦波语言”(sine-wave speech)的文章。他们将三个同时震动的声波进行合成,使之在物理上听起来不像人类的语音,但这三个声波遵循着与句子“where were you a year ago?”一样的语音频率和幅值。结果志愿者表示自己听到了某种“科幻的声音”或者“计算机的哔哔声”。实验人员找来第二组志愿者,并告诉他们这个声音出自一个损坏的语音合成器。结果,这一批志愿者能从中听出许多单词,其中1/4的志愿者可以完整地写出这个句子。
空耳很多时候就像“正弦波语言”一样,我们听起来像是在说话,而至于说的是什么内容,那可能要看我们的脑洞开到了什么程度。
2.孤立音素的感知过程
话说为什么会这样,我们可以先从孤立的音素感知过程开始说起。这个过程有三个阶段:
一,听觉阶段(the auditory stage)。在这个阶段,人们接触到语流,并把听到的声学信号分析为声学提示(acoustic cues)。这些声学提示提供一个音素的部分信息(什么“清音”,“鼻音”,“双唇音”等等),储存在听觉记忆里,供第二个阶段——语音阶段(the phonetic stage)使用。
二,语音阶段(the phonetic stage)。在这个阶段,我们把各种声学提示放在一起,从而辨认出一个个音素,然后把它们放在语音记忆里。在语音记忆理,保留的就是音素信息了,而不是上一阶段的声学提示。接下来进入第三个阶段。
三,音系阶段(the phonological stage)。这个阶段里,我们参照语言对音段系列的制约,对语音阶段所辨认的音素进行调整。以英语为例,我们听到的可能是[fpin],但英语里没有这样的系列,于是就调整为[spin]。
人耳、人脑不是机器,这三个过程是很有可能出现偏差的,由此导致了空耳现象。
在第一个阶段里,声学提示有两种,一种是独立于上下文的,如[s z ʒ dʒ ʃ tʃ]等辅音不受临近元音影响;还有一种是依赖于上下文的,上述辅音以外的辅音都受临近的元音的影响(还有比如VOT,声音成阻时间,也是一个依赖于上下文的提示)。像slit这个词的[s]和[l]之间要是有一个短暂的停顿,我们就会听成split。
第二个阶段的主要作用是感知语音切分的成分(constituents)。而切分成分的辨认是范畴性(categorical)的。由于言语成分的声学特征变化甚多,而常有重叠,语音阶段必须把它们分成离散的范畴。这就涉及到所谓的范畴感知(categorical perception)。而不同的人的范畴感知边界未必是一样的,哪怕对于同样的声学提示(比如VOT吧),也许对绝大多数人来说,足够以此来区分双唇塞辅音中的清音和浊音,但仍可能有一小部分人对此根本不敏感,而无法将其分成离散的范畴。
在第三个阶段时,人们开始进一步使用语言的音系规则去处理语言。不同语言有不同的语音系统,如果非要生搬一个系统去硬套另一个系统,那么偶尔出现奇怪的东西一点也不奇怪。
3.连续性言语感知
前文我们说道:人们要使用语言来进行交际,首先必须接触接触和感受语言的外部形式,包括其声音和文字。当然,语言感知是个复杂的问题。我们不能只注意这些外部形式,我们的注意力还在于这些外部形式所传递的内容。人们在会话中注意的是消息的交换,而不单单是声音。故此,必须还要观察连续性言语感知。
关于连续性言语感知和孤立音素言语感知的关系,有着两种不同的看法。一种是认为前者是在后者的基础上发展起来的;另一种看法是,这两个过程基本上是不一样的。
上个世纪50年代,Miller等人(1951)让被试在不同噪音干扰下辨认单词,这些单词有的是孤立的,有的则是出现在由5个词组成的句子里。他们发现,在语音和噪音的响度(loudness)一样的情况下,被试可以辨认出70%出现在句子里的单词,但是孤立的单词却只能认出40%。因此他们认为,句子里的句法和语义制约有助于辨认单词。这是因为单词的上下文在起作用
Warren(1970)还通过实验发现一种所谓语音复原效应(phonetic restoration effect),被试在实验室里听到像这样的一句话的录音:
The state governors met with their respective legi*latures in the capital city。(州长们和各自的立法机关开会。)
在*号处,录音被切去0.12秒,而代之以咳嗽声。所以legislatures中的s实际上是被试听不到的。实验后,当被试被问到上述句子有没有缺少什么音素时,20人中有19人说没有少了什么,剩下的一个被试也没有说对。再问他们咳嗽是在句子什么地方发生的,谁也不能准确说出来,有一半人以为是在legislatures以外的地方发生的。甚至这个词中的更多的音素被嗡嗡声代替(如le***latures)时,被试仍然听不出来这个词是被打断的。如果没有咳嗽声和嗡嗡声,被试人就能马上听出无声处。
这种语音复原效应说明,建筑在上下文基础上的从上而下的过程十分强有力,让被试能够“听”到没有自下而上的证据支持的声音。这也说明,言语感知并非完全在声学提示的基础上进行的,而是言语的内容和输入的数据在相互起作用。
因此,简单说,之所以会出现空耳现象,是因为我们在言语感知的过程中,大脑会自发进行一定程度的调整或者“脑补”,在一堆可能只与语音有那么些许相似的声音中,听出一些内容。所谓“你想听到什么就能听到什么,而且越听越像”大致就是这个样子。而至于为什么人和人听得又不一样,有的比较污,有的比较玄,那可能是因为“淫者见淫,智者见智”吧。
主要参考资料
[1]桂诗春.什么是心理语言学[M].上海:上海外语教育出版社,2011
[2](美)史蒂芬·平克 著,欧阳明亮 译.语言本能[M].杭州:浙江人民出版社,2015
[3]林焘,王理嘉.语音学教程(增订版)[M].北京:北京大学出版社,2013