这个问题特别好,涉及人类口语产出的语音学、心理学、语言学等等要素。在知乎上已经有过好几个类似的提问了,我整理了一下,也邀请了几个我认为可以在这个问题下提供洞见的答主。
和这个问题类似的提问有很多,题目和下面的答者大多关注:单位时间内的语言产出量(语速,多邻国Duolingo:如何衡量不同语言语速的快慢?)和产出同等信息量的语速情况(比如,比特,用汉语说话的信息密度高还是用英语说话的信息密度高?目前来说,通过读音交流,信息密度最高的语言是什么?)。“用汉语说话的信息密度高还是xx”这个问题下的高赞 @黄鼠狼精Morrica 提供的研究给出了一个语速和信息量(比特)的对比方式,得出下面这样的结论。
语速快的是因为单个音节包含的信息少,语速慢的是因为单个音节的信息多。
也就是说,各种语言的信息传递能力没有高下。日语有哪些缺陷? - Minamoto的回答 - 知乎 https://www.zhihu.com/question/38159887/answer/467525605 这个回答里提到一篇研究
它把世界上主要的七种语言,英,汉,法,德,日,西,进行对比,分析效率。
为了公平起见,原文用越南语写成,全部交给七门语言的母语者翻译,取最短的一篇包含越南语全部意思的文献,然后比较这七种文献的音节数量,和越南语比较计算信息密度。
我就做个二道贩子再解读一下这个研究,这个研究将相同信息量作为控制变量(通过翻译的方法),考察语速的快慢,而汉语的“语速”最慢,但是由于汉语一个音节的信息密度最大,因此,虽然语速慢,但是“表达意思的速度(也就是单位时间的言语信息量)”和其他几种语言差不多,但是日语“表达意思的速度”和其他几种语言相比是最慢的。
总而言之,这个研究也和 @多邻国Duolingo 提供的研究有相似之处:日语的语速较快,汉语语速慢。和黄鼠狼提的这个研究也有相同的结论:单个音节的信息量少,那么语速就快,为了实现表达相同的信息量。反之,语速就慢。但是这篇研究和多领国对于哪个语言最低效的判断是不一样的,多邻国说的是越南语,该研究说的是日语。
以上,都是知乎上关于这个题目的讨论,我来再补充讨论一下这个题目。
讨论这种语速、信息量的话题,首先,要控制变量。要么控制语速,要么控制信息量。多邻国提到的研究控制的是单位时间,考察语速和信息量,即对比了语速,也对比了信息量,但是没有把二者的关系阐释清楚;黄鼠狼精提到的研究控制的是信息量,考察单位时间的音节量(语速),同时提到:不同的语言,单个音节提供的信息量不同。
这里涉及“信息量”这个变量怎么去考察,怎么定义,怎么量化。有的人提出,类似“井底之蛙”虽然是4个字,但是内涵太丰富了,或者如果大家爆梗,这个信息密度该如何计算?———这种涉及语义、语用的问题我们暂时先不考虑,只考虑最浅层的语言信息的传递问题,我们也尽量避免句法和语音的交界影响,只考察来自语音的证据——which is很勉强,但是我们试着去考察一下。 @黄鼠狼精Morrica 所引的研究用了比特这个概念,
我补充的内容是从听话人对节奏的感知的视角来的。不讨论信息量传递的多少,只讨论说两种语言的人,都是各自语言背景里正常语速的发音人,是不是一种语言听起来比较快。
我们听一段话的时候,从两方面的感知了这段话。一是从内容上,也就是对元音辅音等音段信息的获取——这也是言语信息的来源,元音辅音的组合传递了语言信息,体现在音素的组合上,也就是前面所提到研究的音节的感知、判断等;另一方面是对时间长短、音高变化等超音段信息的感受,比如F0,比如单位时间里的发音时长(分母不包括停顿),单位时间里的说话时长(分母包括了停顿),单位时间内的音节数。二者显然是相互影响的,因为如果一个人说话磕磕巴巴,我们也不太容易get到他的内容,如果一个人音节乱拼,元音辅音发错,他说得再慢,我们也不知道他的意思。
Pfitzinger(2000)[1]基于上面这两面的感知特点建了一个预测模型,这个模型的被预测变量就是人耳所感知的语速(perceived local speech rate,PLSR):
sr:syllable rate,单位时间内所产出的音节数。sr前面的s是系数。
pr:phone rate,单位时间内所产出的元音、辅音数。pr前面的p是系数。
c:常量。回归方程里经常有的一个预测误差值。
Pfitzinger的这个回归方程是根据德国人说德语的数据构建的,F0也是他考虑的变量之一,但是数据分析结果显示F0的预测作用并不大。在德国人的数据里,系数s是7.38,系数p是4.06,c是-1.41. ——也就是说,音节数和人的听感所感知的语速相关系数更高一些,音素数的系数也有4.06,比7.38小了近一倍。这个模型被其他研究证实了其预测可靠性(在德语的数据范畴内)。
那么,这个方程与其背后的理念和我们的题目有什么关系呢?这个方程其实是肯定了单位时间内元音、辅音的数量对听感所感知的语速的作用。我们听感上所感受的语速,不光包括单位时间内说话人发出来的响(音节数),也包括元音、辅音的数量——也就是一个音节的复杂程度。
banana,有3个音节,6个音素;stretchmarks,有2个音节,10个音素。
香蕉,有2个音节,8个音素;妊娠纹,3个音节,9个音素。汉语中的双音节词居多,三音节词较少,而音素最多的双音节词的音素也就是10来个左右,而英语、俄语这样的重音语言音节复杂,音节可以很多,音素也可以很多很长。
或者抛开音节语言、重音语言这种不时尚的说法:一种语言的音节的复杂性,也会带来听感上的语速比较快的感觉。
纯属开脑洞,欢迎讨论。
首先,题主你的感觉是正确的,大部分语言的传输效率应该是基本接近的。不然译制片的配音会成为一件无法完成的事情。
这个问题实际上知乎里面都提出过好几次了,因为经常会有一些朋友讨论语言优劣,所以就会有人提问语言传输效率问题,自然也一直有朋友在回答。
比如:
这几个回答都提到了里昂大学的一个研究成果。
这个研究最早是研究了七门语言,七门使用人数非常多的语言。包括印欧语系的英语、德语、法语、意大利语和西班牙语,然后日本-琉球语系的日语和汉藏语系的汉语普通话。后来又拓展到17种使用人数较多的语言,最后得出结论是,以上语言在正常语速下,输出效率都差不多,都在39bit/s的样子,标准差在5个bit/s左右。
这个研究还多关注了一个平时被忽略的点,它不仅仅考虑了语言本身的信息密度,还考虑了语言的实际使用。语言本身确实因为语法繁杂程度和音节的原因,信息密度有一些差距,但是信息密度越高的语言,语速就越慢,信息密度越低的语言,语速就越快。信息密度和语速相乘,最后都在39bit/s左右。
正常语速下传输速率稳定在39bit/s左右,这可能和大脑的信息处理能力有关,39bit/s可能就是大脑处理语言信号的带宽。人类在环境的压力下不断进化,信息处理带宽最终就进化到了现在这种状态,刚好让处理能力物尽其用。
语言的产生,是人类进化的一件大事。这是人类能拥有智慧的基本前提,可以说,它最终甚至可以决定了人类文明最终的高度。假如远古有个民族,他的语言说得特别慢,语言密度也特别低。那么这个民族的信息交流水平就位相对其他民族低很多,在和其他民族交流的时候,他们很快就会在竞争中处于劣势。这个民族要么走向衰亡,要么为了生存就会被迫提高语言传输速率。经过一段时间之后,最后各民族正常语速下的传输速率自然就趋向于一致。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有