这种猎奇向问题吧……尽管维基上搜一下也能找到,但事实上怎么判断音位数是个很无解的问题,把奥卡姆剃刀用到极致就会导致音位数骤减[1]。这里提几个一般会涉及的例子:
皮拉罕语(Pirahã)是穆拉语系(Mura)仅存的一种语言,位于巴西的亚马孙州东南部。有理由怀疑它是语圈内和克丘亚语一个知名度的南美原住民语言,因为它“太奇怪”,从音系[2]到句法[3]到词汇[4]都显得很另类。谈及音系,被各种吹得神乎其神的就是“十音位体系”:
但事实上问题很大。在音段层面,一个争议点在于[k]到底是不是独立音位,或许可以分析成/hi/的音位变体[ki];而在超音段层面,皮拉罕语是一种声调语言,有2-3个声调,可以口哨甚至音乐形式表达,而且其韵律结构所蕴含的信息可能被严重低估,但一般吹「音位最少的语言」时似乎很少会涉及超音段要素。总之,保守估计皮拉罕语也应该有12个音位,这样它是不是“最少”就很有争议了。
罗托卡特语(Rotokas,⟨s⟩表/t/)在巴布亚新几内亚最东端的布干维尔岛,属北布干维尔语系。
其中中部方言只有极其少的辅音(而且相当罕见的是没有鼻音),所以尽管加上元音后(元音长度是否算音位有争议)总数或许会比皮拉罕语要多,但还是可以争夺一下「辅音数量最少的语言」[5]。不过从另一方面来看,由于罗托卡特语的使用人口比皮拉罕语要多得多,所以已经具备了成熟的正字法体系,仅采用 A E G I K O P R S T U V 共12个拉丁字母(其中⟨S⟩和⟨T⟩都算作音位/t/的变体),所以从这一点来看也能算是「字母数量最少的语言」。
不过另外的阿伊塔方言里辅音则更多,有鼻音:
欧博古伊语(Obokuitai,-tai应该是后缀)在新几内亚岛印尼一端的湖原地区,属于湖原语系(Lakes Plain languages)。
整个湖原语系的特点就是音位数特别少,欧博古伊语只有6个辅音(同样缺乏鼻音;而且也没有爆音/p, g/,很符合类型学规律),也可以试图争夺一下「辅音数量最少的语言」。另外还有3个声调,所以「总数最少」就不指望了。
整个西北高加索语系就是辅音极其丰富、同时元音又极其简单的典例。
已灭绝的沃博赫语(Ubykh,这里不用“尤比克”)一方面在所有不包含搭嘴音的语言中拥有最庞大的辅音音位数量(大概有84个),另一方面却只有2个元音/ә, a/。不过与此同时又有大量的元音音位变体,所以分析成2个某种程度上也算作是用了剃刀后的产物:
西北高加索语系另有两个语族,切尔克斯语族(含阿迪格语和卡尔巴达语)通常有3个元音,而阿布哈兹-阿巴扎语中则通常是2个,后者和沃博赫语一道都可以算是「元音最少的语言」。
UPSID (UCLA Phonological Segment Inventory Database)数据库检索结果:
当然正如雷君所说,具体语言中取决于音位分析方法,音位数量能够小范围上下浮动。
不过这种猎奇向问题的事实性回答其实在语言学上来说没什么特别大的意义。语言学家更喜欢思考更加理论性质的问题:
我们来看看Maddieson (1984)是怎么分析的[1]。
那么首先我们来探讨一下音位的多少对于各自语言来说意味着什么。音位多达140多个的语言的语音系统和音位只有11或10个的语音系统看起来并没有阻碍这些语言的话者维系日常的言语交流。而且这些语言保持着那样的音位体系看起来也已经很久很久了,以致他们竟然幸存至今。多音位复杂音位库的语言并没有因为交流高效性和经济性而导致音位库萎缩,少音位简单音位库的语言也并没有音位因为过少而词不达意。
这并不是一个正态分布。虽然说20-40个音位的语言占到了多数,而且分布也向左倾斜,但是我们不要忘了单个的语言和统计采样中的某个数据点是性质完全不同的东西。每一个语言都是能支持一整个社会生活共同体的沟通系统,虽然时时刻刻系统中都存在一些扰动诱发可能的语言变化,但是从维持社会生活中的言语交际功能的共时稳定性角度来说,简单音位系统的语言和复杂音位系统的语言完完全全是同等的。复杂音位系统并没有因此在上万年的过程中简化音系系统,简单音位系统也没有因为少量的音位而创造复杂又冗长的形态素。
其次,音位的多少可能对音位库的结构产生影响。首先我们可以发现,随着音位库的规模越来越大,虽然元音的绝对数量也倾向于变多,但是元音-辅音比却是下降的。即,音位越多的语言辅音音位的占的比例更大。元音辅音比在UPSID里包含的语言中从0.065到1.308不等,平均值0.402,中值0.36。元音-辅音比例和辅音数量呈负相关关系(相关系数 = -.40, p值 = .0001)。这其实也很容易理解,区分辅音的手段多种多样,调音部位、调音方式、双重调音、次要调音等等,但是元音只能靠舌位的前后高低和是否圆唇区分,可供利用的“语音资源”没有辅音那么丰富。
另一个猜测是,音位库的丰富性还和该音位库中罕见音位的出现概率有关系。一般来说,音位库越小,出现类型学上罕见音位的概率也越小,而音位库越大,则出现罕见音位的几率也越大。统计结果却显示这个一般化猜测可能不成立。
一些明明应该很常见的应该更大几率出现在小音位库语言中的音却分布在更容易出现在大音位库那组里面。