多谢邀请。没法谈客观的东西, 只能分享一下看法。
绝对取代是不可能的。
部分取代从理论层面是可能的,虽然成本有点高, 手段复杂。
如果从实用的角度来看, 耳机某种程度上能取代音箱。
特别是现在移动设备的普及和用户的需求决定耳机要取代音箱。
也许这是大势所趋。
从原理上来说,耳机和音箱最终都是在耳蜗处形成神经冲动。
单纯从还原和重建的角度出发, 您可以从这里开始逆向,
而不是单纯考虑 DRP (ear-drum reference point ) 的声压。
总有付得起钱的乙方。
Think outside the box....
胡乱扯蛋夏姬霸写的, 大家别在意。
这个问题需要辩证的来看:能取代,但是不能完全取代。
假如单从声场还原和重建的角度来看,耳机对音箱的取代几乎已经提到了日程上。2005年前后用耳机来虚拟声场的技术就已经比较成熟了[1],而到了这两年,无论是在消费领域还是在专业领域里,相关的技术都在变着花样的往外出,比如说:
索尼的360 Reality Audio。
创新的Super X-Fi。
Waves刚发布不久的Abbey Road Studio 3插件。
等等等等。
所以从理论上来说,独立测算消费者的头部传递函数(HRTF)已经不是什么难事了,在此基础上计算头部冲击响应(HRIR)、甚至是双耳室内声冲激响应(BRIR)也早就已经是可以解决的问题了,关键问题还是时间与成本、以及消费者的接受能力。目前相关技术依然存在不少缺陷,比如为了得到特别精确的HRTF需要把麦克风塞到你的耳朵里(捂脸,索尼还真的这么干了),不然就只能用公用的HRTF、或者用照片来进行近似计算,体验上就会存在一些小问题,等等。所以这两年大家努力的方向主要是简化扫描方法、优化函数,尽可能的降低技术门槛。[2]
但从本质上来讲、通过一副好耳机来重建声场在技术上是可行的,而且一定也是未来的发展方向之一,这是毋庸置疑的。“用耳机为某个特定用户还原在某个特定场景中的特定位置上的特定声音”已经成为现实;但“用耳机为所有用户还原在所有场景上的所有位置上的所有声音”,是不现实的。
可能这话比较难以理解,那么咱们举个例子:你戴上一副耳机后,可以模拟出你坐在卡耐基音乐厅第五排正中位置听音乐会的声音。但是永远都不太可能为你模拟出坐在你家地下室西北角上听蓝牙小喇叭的声音。
不过为什么我说“不能完全取代”呢?答案其实很简单,人类感知音频——尤其是低频——并不是只有耳朵一个渠道,你的身体也是感知低频的重要途径之一。[3]实际上,人类对低频的追求与渴望始终推动着扬声器技术的进步:从70年代的电影“地震”、到雷鬼音乐、再到迪厅与夜店的盛行,更大口径的低频扬声器驱动着空气,制造出一次又一次动人心魄的震撼体验,同时撼动着我们的身体与耳朵。而这种体验,绝非是耳机那孱弱的单元所能还原的。
请允许我重复这样一个观点:人的听音不仅仅是一种生理活动、更是一种复杂的心理活动。人会本能地依赖自己过去的听音经验,并试图以此来指导自己的听音活动。所以即使我们100%地搞定了你的HRTF、计算出了精准的BRIR、“理论上”完全复现了你在卡内基音乐厅第五排正中央的听音体验,你的身体和头上的耳机依然会不停地提醒着你:这一切都是虚假的、是不现实的。然而与传统的立体声耳机听音体验比起来,这种技术已经可以称得上是质的飞跃了。
PS.关于这个问题,我其实推荐读一下Begault, Durand R., and Leonard J. Trejo. "3-D sound for virtual reality and multimedia." (2000).虽然是20年前的老文章了,但是里面讲的极其系统,值得反复细读。