声音原理科普

声音的探索：从震动到共鸣

从空气震动到数字音乐声音和颜色一样，我们天天接触又知之甚少，让我们一起走进声音的奇妙世界。

王圆圆

13 Aug 2025 — 12 min read

Photo by Nuno Alberto / Unsplash

你有没有想过，为什么蚊子飞过耳边时那么讨厌，而大提琴的声音却能让人落泪？为什么同样是声音，有些让人舒服，有些让人烦躁？

其实，声音比我们想象的要简单，也比我们想象的要复杂。

昨天晚上我在客厅，听到女儿在房间弹吉他。那个音符在空气中飘荡，传到我耳朵里，变成了美妙的旋律。但你知道这个过程中到底发生了什么吗？

声音其实就是空气的震动。吉他弦振动，推动周围的空气分子，这些分子又推动旁边的分子，就像石头扔进水里产生的波纹一样，一圈圈地传播出去。当这些"空气波纹"传到你耳朵里，鼓膜开始振动，大脑就告诉你"有声音了"。

这就很有意思了。声音本身是看不见摸不着的，它只是空气分子在那里"传话"。没有空气就没有声音，所以太空中真的是无声的世界。

那为什么不同的声音听起来不一样呢？关键在于震动的方式不同。

你拿个尺子，用力按住一头，另一头伸出桌边，然后弹一下。尺子振动得快，声音就尖锐；振动得慢，声音就低沉。这就是"频率"的概念。

我们说一个音的频率是440赫兹，意思是空气每秒钟震动440次。这个频率对应的就是音乐里的"标准A"，钢琴上那个A键的音高。

人耳能听到的频率范围大概是20赫兹到20000赫兹。20赫兹以下叫"次声波"，你听不见但能感觉到，比如地震前动物的异常反应，就可能是感受到了次声波。20000赫兹以上叫"超声波"，蝙蝠和海豚就用这个来导航。

但光有频率还不够，还得有"响度"。同样是440赫兹的A音，钢琴轻弹和用力敲击，听起来完全不一样。这就涉及到振动的"幅度"。

想象一下荡秋千，荡得高就是大幅度，荡得低就是小幅度。声音也一样，振动幅度大，声音就响；振动幅度小，声音就轻。

我们用"分贝"来衡量响度。0分贝是人耳刚能听到的最小声音，正常对话大概60分贝，演唱会现场能到120分贝。超过130分贝就开始伤害听力了。

这里有个有趣的现象：分贝不是线性增长的。60分贝的声音比30分贝的声音，不是响了一倍，而是响了1000倍！这是因为分贝用的是对数刻度。就像地震的里氏震级一样，数字差一点，实际威力差很多。

现在我们聊聊音质。为什么小提琴和萨克斯演奏同一个音，听起来却完全不同？

答案是"泛音"。当你弹一根吉他弦时，它不仅以基本频率振动，还会同时以2倍、3倍、4倍等频率振动。这些额外的频率叫泛音，它们决定了声音的"音色"。

小提琴的泛音成分和萨克斯的不一样，所以即使演奏同一个音符，听起来也不同。这就像同样的基础食材，不同的调料搭配，做出来的菜味道完全不一样。

人声也是这样。为什么你能通过电话认出朋友的声音？因为每个人的声带、口腔、鼻腔构造不同，产生的泛音成分不同，形成了独特的"声纹"。

说到这里，我想起录音技术。以前的留声机是怎么工作的呢？

声音推动一个振膜，振膜连着一根针，针在转动的蜡盘上刻出波浪形的凹槽。播放时反过来，针跟着凹槽震动，带动振膜，重新产生声音。这就是最早的"模拟录音"。

模拟录音就像画画一样，声音的波形直接对应录音介质上的物理形状。声音高低起伏，唱片凹槽也高低起伏。

但现在我们用的都是"数字录音"。这就像把连续的画面变成了像素点。

计算机不懂什么是声音，它只懂数字。所以我们要把连续的声音波形，变成一串数字。这个过程叫"采样"。

想象你在画一条曲线，但只能用直线段来画。线段越多，画出来的曲线越接近原始形状。数字录音也是这样，每秒钟测量声音的强度很多次，记录成数字，然后用这些数字重建声音。

CD音质是每秒采样44100次，每个样本用16位数字记录。为什么是44100？因为人耳最高能听到20000赫兹，根据奈奎斯特定理，采样频率至少要是最高频率的2倍，所以44100已经绰绰有余了。

现在流行"高解析度音频"，采样频率能到96000甚至192000，样本精度也从16位升级到24位或32位。这就像从720p升级到4K一样，细节更丰富。

但这就带来一个问题：文件太大了。一首4分钟的CD音质歌曲，原始数据有40多MB。所以我们需要"压缩"。

MP3就是一种压缩格式。它利用人耳的特性，把你听不到或不太注意的声音成分删掉，把文件压缩到原来的十分之一。这就像拍照时选择JPEG格式一样，文件小了，但质量也降低了。

现在我们有了无损压缩，比如FLAC，能把文件压缩到一半大小，但不损失任何质量。就像ZIP压缩一样，解压后完全一样。

说到压缩，就不得不提"动态范围"。这个概念很重要，但很多人不理解。

动态范围就是最响和最轻之间的差距。古典音乐的动态范围很大，从钢琴的pianissimo（极弱）到全体乐器的fortissimo（极强），差距可能有60分贝以上。

但现在很多流行音乐为了在各种设备上都听起来够响，会压缩动态范围。这叫"响度战争"。结果就是音乐听起来很吵，但没有层次感。就像把一张对比度很高的照片，硬生生地压成灰蒙蒙的样子。

现在Spotify等平台开始用"响度标准化"技术，让不同歌曲的音量保持一致，这样音乐制作人就不需要过度压缩了。

我们再聊聊空间感。为什么立体声比单声道好听？为什么现在有5.1、7.1环绕声？

这要从我们怎么定位声音说起。你闭上眼睛，朋友在房间里说话，你能判断他在哪个方向。这是怎么做到的？

主要靠两个耳朵的"时间差"和"音量差"。声音从左边传来，会先到达左耳，然后到达右耳，时间差只有几毫秒，但大脑能察觉。同时，左耳听到的音量会比右耳大一点。

立体声就是利用这个原理。左右两个音箱播放略有不同的内容，营造出声音来自不同方向的感觉。

5.1环绕声更进一步，用6个音箱包围你，让你感觉置身其中。看电影时，后面的音箱传来脚步声，你会不自觉地回头看。

现在最新的技术是"空间音频"。它不仅考虑声音来自哪个方向，还考虑声音在三维空间中的位置，甚至你头部的转动。戴上支持空间音频的耳机，你转头时，音乐的空间感也会跟着变化，就像声源真的在空间中一样。

说到耳机，我们聊聊它的工作原理。

耳机本质上是个小喇叭。喇叭的核心是一个线圈和磁铁。电流通过线圈时，线圈变成电磁铁，和固定磁铁相互作用，推动振膜前后震动，产生声音。

电流的方向和强弱变化，决定了振膜震动的方向和幅度，从而产生不同的声音。这就像用电来控制一个看不见的小锤子，在你耳边敲击空气。

不同类型的耳机，振膜材料和结构不同，声音特点也不同。动圈耳机结实耐用，声音厚实；静电耳机精细敏感，声音通透；平板耳机介于两者之间。

现在还有主动降噪耳机。它的原理很巧妙：用麦克风收集外界噪音，然后产生一个"反相"的声波来抵消噪音。就像两个人说话，一个说"上"，另一个同时说"下"，结果就是静音。

但主动降噪只对低频噪音有效，比如飞机引擎声、空调声。对于突发的高频噪音，比如说话声、敲击声，效果有限。

我们再说说音乐制作中的一些概念。

"混音"是什么？就是把多个音轨合并成最终的立体声。一首现代流行歌曲可能有几十个音轨：主唱、和声、吉他、贝斯、鼓、键盘等等。混音师要调整每个音轨的音量、左右定位、频率特性，让它们融合成和谐的整体。

"EQ"就是均衡器，用来调整不同频率的音量。就像调音台上的推子一样，低频推子控制低音，高频推子控制高音。通过EQ，可以让人声更清晰，让鼓声更有力，让吉他更突出。

"混响"是模拟不同空间的声学特性。在教堂里说话和在卧室里说话，听起来是不一样的。混响器能模拟各种空间，让录音室里录的干声，听起来像在音乐厅里演奏一样。

"压缩器"用来控制动态范围。它能自动降低过响的部分，提升过轻的部分，让整体音量更均匀。但过度使用会让声音听起来很平，失去自然的起伏。

现在我们聊聊一些有趣的声学现象。

你有没有遇到过这种情况：在某些房间里说话有回音，而在另一些房间里没有？这就是"房间声学"的问题。

声音碰到墙壁会反射，如果房间是正方形或长方形，声波会在墙壁之间来回反弹，形成"驻波"。某些频率的声音会被加强，某些会被削弱，导致声音不均匀。

专业录音棚的墙壁都设计成不规则形状，或者贴上吸音材料，就是为了避免这些问题。

还有个现象叫"多普勒效应"。救护车开过来时，警报声音调变高；开远时，音调变低。这是因为声源移动时,声波被"压缩"或"拉伸"了。

这个效应不仅解释了救护车的声音变化，还被用来测量星系的运动速度，甚至是雷达测速的原理。

最后说说未来的声音技术。

现在AI开始介入音频领域。AI能够模拟任何人的声音，只需要几分钟的录音样本。AI还能自动分离音乐中的不同乐器，把一首完整的歌曲拆解成各个音轨。

还有"神经音频编解码器"，能用极小的码率传输高质量音频。未来可能只需要现在十分之一的带宽，就能传输CD音质的音乐。

虚拟现实和增强现实也在改变我们对声音的认知。在VR中，你不仅能看到虚拟世界，还能听到来自不同方向、不同距离的声音，让沉浸感更强。

但不管技术怎么发展，声音的本质没有改变——它仍然是空气的震动，仍然需要我们的耳朵去感受，需要我们的大脑去理解。

有时候我觉得，声音比颜色更神奇。颜色你能看到，至少有个具体的形象。但声音呢？它只存在于时间中，转瞬即逝，却能触动我们最深层的情感。

一段旋律能让你想起初恋，一个声音能让你想起家乡。这些记忆不是存储在视觉中,而是存储在听觉中。也许这就是为什么音乐被称为"时间的艺术"。

下次你听音乐的时候，也许会想起今天聊的这些内容。那时候，你听到的不仅仅是美妙的旋律，还有背后那些有趣的科学原理。从空气震动到数字信号，从耳膜振动到大脑解读，这整个过程本身就是一场奇妙的旅程。

声音的世界，远比我们想象的更加丰富和深刻。

声音的探索：从震动到共鸣

王圆圆

Read more

民未富人先老

城乡差距背后的高墙

闭源的中医

隐形的路