声音的探索:从震动到共鸣

从空气震动到数字音乐 声音和颜色一样,我们天天接触又知之甚少,让我们一起走进声音的奇妙世界。

声音的探索:从震动到共鸣
Photo by Nuno Alberto / Unsplash

你有没有想过,为什么蚊子飞过耳边时那么讨厌,而大提琴的声音却能让人落泪?为什么同样是声音,有些让人舒服,有些让人烦躁?

其实,声音比我们想象的要简单,也比我们想象的要复杂。

昨天晚上我在客厅,听到女儿在房间弹吉他。那个音符在空气中飘荡,传到我耳朵里,变成了美妙的旋律。但你知道这个过程中到底发生了什么吗?

声音其实就是空气的震动。吉他弦振动,推动周围的空气分子,这些分子又推动旁边的分子,就像石头扔进水里产生的波纹一样,一圈圈地传播出去。当这些"空气波纹"传到你耳朵里,鼓膜开始振动,大脑就告诉你"有声音了"。

这就很有意思了。声音本身是看不见摸不着的,它只是空气分子在那里"传话"。没有空气就没有声音,所以太空中真的是无声的世界。

那为什么不同的声音听起来不一样呢?关键在于震动的方式不同。

你拿个尺子,用力按住一头,另一头伸出桌边,然后弹一下。尺子振动得快,声音就尖锐;振动得慢,声音就低沉。这就是"频率"的概念。

我们说一个音的频率是440赫兹,意思是空气每秒钟震动440次。这个频率对应的就是音乐里的"标准A",钢琴上那个A键的音高。

人耳能听到的频率范围大概是20赫兹到20000赫兹。20赫兹以下叫"次声波",你听不见但能感觉到,比如地震前动物的异常反应,就可能是感受到了次声波。20000赫兹以上叫"超声波",蝙蝠和海豚就用这个来导航。

但光有频率还不够,还得有"响度"。同样是440赫兹的A音,钢琴轻弹和用力敲击,听起来完全不一样。这就涉及到振动的"幅度"。

想象一下荡秋千,荡得高就是大幅度,荡得低就是小幅度。声音也一样,振动幅度大,声音就响;振动幅度小,声音就轻。

我们用"分贝"来衡量响度。0分贝是人耳刚能听到的最小声音,正常对话大概60分贝,演唱会现场能到120分贝。超过130分贝就开始伤害听力了。

这里有个有趣的现象:分贝不是线性增长的。60分贝的声音比30分贝的声音,不是响了一倍,而是响了1000倍!这是因为分贝用的是对数刻度。就像地震的里氏震级一样,数字差一点,实际威力差很多。

现在我们聊聊音质。为什么小提琴和萨克斯演奏同一个音,听起来却完全不同?

答案是"泛音"。当你弹一根吉他弦时,它不仅以基本频率振动,还会同时以2倍、3倍、4倍等频率振动。这些额外的频率叫泛音,它们决定了声音的"音色"。

小提琴的泛音成分和萨克斯的不一样,所以即使演奏同一个音符,听起来也不同。这就像同样的基础食材,不同的调料搭配,做出来的菜味道完全不一样。

人声也是这样。为什么你能通过电话认出朋友的声音?因为每个人的声带、口腔、鼻腔构造不同,产生的泛音成分不同,形成了独特的"声纹"。

说到这里,我想起录音技术。以前的留声机是怎么工作的呢?

声音推动一个振膜,振膜连着一根针,针在转动的蜡盘上刻出波浪形的凹槽。播放时反过来,针跟着凹槽震动,带动振膜,重新产生声音。这就是最早的"模拟录音"。

模拟录音就像画画一样,声音的波形直接对应录音介质上的物理形状。声音高低起伏,唱片凹槽也高低起伏。

但现在我们用的都是"数字录音"。这就像把连续的画面变成了像素点。

计算机不懂什么是声音,它只懂数字。所以我们要把连续的声音波形,变成一串数字。这个过程叫"采样"。

想象你在画一条曲线,但只能用直线段来画。线段越多,画出来的曲线越接近原始形状。数字录音也是这样,每秒钟测量声音的强度很多次,记录成数字,然后用这些数字重建声音。

CD音质是每秒采样44100次,每个样本用16位数字记录。为什么是44100?因为人耳最高能听到20000赫兹,根据奈奎斯特定理,采样频率至少要是最高频率的2倍,所以44100已经绰绰有余了。

现在流行"高解析度音频",采样频率能到96000甚至192000,样本精度也从16位升级到24位或32位。这就像从720p升级到4K一样,细节更丰富。

但这就带来一个问题:文件太大了。一首4分钟的CD音质歌曲,原始数据有40多MB。所以我们需要"压缩"。

MP3就是一种压缩格式。它利用人耳的特性,把你听不到或不太注意的声音成分删掉,把文件压缩到原来的十分之一。这就像拍照时选择JPEG格式一样,文件小了,但质量也降低了。

现在我们有了无损压缩,比如FLAC,能把文件压缩到一半大小,但不损失任何质量。就像ZIP压缩一样,解压后完全一样。

说到压缩,就不得不提"动态范围"。这个概念很重要,但很多人不理解。

动态范围就是最响和最轻之间的差距。古典音乐的动态范围很大,从钢琴的pianissimo(极弱)到全体乐器的fortissimo(极强),差距可能有60分贝以上。

但现在很多流行音乐为了在各种设备上都听起来够响,会压缩动态范围。这叫"响度战争"。结果就是音乐听起来很吵,但没有层次感。就像把一张对比度很高的照片,硬生生地压成灰蒙蒙的样子。

现在Spotify等平台开始用"响度标准化"技术,让不同歌曲的音量保持一致,这样音乐制作人就不需要过度压缩了。

我们再聊聊空间感。为什么立体声比单声道好听?为什么现在有5.1、7.1环绕声?

这要从我们怎么定位声音说起。你闭上眼睛,朋友在房间里说话,你能判断他在哪个方向。这是怎么做到的?

主要靠两个耳朵的"时间差"和"音量差"。声音从左边传来,会先到达左耳,然后到达右耳,时间差只有几毫秒,但大脑能察觉。同时,左耳听到的音量会比右耳大一点。

立体声就是利用这个原理。左右两个音箱播放略有不同的内容,营造出声音来自不同方向的感觉。

5.1环绕声更进一步,用6个音箱包围你,让你感觉置身其中。看电影时,后面的音箱传来脚步声,你会不自觉地回头看。

现在最新的技术是"空间音频"。它不仅考虑声音来自哪个方向,还考虑声音在三维空间中的位置,甚至你头部的转动。戴上支持空间音频的耳机,你转头时,音乐的空间感也会跟着变化,就像声源真的在空间中一样。

说到耳机,我们聊聊它的工作原理。

耳机本质上是个小喇叭。喇叭的核心是一个线圈和磁铁。电流通过线圈时,线圈变成电磁铁,和固定磁铁相互作用,推动振膜前后震动,产生声音。

电流的方向和强弱变化,决定了振膜震动的方向和幅度,从而产生不同的声音。这就像用电来控制一个看不见的小锤子,在你耳边敲击空气。

不同类型的耳机,振膜材料和结构不同,声音特点也不同。动圈耳机结实耐用,声音厚实;静电耳机精细敏感,声音通透;平板耳机介于两者之间。

现在还有主动降噪耳机。它的原理很巧妙:用麦克风收集外界噪音,然后产生一个"反相"的声波来抵消噪音。就像两个人说话,一个说"上",另一个同时说"下",结果就是静音。

但主动降噪只对低频噪音有效,比如飞机引擎声、空调声。对于突发的高频噪音,比如说话声、敲击声,效果有限。

我们再说说音乐制作中的一些概念。

"混音"是什么?就是把多个音轨合并成最终的立体声。一首现代流行歌曲可能有几十个音轨:主唱、和声、吉他、贝斯、鼓、键盘等等。混音师要调整每个音轨的音量、左右定位、频率特性,让它们融合成和谐的整体。

"EQ"就是均衡器,用来调整不同频率的音量。就像调音台上的推子一样,低频推子控制低音,高频推子控制高音。通过EQ,可以让人声更清晰,让鼓声更有力,让吉他更突出。

"混响"是模拟不同空间的声学特性。在教堂里说话和在卧室里说话,听起来是不一样的。混响器能模拟各种空间,让录音室里录的干声,听起来像在音乐厅里演奏一样。

"压缩器"用来控制动态范围。它能自动降低过响的部分,提升过轻的部分,让整体音量更均匀。但过度使用会让声音听起来很平,失去自然的起伏。

现在我们聊聊一些有趣的声学现象。

你有没有遇到过这种情况:在某些房间里说话有回音,而在另一些房间里没有?这就是"房间声学"的问题。

声音碰到墙壁会反射,如果房间是正方形或长方形,声波会在墙壁之间来回反弹,形成"驻波"。某些频率的声音会被加强,某些会被削弱,导致声音不均匀。

专业录音棚的墙壁都设计成不规则形状,或者贴上吸音材料,就是为了避免这些问题。

还有个现象叫"多普勒效应"。救护车开过来时,警报声音调变高;开远时,音调变低。这是因为声源移动时,声波被"压缩"或"拉伸"了。

这个效应不仅解释了救护车的声音变化,还被用来测量星系的运动速度,甚至是雷达测速的原理。

最后说说未来的声音技术。

现在AI开始介入音频领域。AI能够模拟任何人的声音,只需要几分钟的录音样本。AI还能自动分离音乐中的不同乐器,把一首完整的歌曲拆解成各个音轨。

还有"神经音频编解码器",能用极小的码率传输高质量音频。未来可能只需要现在十分之一的带宽,就能传输CD音质的音乐。

虚拟现实和增强现实也在改变我们对声音的认知。在VR中,你不仅能看到虚拟世界,还能听到来自不同方向、不同距离的声音,让沉浸感更强。

但不管技术怎么发展,声音的本质没有改变——它仍然是空气的震动,仍然需要我们的耳朵去感受,需要我们的大脑去理解。

有时候我觉得,声音比颜色更神奇。颜色你能看到,至少有个具体的形象。但声音呢?它只存在于时间中,转瞬即逝,却能触动我们最深层的情感。

一段旋律能让你想起初恋,一个声音能让你想起家乡。这些记忆不是存储在视觉中,而是存储在听觉中。也许这就是为什么音乐被称为"时间的艺术"。

下次你听音乐的时候,也许会想起今天聊的这些内容。那时候,你听到的不仅仅是美妙的旋律,还有背后那些有趣的科学原理。从空气震动到数字信号,从耳膜振动到大脑解读,这整个过程本身就是一场奇妙的旅程。

声音的世界,远比我们想象的更加丰富和深刻。

Read more

心智难民

心智难民

心智,按照牛津词典的定义,是获取和运用知识的能力。 互联网是一场技术革命,给每个人提供了机会。社会是由阶层组成的,每一场技术革命都促使了不同阶层的重新洗牌,或者说阶层分化。网络世界的阶层分化是什么样的呢?大概可以分为两个大的阶层:一类是接受高质量信息的精英阶层,另外一类是消费网络上的垃圾信息、接受劣质信息的乌合之众。 当然,这里说的“免费”是打引号的。因为它不仅不免费,而且一点也不便宜。 人们喜欢免费的东西。但是世界上除了阳光和空气,没什么是真正免费的东西,只是支付的方式不一样——有的直接用钱付,有的间接用钱付;有些用生活质量付,有些用人生的潜力和机会付。 You must pay for everything in this world, one way or another. Nothing is free. 你终究会以不同的方式付费,天下没有免费的午餐。 如果一个人只接受网上“免费”的信息,就像是只吃劣质食品一样,结果就是精神世界的劣质化。因为接受信息质量的差异,

By 王圆圆
Crazy World

Crazy World

by Jeff Daniels 译文 我看见一个年轻女孩笑了, 因为他刚说的话。 我看着他坠入她那双美丽的眼睛里, 脸红的像玫瑰。 我看见一位老人在走路, 妻子陪在他身旁。 我看着他俯身握住她的手, 天啊,我竟然哭了。 这疯狂的世界越来越疯狂, 我有什么资格评判呢? 但值得庆幸的是, 在这个充满仇恨的世界里, 还有人在用心相爱着。 我看见狗摇着尾巴, 看见孩子在奔跑。 我也曾在无数个日落里, 对着夕阳唱着歌。 我看见有人为别人扶着门, 看见陌生人握手寒暄。 我看见她和那个曾经错过的旧情人拥吻, 时间比计划中的更长了一些。 这个疯狂的世界继续疯狂着, 但我能说什么? 好在这个充满恨的世界里, 还有人在用心相爱着。 我看见祈祷被回应, 看见了六月里的新娘。 我骄傲地说,我当时见到了银河, 对着月光下的人们闪烁。 我看见送出的一打玫瑰, 见过她满心的欢喜藏不住, 我见过的已经足够, 让我明白我所知道的, 也坚信我依然相信的。 这疯狂的世界越来越疯狂, 我能说什么? 但值得庆幸的是, 在这个充满仇恨的世界里, 还有人相爱着。 原文 I’ve seen a

By 王圆圆
人是能被改变的吗?

人是能被改变的吗?

想改变别人基本上是在浪费时间。这个话题听起来简单,但仔细想想,我们生活中有太多时候都在做这种徒劳的事。 生活中的人大概可以分成三类: 喜欢的人 - 这些人即使有缺点你也能接受。你们相处舒服,他们做什么你都能理解,就算偶尔看不惯,也不会想着要去改造他们。 无所谓的人 - 占了我们生活中的大多数。同事、路人、网上的陌生人,他们怎么生活、怎么思考,其实跟你一点关系都没有。 讨厌的人 - 那些让你感到不舒服的人。可能是价值观完全相反,可能是行为方式你无法忍受。 既然人际关系本来就是这样,为什么还要费劲去改变谁呢?尤其是那些无所谓的人和讨厌的人,你花时间去说服他们、纠正他们,最后累的是自己。有这个功夫,不如多看两本书,学点新东西,改变一下自己。 美国人教小孩一个词:Walk Away。意思就是遇到麻烦的人、不讲理的人,转身走就完了,不用纠缠。 这听起来好像是逃避,但其实是一种很成熟的处理方式。你不是害怕对方,而是知道跟这种人浪费时间没有意义。 有个作家Charles Portis说过一句话挺有意思的:"

By 王圆圆
留守的代价

留守的代价

我有一个90后的朋友,她的故事让我久久无法平静。 她13岁那年,初中还没读完就辍学了,跟着同乡去了南方打工。六年后,在家人的安排下,她嫁给了邻村一个老实人家的儿子。没有恋爱,没有了解,只有两个家庭觉得"差不多,能过"的判断。 婚后他们一起在宁波工作,陆续有了两个女儿。按理说,一家四口,日子虽苦但也算完整。但我们那个地方,重男轻女的观念像一只看不见的手,推着她生下了第三个孩子——终于是个儿子。 三个孩子陆续到了上学的年龄,他们却一直在外打工。孩子成了留守儿童,跟着爷爷奶奶在老家,一年见父母一两次。视频通话里,孩子越来越沉默,成绩越来越差,老师反映性格也出现了问题。 她做了一个决定:回家照顾孩子。 他继续在外地送快递。从此,这个家庭被一分为二——一边是她独自面对三个问题儿童的混乱和辛苦,一边是他在城市里每天十几个小时的奔波劳累。 本来就没什么感情基础的两个人,在这种分离中,最后那点维系也消磨殆尽了。 最近两年,他给家里的生活费越来越少。后来她才知道,他在外面有了别人,赚的钱不多,都花在了新欢身上。

By 王圆圆