人们的耳朵可以听到频率范围为20 Hz至20 kHz的声音。根据Nyquist定理,记录速率应至少为40 kHz。是选择44.1 kHz的原因吗?

评论

选择它是为了与视频帧速率兼容。参见en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F

高于12-15k的频率几乎没有任何价值。超过40岁的大多数人几乎没有用处。

#1 楼

诚然,像任何约定一样,选择44.1 kHz确实是历史性的意外。还有其他一些历史原因。
当然,如果您想要带宽为20 kHz的高质量音频,则采样率必须超过40 kHz。

使其达到48.0 kHz(在北美电视中,它与24帧/秒的影片和表面上的30帧/秒的效果非常吻合),但是鉴于120 mm的物理尺寸,CD可以容纳多少数据存在限制,并且由于需要一个错误检测和纠正方案,并且需要一些数据冗余,因此CD可以存储的逻辑数据量(约700 MB)约为物理数据量的一半。考虑到所有这些,以48 kHz的速率,我们被告知它无法容纳贝多芬的所有9号,但可以将整个9号以稍慢的速率保存在一张碟片上。这样48 kHz就出来了。

为什么还是44.1而不是44.0或45.0 kHz或某个不错的整数呢?

我对记录如何到达的理解是NTSC TV的水平扫描速率是15.750 kHz,而44.1 kHz正好是它的2.8倍。我并不完全确定,但是我相信这意味着您可以在每条水平线上有3个立体声采样对,对于每5行,通常会有15个采样,有14个采样,另外还有一些采样F1中的奇偶校验或冗余。 5条线的14个样本与每条水平线2.8个样本相同,每秒15,750条线,即每秒44,100个样本。

现在,自从引入彩色电视以来,他们不得不将水平线速稍微降低到每秒15734线。该调整导致Sony F1每秒可进行44,056个采样。

#2 楼

例如,请参阅http://www1.cs.columbia.edu/~hgs/audio/44.1.html。由于使用了抗混叠滤波器,因此应使用大于40 kHz的采样率。您应该保留一些频率,以防止由于滤波器的响应斜率导致信号失真。 Sony公司在1979年讨论音频记录标准时提出了44.1 kHz的实际值。他们当时广泛使用此速率。

所以这通常是历史原因。

#3 楼

在向数字格式过渡时,音频以伪视频波形存储,可以看作是黑色或白色(表示二进制格式)。

电视标准使用的场频和结构对于60 Hz视频,如下所示:每场245行(不包括前35条空白行)。每行有三个样本,使得60 x 245 x 3 = 44100 = 44.1 kHz。用于CD复制的母带是基于视频的)。 228

评论


$ \ begingroup $
如果那是F1所做的,我必须说“我站得住脚”。我认为F1使用的是空行。
$ \ endgroup $
–罗伯特·布里斯托-约翰逊
15年8月17日在21:30

$ \ begingroup $
嗨,我刚刚在这里读到“ System M电视信号使用NTSC彩色编码,它包含每秒30 / 1.001(约29.97)隔行扫描的视频帧。每个帧由两个场组成,每条扫描线由262.5条扫描线组成,总共525条扫描线。483条扫描线组成可见栅格。其余部分(垂直消隐间隔)允许垂直同步和回扫。” $$ $$,因此即使是490行也使用了某些(原始NTSC)空白行。
$ \ endgroup $
–罗伯特·布里斯托-约翰逊
18年5月28日在22:21

#4 楼

如果从“动态”时间分辨率的角度来看,而不是典型的静态正弦波,似乎人类的听力极限可能会远远高于20kHz。
关于重建滤波的20kHz至22kHz之间的余量也很有趣。实际上,彼得·克雷文(Peter Craven)进行了一些有趣的工作,涉及时域优化滤波,该技术要求至少96kHz的高保真播放效果。

Pawel

评论


$ \ begingroup $
,有一种找出答案的方法。这称为盲A-B测试。不需要是双盲的(但通常是)。我认为A-B测试优于ABX测试。
$ \ endgroup $
–罗伯特·布里斯托-约翰逊
17年1月19日在7:50

#5 楼

https://zh.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F
奈奎斯特-香农采样定理说,采样频率必须大于一个人希望复制的最大频率的两倍。由于人类的听觉范围大约为20 Hz至20,000 Hz,因此采样率必须大于40 kHz。

此外,在采样之前必须对信号进行低通滤波,以避免混叠。理想的低通滤波器可以完美地通过低于20 kHz的频率(不衰减它们)并完美地截止20 kHz以上的频率,但是从理论上讲,这种理想的滤波器是不可能的(这是无因果的),因此在实践中,过渡带是必要的,频率部分衰减的地方。该过渡带越宽,制造抗混叠滤波器就越容易和经济。 44.1 kHz采样频率允许2.05 kHz过渡带。

此外,前四个质数(2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2),因此具有许多有用的小因素。

评论


$ \ begingroup $
因此,如果我们将单位时间从秒更改为“农场”(即1.001秒),那么这对44100及其许多有用的小因素有什么作用?
$ \ endgroup $
–罗伯特·布里斯托-约翰逊
17年8月24日在5:23



#6 楼

请看[http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone以获取描述
。在不损失质量的前提下,您需要以2倍的频率采样。人类的听力极限约为20kHz,因此需要约40Khz的采样率。这就是为什么CD以44Khz采样的原因。即CD中的每一秒记录包含44,000次记录中包含的最高可能频率的测量。

评论


$ \ begingroup $
嗯,不是真的因为这个...
$ \ endgroup $
–jojek♦
14年8月13日在9:46

$ \ begingroup $
部分原因是因为。对于人来说,听到高于20k的声音很少见,因此发烧友的范围在40kHz以上是合理的一点,即42、43、44。如果以22k冲击正弦波的人,只有小孩有机会听到。蝙蝠的频率是115kHz,有些海豚的频率是150kHz,除了在水中,这听起来更清晰。通过录音在线测试您的高频感知...即在此处audiocheck.net/audiotests_frequencycheckhigh.php
$ \ endgroup $
– Aliative
16-3-23在4:22