我们何时决定以8美元/ kHz的价格对电话进行采样?一直都是这样吗?我们为什么要这样做?是因为无法快速传输更高的比特率吗?这些原因仍然有意义吗?如果没有,为什么还没有新标准?确实,$ 8 $ kHz是传输可理解语音的最低可能采样率吗?

我正在尝试寻找相关资源,但似乎没有太多信息。

评论

并非总是如此,因为电话线以前是完全模拟的。

实际上,对于同一交换机内的本地呼叫,它们可能仍完全是模拟的。但是我不知道但是即使它们是模拟的,也存在带宽限制,“语音质量”是足够的标准。

只是为了避免混淆,而且波特率和比特率并不相同..波特是“单位密度的比特”。波特是信令速率,比特是信息速率。因此,如果您的BAUD速率为1200波特,并且每个时钟周期传递4位,则您每秒运行4800位..我们有DSP调制解调器能够通过模拟电话线传递150Kb / s的速率,但是调制技术非常复杂并使用了从256到512音频的任何音调来将数据沿管道向下移动..并均衡线路并消除延迟..我确实记得看到一些调制解调器带有

啊,发现了……美国机器人公司制造了2400 BAUD调制解调器,称为Sportster HST v92。它是2400波特,但每秒通过21,600位。因此在90年代中期,市场上有2400个BAUD调制解调器。

#1 楼

如果有人愿意挖掘,我想他们会发现,在贝尔电话公司开始复用语音线路之前,他们已经对人类语音的频率内容进行了大量研究。他们最初使用测试小组来开发bel音频单元和声音的功率分配以及人耳对各种频率的敏感性。他们开发了一个带通特性,其峰值约为2.1 KHz,并在300 HZ和300 HZ以下滚降。正确完成操作后,可以发出良好的人声。一切都是模拟的。
AM收音机将其扩展到5 KHz,包括了我们年轻,耳朵好听时大多数人都能接受的音乐。电视反激式变压器的设计运行频率约为17.5 KHz,这是因为有一个神奇的数字可以再现图像,而且大多数人听不到the的声音。单边带无线电在1960年代商业化,需要非常尖锐的截止频率。我使用了带有2.1和3.1 KHz滤波器的收音机。 2.1具有唐老鸭的一些特征。 3.1听起来还不错,再次是年轻的耳朵。 FM可使音频带通提高到20 KHZ或更高,因为更高的载波频率可以处理更高的带宽,以实现更好的音乐再现。堆叠一些木琴,铃铛或其他高音乐器,它们可以将足够的谐波能量转化为较高的频率。 OTOH就像州一样,大多数人听不到。

最重要的是,任何声称需要20 KHz语音带宽的人都不会引起注意。 3 KHz可以做到,5可以给您一些余量。如果听起来不正确,则可能是带宽以外的问题。

当开发数字信号时,知道的人知道,无论波形看起来多么怪异,它都可以分解为一组正弦波。这些波的谐波混合产生了声音或音乐的典型尖峰模式。最后,奈奎斯特进行了有关在给定频率下再现正弦波所需的数字采样率的研究。事实证明,制作一个正弦波需要2个采样,因此要再现的最高频率是采样率的一半。您需要5 KHz的音频,然后以10 KHz采样。声音不错。您想要更高保真度的音乐,而不是大多数人都能听到的,然后以40 KHz左右采样以获得20+ KHz。

还有一个花絮是采样率和比特率。如果您以给定的频率采样,然后将其乘以字长,则将获得产生所需信号所需的最小比特率。降低比特率,在给定的采样率下,采样字的大小将被削减以满足新的比特率。这就是所有“无损”编码。这些都是从内存中尝试寻找当前数据的。如果有人寻找引用就在那儿。我不会因为老了而烦恼。当我对进行音频捕获感兴趣时,我只是厌倦了在许多显而易见的神话问题中涉猎。

#2 楼

人们认为可以在质量和带宽之间取得良好的平衡。实际上,单个语音信号占用的带宽为8 kHz,而不是8 kbps。每个样本被量化为8位,产生64 kbps的速率,被普遍使用。

进一步阅读:


http://en.wikipedia.org/wiki/Digital_Signal_0
http://en.wikipedia.org/ Wiki / G.711


评论


$ \ begingroup $
以8 khz采样语音信号时,假定其带宽小于4 khz,而不是8 khz。而且,只要需要效率,DPCM和ADPCM技术就可以将所得的原始PCM 64 kbps比特率降低到32kbps或16 kbps。
$ \ endgroup $
– Fat32
15年3月18日在12:44

$ \ begingroup $
是的。不仅如此,它还可以通过低通滤波来保证小于4 kHz的频率。否则会发生混叠。
$ \ endgroup $
–埃姆雷
15年3月18日在17:58



$ \ begingroup $
然后我想您应该查看答案,说“实际上,单个语音信号占用的带宽为8 kHz,而不是8 kbps”。语音信号可以占据20-20 khz的整个频谱,但只有第一个4 khz被占用。
$ \ endgroup $
– Fat32
15年3月19日在14:40

$ \ begingroup $
我想你的意思是说人耳可以辨别该范围内的频率?那是另一个问题。
$ \ endgroup $
–埃姆雷
15年3月19日在17:01



#3 楼

另一个原因是,在数字信号传输之前,电话音频曾经被模拟调制成一个窄带通道,以便可以通过单个模拟链路(RF和微波塔式继电器等)发送多个电话呼叫。首先要进行低通滤波,以缩小每个通道所需的带宽,以便将最多数量的通道压缩到一条模拟管道中(但即使如此,在糟糕的一天,人们仍可能听到一些相邻电话的声音作为背景噪声)。由于人们已经习惯了频率低于3.5 kHz左右的长途电话,因此该带宽甚至对于本地电话来说在商业上也是可以接受的。 kHz可能不是语音可理解的最小值。

#4 楼

为了消除许多误解。首先,从来没有一个56k的“波特”调制解调器。波特是关于状态变化的,最大波特率为1200波特。第二,人类的听觉不仅可以感知基本音调,还可以感知远远超出基本音调的许多谐波含量。去除谐波成分后,音频听起来自然而愉悦。高于(8Khz)分辨率的音频更清晰易听,让耳朵更悦耳。

第三,奈奎斯特在固定时域内工作。如果您在峰或谷的确切时刻开始采样,则只需要采样率两倍于频率即可。但是,在现实世界中,您的采样点可能会在时间上相对于峰值或谷值发生任何随机偏移,因此需要更高的采样率。例如,如果您对正弦波进行采样,并且采样力矩恰好与波的开始偏移90度,则数据将显示一条直线而不是一条波。对于基本音色,这是至关重要的。对于谐波含量,这是一个很好的选择,在可听范围的高端附近,回声逐渐减小。奈奎斯特应用于音频处理是目前最难以解释的定理之一。

评论


$ \ begingroup $
对于没有调制解调器高于1200波特的主张,您有参考吗?我认为该说法不正确。同样,就其价值而言,关于采样的段落是错误的。当采样正弦波时,任何采样率都大于正弦频率的两倍就足够了,而与相位无关。
$ \ endgroup $
– MBaz
18年11月17日在23:30

#5 楼

就像其他人所说的那样,4kHz是标准的,因为它很自然地是人声的来源source1 source2。我确实找到了一篇提到基频低于85Hz-300Hz的文章。我是否可以肯定地说,这在实践中是否有效。但值得一试

#6 楼

模拟电话系统具有一个3.9 KHz的砖墙滤波器。这传递了所有必要的信息以使语音清晰,并允许带宽打包。许多人在思考必要的带宽时被洗脑了。 20-20,000 Hz的带宽非常适合音乐播放,但是完全没有必要再现人的语音。

请问Nyquist我们如何通过带有3.9 KHz砖墙滤波器的模拟线路发送56 KBaud传真信号。有人记得传真机吗?

钢琴上的最高音符是4186 Hz。人类声音的频率范围小于1000 Hz。钢琴的中音C约为262 Hz,只是为了对事物有所了解。