示例:JPEG 2000使用了Cohen-Daubechies-Feauveau 9/7小波...为什么要这么做?
#1 楼
概述简单的答案是,对于给定的
vanishing moments
,它们的最大数量为support
(即滤波器系数的数量)。这就是“极限”属性,通常可以区分Daubechies小波。松散地说,消失的力矩越大意味着压缩效果越好,而支撑力越小则意味着计算量越少。实际上,消失力矩与滤波器大小之间的折衷非常重要,以至于主导了小波的命名方式。例如,您经常会看到称为D4
或D4
的db2
小波。 4
是系数的数量,而2
是消失矩的数量。两者都指同一个数学对象。在下面,我将详细说明什么时刻(以及为什么要让它们消失),但是现在,仅了解它与我们将信号中的大多数信息“折叠”成较小的程度有关。值的数量。有损压缩是通过保留这些值并丢弃其他值来实现的。现在,您可能已经注意到
CDF 9/7
中使用的JPEG 2000
的名称中有两个数字,而不是一个。实际上,它也称为bior 4.4
。这是因为它根本不是“标准”离散小波。实际上,它甚至没有从技术上保留信号中的能量,而这种特性首先就是人们对DWT如此兴奋的全部原因!数字9/7
和4.4
仍分别指的是支撑矩和消失矩,但现在有两组系数定义了小波。技术术语是,它们不是orthogonal
而是biorthogonal
。与其深入探讨数学上的含义,不如首先回顾导致使用非节能双正交小波的因素。 />关于CDF 9/7小波的设计决策的更详细讨论可以在以下论文中找到:Usevitch,Bryan E.现代有损小波图像教程
压缩:JPEG 2000的基础。在这里,我只回顾要点。
正交Daubechies小波经常出现实际上会导致代表信号所需的值数量增加。效果称为
coefficient expansion
。如果我们进行有损压缩可能无关紧要(因为无论如何我们都将最后的值都扔掉了),但是在压缩的上下文中这肯定会适得其反。解决该问题的一种方法是将输入信号视为周期性。仅将输入视为周期性会导致边缘处的不连续性,这些不连续性更难压缩,而只是变换的伪像。例如,考虑以下周期性扩展中从3到0的跳转:$ [0,1,2,3] \ rightarrow [... 0,1,2,3,0,1,2,3,.. 。] $。为了解决该问题,我们可以使用信号的对称周期性扩展,如下所示:$ [0,1,2,3] \ rightarrow [...,0,1,2,3,3,2,1, 0,0,1 ...] $。消除边缘跳变是使用离散余弦变换(DCT)代替JPEG中的DFT的原因之一。用余弦表示信号隐含了输入信号的“从前到后循环”,因此我们希望小波具有相同的对称性。
不幸的是,唯一具有所需特性的正交小波是Haar(或D2) ,db1)小波,仅作为一个消失的时刻。啊。这导致我们产生双正交小波,实际上是多余的表示,因此不保留能量。在实践中使用CDF 9/7小波的原因是因为它们的设计非常接近于节能。他们在实践中也进行了很好的测试。
还有其他方法可以解决各种问题(在本文中已简要提及),但这只是所涉及因素的大笔画。 ,为什么我们要关心他们?平滑信号可以通过多项式很好地近似,即形式为:
$$ a + bx + cx ^ 2 + dx ^ 3 + ... $$
函数(即信号)的矩是与给定x幂有多相似的度量。在数学上,这表示为x的函数和幂之间的内积。消失的力矩意味着内部乘积为零,因此该函数不会“类似于” x的幂,如下所示(对于连续情况):
$$ \ int {x ^ nf (x)dx = 0} $$
现在,每个离散的正交小波都有两个与之关联的FIR滤波器,这些滤波器在DWT中使用。一个是低通(或定标)滤波器$ \ phi $,另一个是高通(或小波)滤波器$ \ psi $。该术语似乎有所不同,但这就是我将在此处使用的术语。在DWT的每个阶段,高通滤波器用于“剥离”一层细节,而低通滤波器会产生没有该细节的平滑信号版本。如果高通滤波器具有消失的力矩,则这些力矩(即低阶多项式特征)将被填充到互补平滑信号中,而不是细节信号中。对于有损压缩,希望细节信号中没有太多信息,因此我们可以将其丢弃。
这是一个使用Haar(D2)小波的简单示例。通常涉及的缩放比例为$ 1 / \ sqrt {2} $,但在此我省略了它来说明概念。这两个过滤器如下:
$$ \ phi = [1,1] \\ \ psi = [1,-1] $$
高通滤波器在第零时刻消失,即$ x ^ 0 = 1 $,因此它有一个消失时刻。要看到这一点,请考虑以下恒定信号:$ [2,2,2,2] $。现在凭直觉,很明显那里没有太多信息(或任何恒定信号)。我们可以通过说“四个二”来描述同一件事。 DWT为我们提供了一种明确描述直觉的方法。这是使用Haar小波在DWT单次通过期间发生的情况:
$$
[2,2,2,2] \ rightarrow _ {\ psi} ^ {\ phi} \ left \ {\ begin {array} {rr}
\ left [2 + 2,2 + 2 \ right] = \ left [4,4 \ right] \\
\ left [2-2 ,2-2 \ right] = \ left [0,0 \ right]
\ end {array} \ right。
$$
第二遍会发生什么,它仅对平滑信号起作用:
$$
[4,4] \ rightarrow _ {\ psi} ^ {\ phi} \ left \ {\ begin {array} {rr }
\ left [4 + 4 \ right] = \ left [8 \ right] \\
\ left [4-4 \ right] = \ left [0 \ right]
\ end {array} \ right。
$$
请注意,对于细节传递,常量信号是完全不可见的(全部变为0)。还要注意如何将$ 2 $的四个值减少为$ 8 $的单个值。现在,如果我们要传输原始信号,我们可以只发送$ 8 $,而Inverse DWT可以通过假设所有细节系数均为零来重建原始信号。具有高阶消失矩的小波可以得到与线,抛物线,三次方等近似的信号相似的结果。细节,以保持上述治疗的可及性。以下论文进行了更深入的分析:
M. Unser和T. Blu,JPEG2000小波滤波器的数学性质,IEEE Trans。图像处理,第一卷12号2003年9月9日,
pg.1080-1090。
脚注
上面的论文似乎暗示JPEG2000小波被称为Daubechies 9/7,它不同于CDF 9/7小波。
我们已经得出了JPEG2000 Daubechies 9/7缩放比例的确切形式
过滤器...这些过滤器是由于与<$相同的多项式的因式分解而产生的Daubechies_ {8} $ [10]。主要区别在于
9/7滤波器是对称的。此外,与Cohen-Daubechies-Feauveau [11]的双正交样条
不同,
多项式的不规则部分已在两侧均分,并且尽可能均匀地
。 >
[11] A. Cohen,I。Daubechies和JC Feauveau,“紧支撑小波的双正交基
”,通讯。纯应用数学卷45,编号
5,第485–560页,1992年。
我浏览的JPEG2000标准草案(pdf链接)也称为官方过滤器道伯奇斯9/7。它引用了本文:
M. Antonini,M。Barlaud,P。Mathieu和I. Daubechies,“使用小波变换的图像编码
”,IEEE Trans。图像处理1,第205-220页,
1992年4月。小波CDF 9/7。似乎两者之间可能有所不同,但是人们还是将其称为JPEG2000小波CDF 9/7(因为它基于相同的基础?)。无论名称如何,Usevitch的论文都描述了标准中使用的一种。
评论
$ \ begingroup $
@datageist很棒的答案!而且,9/7最初存在的另一个原因是因为它是重构多项式的一种替代方法,并具有滤波器对称的约束。这样,相位响应保持线性。 (相比之下,daub4小波虽然是FIR,却是不对称的,并在处理后的信号中感应出非线性相位)。在JPEG中使用9/7是因为主观倾向,让我们喜欢图像中的线性失真与非线性失真。
$ \ endgroup $
–太空
13年2月7日在17:02
$ \ begingroup $
好文章。维基百科文章中的信息与所引用的来源相对应,本质上是Daubechies的“ 10堂讲座”,因此就JPEG2000而言可能已过时。一种更正:双正交不是多余的。双正交性条件强加了逆滤波器组。冗余变换从小框架开始。
$ \ endgroup $
– Lutz Lehmann
2014年2月11日在16:37
#2 楼
信号变换的优劣通过两个不同的指标进行评估:压缩,在有损压缩情况下,质量。压缩由能量压缩定义,但质量较难。传统上,质量是通过均方误差或平均每像素SNR来衡量的。但是,人类并不倾向于使用MSE或SNR评估信号。人类对MSE往往不是的结构噪声非常敏感。开发提供类似于人类的质量指标的算法是一个活跃的研究领域。 Bovik的结构相似性(SSIM)索引是一个不错的起点。
#3 楼
一个简短的答案-任何变换都比其他变换好,这就是所谓的“能量压缩特性”,其解释如下:”如此之大,以至于仅保留几个系数而丢弃或量化其他系数仍然可以使重构接近完美。这种性质与单一变换的解相关能力有关。“ >具有最高能量压缩特性的变换是DCT。
Dipan。
评论
$ \ begingroup $
DCT仅对未知信号类别具有最高的能量压缩。如果可以表征信号域,则可以做得更好。
$ \ endgroup $
– tototwo
2011-10-24 23:25
$ \ begingroup $
我同意@totowtwo。我的观点是,“能量紧凑性”是进行某种转换的原因,也是使其对于编解码器引擎更受欢迎的原因。
$ \ endgroup $
– Dipan Mehta
2011-10-25 3:54
#4 楼
自然图像由不同的图像特征组成,我们可以将其大致分为平滑或缓慢变化的特征,纹理和边缘。一种好的压缩方法是将图像转换成一个域,在该域中,信号的所有能量仅以几个系数保存。傅立叶变换尝试使用正弦和余弦近似图像。现在,正弦和余弦可以相当简洁地逼近平滑信号,但是众所周知,它对于逼近不连续点不利。如果您熟悉吉布斯现象,就会知道需要大量的傅立叶系数,以避免逼近时间上的不连续性。但是,系数的数量越少,压缩效果越好。因此,在系数数量和压缩方法的有损性之间存在固有的权衡,我们通常将其称为速率失真权衡。
当搜索比使用傅立叶变换的jpeg更好的压缩方案时,对于相同的失真,我们需要一种变换,该变换可以用比傅立叶变换更少的系数来近似不连续点。输入可提供更好的逼近效果的小波,从而更好地压缩点奇异点,而不会出现伪像之类的吉布斯现象。图像在实践中绝不会纯粹平滑,因此对于各种图像特征,小波比傅立叶具有更多的通用性。如果我们使用傅立叶和小波比较包含边缘的图像的最佳k项近似,则误差将分别衰减为$ k ^ {-2/3} $和$ k ^ {-1} $。对于相同数量的项,小波的误差衰减更快。这意味着当图像不是非常平滑(缓慢变化)并且包含奇点时,小波具有更好的能量压缩。
但是,我们还没有一个可以近似平滑特征,点奇异点,边缘和纹理的单一基础或变换。
#5 楼
DCT对于许多常见信号具有非常好的能量压缩,并且它也与衍射(成像中的基本物理过程)的工作原理非常吻合,因为衍射可以表示为傅立叶核。这些给它带来了很多好处。这要求创建许多小的变换区域(块),以便在变换时一个区域中的能量不会溢出到另一区域中。这不仅限制了变换压缩能量的能力,而且还在许多块边界引入了伪像。我没有对小波做很多事情,所以我可能会错,但是它们更加局域化,因为不同的系数代表了不同的面积/频率折衷。这允许更大的块大小,更少的伪像。实际上,不确定在实际中有多大差异。
#6 楼
在讨论更好的小波时,我们应该考虑它们的背面具有相同的编码器:变换的性能与量化和编码紧密相关。性能通常是:相同质量的更好压缩,或相同压缩的更好质量。压缩是一种简单的方法,而质量却不是。但是,假设我们有一个。现在,一个小波(带有编码器)在压缩比(例如较低)下可以更好,而在另一个压缩比(例如较高)下则更好。一般而言,只是略微增加一点,但是取决于您压缩的是高($ \乘以124 $)还是低压缩($ \乘以4 $),您可以选择其他小波。
最后,这取决于您要压缩的图像类别:全部目的还是聚焦(例如医学图像)或地震数据压缩(具有受限的特定类型的数据)?同样,小波可能会有所不同。
现在,图像的主要形态成分是什么,小波如何处理它们:
缓慢的趋势不断发展的背景:消失的时刻,消除了小波子带中的多项式,
凸点:可以使用缩放函数,
边缘:被小波的导数所捕获,
纹理:由振荡捕获小波的摆动方面,
其余部分是嘈杂的,未建模的:由正交性(或也接近)管理。
以上功能在全球范围内都很好。在合成方面,最佳小波可减轻压缩效果(例如量化),从而获得令人愉悦的效果。分析/合成所需的属性有些不同,这就是为什么双正交小波好用的原因:您可以分离分析(消失的矩)/合成(平滑度)属性,而正交属性则无法做到这一点,并且会增加滤波器的长度,这对计算性能非常不利。另外,双正交小波可以是对称的,对于边缘也很有用。
最后,您是否需要一些无损压缩?然后,您需要像“整数”一样的小波(或二进制小波)。
上面所有这些都与计算问题混在一起:可分离的小波,不要太长。并在JPEG委员会中进行标准化。
最后,5/3非常适合无损且足够短。 9/7
中的一些也很好。比13/7小波好得多?即使在PSNR中也不是真的,即使不是最好的图像质量。
M. Unser和T. Blu,JPEG2000小波滤波器的数学属性,IEEE Trans。图像处理,第一卷12号2003年9月9日,第1080-1090页。
让我相信9/7的“最佳”方面没有得到充分的解释或保证。
因为使用其他滤波器组(多频带或$ M $频带)可能会获得更多收益。也许不足以证明一种新颖的标准。
评论
据我所知,Daubechies小波提供了平滑的基础,因此高度压缩的图像会“模糊”。例如,Haar小波会产生块状伪影。自从您提到JPEG 2000以来,我想指出,非零小波系数的编码方案也会影响解码图像(EZW,SPIHT等)。您的问题已得到回答。不要犹豫,为有用的投票并接受最合适的