我熟悉加性(RGB),次色(CMYK)和类似HSV的色彩空间,但是我目前正在尝试理解的文章在YCbCr色彩空间上进行图像分割/对象定义。

我一整个上午都在寻找可以自然解释YCbCr的东西,但是我不明白。这些人对这些色彩空间背后的一般概念有很好的直观解释,并解释了这些人如何将其用于图像编码/压缩(全部在photo.SE上)。

公式从Wikipedia上可以很容易地从RGB计算YCbCr。

我得到了这种表示的动机,我知道Y分量包含有关图像的最重要的(对于人眼而言)灰度信息。 br />
我知道Cb和Cr带有关于颜色的信息,并且(由于人眼的敏感性)它们可以被压缩而没有可见的质量损失。但是,每个色度分量实际上代表什么?

正如文章作者提到的那样,“色度信息在对象定义中至关重要”,我无法完全理解我的意思。读着我目前的“ Y是强度,Cb和Cr以某种方式携带颜色信息”的理解程度YCbCr。

我正在寻找一条答案,即“ Cb是...,而Cr是...”或“如果您想通过XY进行查看,您实际上是在查看Cb组件...”,或通过其他方式可以帮助我分别理解每个组件所携带的信息,而不仅仅是它们一起携带颜色信息。

编辑

让我给出一些示例,直观地解释我要寻找的其他类型的颜色空间:

RGB:就像在黑色的墙壁上照耀着彩色的手电筒:如果用蓝色的手电筒照亮,则会看到蓝色的反射。如果添加红色手电筒,它将显示洋红色反射,是蓝色和红色的混合。

CMYK:就像混合水彩画一样,您“添加了表面反射的颜色”,(即HSV:小孩会被高度饱和的物体所吸引,因此,如果您将黄色和青色的颜色混合在一起,则会反射绿色,从而得到绿色。

HSV:小孩被高饱和度的物体所吸引,不亮(值)。色相成分是“赋予颜色”的成分,而低饱和度意味着颜色被白色“稀释”。值的变化会使整个事物变亮或变暗。

使用此定义,我能够直观地了解每个颜色空间中颜色表示的含义,而不必记住每个颜色空间的图表他们。

#1 楼

YUV(或YCbCr)类似于HSV,但坐标不同。 (YUV和YCbCr之间的差异很小,主要与精确的公式有关。)

$ V $组件相同。可将$(S,H)$视为极坐标,将$(U,V)$视为笛卡尔。 $ H $是角度,$ S $是半径。粗略的转换为:

$ U = S \ cdot \ cos(H)$

$ V = S \ cdot \ sin(H)$

您可以查看此链接以获取更多信息。

要添加到您的直觉列表中的另一件事:

饱和度是从光谱角度看颜色的纯度。例如,激光的光谱非常窄,这意味着饱和度很高。

评论


$ \ begingroup $
为了完整起见,您能补充说明YUV和YCbCr之间的区别吗?
$ \ endgroup $
–佩内洛普
2012年10月31日,0:03

$ \ begingroup $
@Andrey Rubshtein,如果激光具有很高的饱和度,反过来是真的吗?换句话说,如果我测量RGB并将其转换为HSV,那么高饱和度是否暗示它必须源自相干激光源?谢谢。
$ \ endgroup $
–坦白
16年2月14日在9:38

$ \ begingroup $
@弗兰克,不一定是激光。但是很难有一个宽光谱的饱和色,因为它越宽,就越难在一种成分中产生高响应。
$ \ endgroup $
–安德烈(Andrey Rubshtein)
16-2-14在11:19

$ \ begingroup $
@Andrey Rubshtein,谢谢您的回答。饱和强度的mks单位是每单位时间每单位面积的能量。 。饱和能量通量的mks单位是每单位面积的能量。固态激光脉冲较长的地方,为10到50 ns(纳秒)。光谱很窄的高饱和度是否暗示它必须来自相干激光源?
$ \ endgroup $
–坦白
16-2-14在23:54

$ \ begingroup $
@Andrey Rubshein。您是完全正确的。我刚刚发现LED发出的光几乎都是单色的,低压钠灯也是如此。是否存在相干激光指示器的独特特征,可用来区分激光指示器光束与通过波音737航空公司驾驶舱窗口观察到的整体图像不同?
$ \ endgroup $
–坦白
16年2月15日在7:44

#2 楼

不确定“实际”是什么意思,因为RGB和YUV都不代表光子频率或典型的人眼杆/锥响应。但是您可以通过合成一些YCrCb色块来查看它们的外观,例如(1,1,0),(1,-1,0),(1,0,1),(1,0,- 1)等。

这是一个包含图表的Wikipedia页面:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

已添加:RGB等几乎是经过设计(或发展)的,以匹配人类可能对感知的直观理解(并且颜色名称被证明是文化习得的)。 YUV是相反的,其设计使得UV区域中的噪声(添加到嘈杂的NTSC子带中)很难看到,因此很难描述。 YCrCb是相同颜色映射的变体。因此,不要寻找可能不存在的现有“直觉”见解。也许可以通过“学习”图表并建立一些全新的神经连接来创建自己的神经连接,而这些连接可能在您的大脑中尚不存在(或类似的东西)。

评论


$ \ begingroup $
我添加了我想为YCbCr获得的其他颜色空间的示例。希望这使我正在寻求的解释类型更加清楚。
$ \ endgroup $
–佩内洛普
2012年10月30日19:50

#3 楼

当您了解HSV / HSB时,应该不难理解YCbCr。 HSB中的B通道对应于色度(色度=饱和度http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/)。您可以拍摄RGB图像并将其转换为灰度,也可以将RGB的每个通道转换为灰度并将它们合并为一个通道。为简单起见,我们将像素设为100%红色,100%绿色和70%蓝色。您将计算平均值...(100 + 100 + 70)/ 3,您将获得90%的值,这意味着90%的亮度。因此,在灰度级中,它是非常浅的灰色。现在,如果要向灰度通道表达原始颜色,则每种颜色(红色,绿色,蓝色)需要3个公式。您将计算出值R与灰度,G与灰度以及B与灰度之差。这将需要4个通道(RGB +色度)。但是我们可以用3个通道来做同样的事情。我们可以对绿色通道进行小的校正。让我们计算与绿色通道的差异。原始绿色为100%,绿色转换为灰色的新值为90%。差异为-10%。因此,让我们通过此差异来更改此像素的R和B通道。我们只是进行了伽玛校正或所有通道。绿色通道值将与灰度图像的值相同。因此,我们不再使用绿色通道进行计算。 Y ...色度通道中的绿色已“编码”。其余的颜色(R,B)也被调整。 R` =原始值的90%或Y的100%,因为在此示例中R和B相等。 B化合物相对于原始化合物具有+ 20%的差异,但是在通过伽马校正对其进行更改后,其相对于Y具有+ 30%的差异。为简化起见,它类似于公式,您需要为所有三种化合物进行加法。红色和蓝色的区别是Cb和Cr。这些字符只是说您比较了蓝色通道和色度通道,红色通道和色度通道。因此是Cb和Cr。