我在刘次新的小说《三体问题》中遇到了这段话:
摆了两幅画:一张是清明节期间著名的宋代画《沿江》,细节丰富,细节丰富;另一张是晴天的天空照片,深蓝色的广only处只有一团云雾打破了...
照片的信息内容-熵-比画作高一到两个数量级
代表图片:
这是真的吗?如何解释这种违反直觉的现象?
#1 楼
这取决于您如何定义术语“信息”或“熵”。图像熵的常规定义是将图像视为像素和像素的二维矩阵。 $ H =-\ sum_k p_k \ log_2(p_k),$$
其中$ p_k $是概率,它是根据直方图计算的,与灰度级$ k $相关。
此如果我们忽略像素之间的相关性,则这种熵是正确的。例如,根据此定义,两个图像具有相同的熵。
如果考虑像素之间的相关性,则不是真的。例如,如果左上角的颜色第一个像素的概率为$ p_k $,则下一个像素肯定具有相同的颜色,而其颜色的概率为$ p_k $。
我们人类,以您为例,使用这种相关性来感知图像。这种相关性称为“细节”,因此,我们/您希望富细节图像比简单图像具有更多的信息/熵。这就是为什么您发现它违反直觉的原因。
PS:
我试图计算已发布的两个图像的熵,但是它们没有什么不同”一到两个数量级” !!!!
“清明节沿江”熵约为7
“天空”熵约为6熵
它们不能是相同的文件教授的。
评论
$ \ begingroup $
谢谢,我认为这是我一直在寻找的答案。当然,我上传的图像仅供参考,我不知道虚构的教授实际上向班级展示了什么:D
$ \ endgroup $
– RSS
17年6月9日在20:06
#2 楼
首先,它不是绘画本身,而是它的照片(或扫描图),我们可以将其与其他事物(例如自然场景)的照片(或扫描图)进行比较。基于在您提供的图像上,与简单的天空相比,从感知上讲,绘画当然应该包含更多的信息。结果是,在压缩后,在相同的压缩算法下,绘画文件将比天空文件大。
但是,简单的天空场景可能包含感知不可见的组件,例如量化伪像,颜色渐变或类似的东西,即使您无法感知它们的存在,数学算法仍将其视为统计信息,从而增加了图像的熵界。结果导致文件更大。
绘画文件当然也可能发生同样的情况。
评论
$ \ begingroup $
您提出了一个很好的区分,即教授是否将照片与实际绘画进行了比较(我们称其为较弱的假设),甚至对绘画进行扫描时所包含的信息也较少(假设更强)。因此,按照您的解释,只有较弱的假设是正确的?
$ \ endgroup $
– RSS
2015年6月9日19:39
$ \ begingroup $
我用术语照片和扫描来表示$ N $位的数字化序列$ f [n1,n2] $,它表示图像信息以及由于数字化处理而引起的某些失真。事实是,从感知上讲,绘画包含更多信息。但是,熵的数学概念从根本上说是一种基于概率的信息统计度量。因此,除非被诸如jpeg变体之类的感知编解码器的量化器丢弃,否则不可见的像素变化仍将被视为信息并进行编码。
$ \ endgroup $
– Fat32
17年6月9日19:50
评论
书中还有更多内容吗?@endolith不,很遗憾,不是。
我希望熵是衡量内容的唯一方法。但不是。创建RGB图像供人类查看,包括绘画和照片。因此,请自己看看。您认为哪一个更有用和更丰富?无论我们采用哪种计算机措施,您的选择都是正确的。
@TolgaBirdal足够公平,但是我仍然想了解为什么计算机在这种情况下会出错。
伟大的科幻小说