逼真的渲染的目的是渲染图像,就像真实的相机会捕获它一样。尽管这已经是一个雄心勃勃的目标,但在某些情况下,您可能需要更进一步:以人眼可以捕捉到的图像甚至人类可以感知到的方式渲染图像。您可以称其为视觉现实或感知现实渲染,但如果有人能提出一个更吸引人的术语(或告诉我已经存在一个术语),我将不胜感激。

这里有一些例子阐明我的观点。用低照度的相机拍摄照片时,镜头要么质量不错,要么图像噪点很多。对于人类观察者来说,暗视会产生作用并产生浦肯野效应(颜色会变成蓝色)。这种效果取决于HDR亮度信息,当我在LDR显示器上显示图像时,这些信息会丢失。另外,人脑可能会使用深度信息来“过滤”感知到的图像-在最终(非立体)渲染中丢失的信息。

组装详尽的清单可能是一个难以实现的目标。您能否建议我需要考虑的对眼睛和大脑的某些影响?

评论

我曾经听说我们的噪音确实与相机相同,因为噪音实际上是物理上的,而不仅仅是电子上的。 (也就是说,毕竟没有那么多的光子)。但是我认为,大脑会使用暂时的抗锯齿功能将其擦除。 (即我们在夜间看到很多运动模糊)。

我不太明白。如果在弱光下渲染图像并模拟Purkinje效果,那么它看起来就不会逼真,因为人眼会添加自己的效果,不是吗?

@YvesDaoust由于图像是在未知光照条件下显示在LDR监视器上的,因此可能不会。简而言之,您在屏幕上看到的图像会更亮,因此更容易感知。如果我们使用的是HDR监视器,并且可以准确地再现夜间场景的亮度值(并且还有一个黑暗的房间),那么您是对的。

您所追求的目标没有错,但是我担心这似乎有点太广泛了,因为我们需要考虑的影响是如此之多。我不能用SE格式编写此文件,因为这确实是错误的。但是,如果您将范围调整为“可以建议一些我需要考虑的影响”,则比开始更容易。

@joojaa,我按照您的建议更改了问题,谢谢。

#1 楼


您可能想进一步介绍它:以人眼可以捕捉到的图像或人类可以感知到的图像来呈现图像。


有两种解释方法这个。我都会做的。


解释1:渲染看起来在视觉上逼真的图像。

最后,您的图像仍然需要显示在某处。关键是:您要以这样的方式渲染图像,即在特定显示设备上*显示*该图像时,它会产生与原始辐射图像相同的感觉。

这是解开这个想法的方法。

在现实世界中,辐射光谱(即光的真实分布)进入您的眼睛并刺激大约1个四个光感受器。受体的刺激产生与图像相关的色彩感觉。

在渲染中,我们对生成的光谱没有任意控制。幸运的是,由于我们(通常)只有三个视锥,每个视锥仅产生一个标量值,因此可以通过恰好使用三个基色来再现色彩视觉。最重要的是,您仅使用三个波长的线性组合即可产生任何颜色感(最多可能需要使用几种负色,在这种情况下,您可以使用不同的原色)。

您没有其他选择。几乎所有的彩色显示设备都使用sRGB标准,该标准提供了三个基色(实际上通常没有单个波长)。很好,因为事实证明所有内容都是抽象的,您无需理会。

要弄清可以感知到准确渲染的混乱情况,请使用以下算法:


使用正确的辐射度计算来渲染图像。您可以跟踪单个波长的光或波长段。随你。最后,您将获得一张图像,该图像代表了在每个点处接收到的光谱。
在每个像素处,获取渲染的光谱,并将其转换为CIE XYZ颜色空间。可以将光谱乘积与标准观察者功能集成在一起(请参阅CIE XYZ定义)。
这将产生三个标量值,即CIE XYZ颜色。

使用矩阵转换将其转换为线性RGB,然后从那里使用线性/功率转换将线性RGB转换为sRGB。
从浮点转换为uint8并保存,将值限制在范围之外(您的显示器无法
将uint8像素发送到帧缓冲区。
显示屏采用sRGB颜色,进行逆变换以生成三个特定强度的基色。每个缩放它负责的任何像素的输出。像素点亮,产生光谱。该光谱(希望)是您绘制的原始光谱的一个同分异构体。
您可以像感知到的光谱那样感知光谱。


解释2:尝试模拟人眼可能出于可视化目的或补偿LDR显示而收到的最终数据。

我认为这没有什么用。本质上讲,您正在尝试制作一种图像,以调整大脑为娱乐/获利而感知的方式。

例如,今年SIGGRAPH上有一篇论文,他们模拟了残像和色彩还原,使图像在感觉上看起来有所不同。当然,他们这样做的唯一原因是因为我们使用的显示器都是低动态范围(LDR)。关键是要模拟某人在实际的高动态范围(HDR)显示中作为实际图像数据可能看到的效果。

在实践中,结果证明效果不佳。例如,对于残像,我们看到残像是因为非常明亮的刺激耗尽了色细胞。如果您改为尝试使用伪造的残像来刺激效果,则看起来可能有点相似-但由于它是一种完全不同的机制,因此说服性不是很高。

实际上,这种图形在文学,如果你想尝试一下。所提到的论文或多或少是我们拥有的最先进方法的示例。我认为,尽管如此,目前的共识是,(至少在此时)不值得尝试进行仿真,因为充其量,您最多只能通过替代不同的视觉效果来逼近真实的视觉效果,但这并不是真的


1Rod + 3 *锥体,通常情况。大概是因为人类可能只有零种功能性光感受器,最多推测为7种(有史以来观察到的最高数量是5种)。

评论


$ \ begingroup $
感谢您的回答。我认为这是不完整的。解释1中的陈述“您感觉到的频谱就像您看到的频谱一样”,这可以说是错误的。感知真实频谱时,使用您描述的转换不会产生效果(例如,您必须在光线不足的情况下使用暗视标准观察者,如Jameson在《 Hurvich:Visual Psychophysics》中所述)。您所描述的是光谱渲染的想法。解释2是我想了解的更多信息。谢谢,本文将是一个好的开始。
$ \ endgroup $
– David Kuri
2015年10月5日在8:30

#2 楼

关于感知,还存在一个问题,即我们几乎看不到的东西(就属性或人工制品而言),以及我们对感知所强加的东西。

例如声音,您对比度或频率使您对其他内容的了解减少或不了解(旧的SIGGRAPH论文说明了纹理如何掩盖网格分辨率),以及所有时间方面的问题(Google表示“改变盲目性”)。同样,根据值和相对值,可能会或可能不会看到表面,法线和BRDF的细节。

此外,由于我们的感知系统倾向于局部和全局适应,对于低频值,重要的是在正确的位置具有最大值和最小值,但是它们的确切值不会真正被注意到。

有时可能会有认知,就像您在云层和树木中允许很多错误,但在其中肯定会少一些人脸。 (有时您可能会将其降级为给定类别的参数统计信息。)

这就是为什么我更喜欢使用“合理”一词而不是“真实感”这个词的原因。
相反,我们对虚假像素或闪烁像素等伪影非常敏感,对相关性(例如仅1个灰度级的误差前沿,不想要的图案(例如莫尔条纹,混叠或不良随机性)等相关性非常敏感。)

顺便说一句,这是一种以感知为基础的基于优化的解决方案以简单的能量来汇总所有内容的想法的不好原因之一,因为在所有自相矛盾的情况下,这都可能导致线或点的误差集中。出于同样的原因,早期的全球照明人员真的感到失望的是,与反走样的近似阴影相比,能量精确解没有被接受(然后从基于四叉树的方法变为基于网格的自适应方法)。

A (相当普遍)有关图形感知的概述可以在SigAsia的“图形,可视化,虚拟环境和动画的感知” 11课程中找到