高亮反光终结者?谷歌NeRF-Casting:光线追踪就能搞定!
来源:51CTO.COM
时间:2024-05-28 11:30:11 434浏览 收藏
怎么入门科技周边编程?需要学习哪些知识点?这是新手们刚接触编程时常见的问题;下面golang学习网就来给大家整理分享一些知识点,希望能够给初学者一些帮助。本篇文章就来介绍《高亮反光终结者?谷歌NeRF-Casting:光线追踪就能搞定!》,涉及到,有需要的可以收藏一下
NeRF不再“畏惧”近处高光反射
早期的NeRF变体使用多层感知器(MLPs)从三维坐标映射到体积密度和视点相关的颜色,但是表示详细的三维几何和颜色所需的大型MLPs训练和评估速度极慢。最近的工作专注于通过用类似体素网格的数据结构或网格和小型MLPs的组合替代大型MLPs,使NeRF更加高效。虽然可以扩展到表示详细的大规模场景,但其优势仅限于三维几何和主要的漫反射颜色。
扩展NeRF建模现实的视点相关外观的能力仍然是一个挑战。当前先进的用于闪亮物体视图合成的模型在两个方面存在限制:
- 只能合成远处环境光照的准确反射,而在渲染近处场景内容的逼真反射方面表现不佳。
- 依赖大型MLPs来表示任何点的视点相关出射辐射,难以扩展到具有详细反射的更大现实场景。
NeRF-Casting是一种通过将光线追踪引入NeRF渲染模型来解决这些问题的方法。其主要涉及3个领域:
- 反射建模:传统的反射建模方法使用物理定律和基于图像的技术来表示表面反射特性。近年来,神经网络被用于学习反射特性,特别是在复杂材料和光照条件下。
- 光线追踪:光线追踪是一种广泛使用的计算机图形技术,通过模拟光线与物体表面的交互来生成逼真的图像。光线追踪技术已被用于生成高质量的反射和折射效果,但计算复杂度高。
- 三维成像:三维成像技术涉及从多视图数据生成三维表示。NeRF和其他神经网络方法通过学习场景的三维几何和颜色分布,生成新视图,从而在三维成像领域取得了重大进展。
NeRF-Casting不是在每个相机射线的点上查询昂贵的MLP以获取视点相关的外观,而是从这些点投射反射线到NeRF几何中,采样正确抗锯齿的反射场景内内容特征,并使用一个小型MLP将这些特征解码为反射颜色。将光线投射到恢复的NeRF中自然地合成近处和远处内部内容的一致反射。通过光线追踪计算外观减少了在场景中的每个点用大型MLP表示高度详细的视点相关函数的负担。
感兴趣的朋友可以看视频效果:https://nerf-casting.github.io
模型细节
NeRF-Casting的三个主要目标:
- 希望在不依赖计算量大的MLP评估的情况下建模出准确、详细的反射。
- 希望仅投射少量的反射光线。
- 希望最小化在这些反射光线的每个点上查询我们表示所需的计算量。
基于Zip-NeRF[2]:利用多尺度哈希网格来存储三维特征,一个小型MLP(1层,宽度64)将这些特征解码为密度,一个较大的MLP(3层,宽度256)将这些特征解码为颜色。这意味着沿光线查询样本的密度和特征相对便宜。考虑到这些约束,按照以下流程来渲染镜面外观:
- 沿每条相机光线查询体积密度,以计算光线的预期终止点和表面法线。
- 在反射方向上通过预期终止点投射一个反射锥。
- 使用一个小型MLP将累积的反射特征与其他采样量(例如漫反射颜色特征和每个样本的混合权重)结合起来,为沿光线的每个样本生成一个颜色值。
- 将这些样本和密度进行阿尔法合成,得到最终颜色。
反射锥追踪
然后通过反射初始光线关于表面法线来构建一个新的反射光线方向
圆锥形反射特征
现在已经定义了一个vMF分布,涵盖了反射射线,目标是估计在vMF分布上的预期体积渲染特征,然后将其解码为反射颜色。这个预期特征可以写成:
使用蒙特卡洛方法对随机采样的射线进行积分估计是非常昂贵的,因为每个样本都需要沿着射线进行体积渲染。受Zip-NeRF的启发,使用一小组代表性样本结合特征减权来近似这个积分。然而与Zip-NeRF不同的是,我们将这两个操作都在二维方向域中执行,而不是在三维欧几里得空间中。
方向采样
反射特征降权
上文描述的方向采样有助于选择一个小的代表性射线集合进行平均。然而,对于具有高粗糙度的表面,采样的射线可能相对于底层的3D网格单元格之间距离较远。这意味着方程9中的特征可能存在伪影,并且反射射线方向的微小变化可能导致外观上的大幅变化。
为了防止这种情况发生,将Zip-NeRF中的“特征降权”技术调整到方向设置中。通过将与vMF锥相比较小的体素对应的特征乘以一个小的乘数来实现这一点,减小它们对渲染颜色的影响。按照Zip-NeRF的做法,定义点 x 处的降权特征为:
颜色解码器
颜色解码器的作用是为沿射线的每个采样点分配一种颜色,使用两种颜色分量的凸组合:
第一个颜色分量Cv类似于典型的 NeRF 视角相关外观模型:
第二个分量Cr,旨在模拟光泽外观,计算如下:
几何表示和正则化
效果欣赏
总结一下
NeRF-Casting是一种使用神经辐射场(NeRF)渲染包含高光物体的场景的方法。
方法:将反射锥从场景中的表面反射并通过NeRF进行追踪,并结合了一套新颖的技术来抗锯齿这些反射,从而能够合成远处和近场内容的准确详细反射,这些反射在表面上始终如一且平滑地移动。
讨论:在定量上优于现有的视图合成技术,特别是对于显示详细镜面反射的光滑表面。定性的视觉改进在图像指标方面的定量改进远远超过了。尤其值得注意的是,该方法合成的反射平滑而一致的运动,比基线方法呈现的视角相关外观更加逼真。这表明标准的图像误差度量(PSNR、SSIM等)不足以评估视角相关外观的质量。
到这里,我们也就讲完了《高亮反光终结者?谷歌NeRF-Casting:光线追踪就能搞定!》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于谷歌,光线追踪的知识点!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
366 收藏
-
245 收藏
-
369 收藏
-
499 收藏
-
325 收藏
-
182 收藏
-
380 收藏
-
201 收藏
-
211 收藏
-
195 收藏
-
446 收藏
-
477 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习