关键功能

从数量可变、无需位姿的图像中重建 3D 表面。
将多视角压缩为一个固定大小的全局潜状态。
通过一次编码器前向过程解码任意数量的定向表面点。
使用流匹配 ODE 独立生成逐点表面。
加入渲染引导,将各点耦合成连贯表面。
基于 VGGT 风格视觉几何特征和 Perceiver 压缩器构建。
在输入视角数量变化的多个基准上进行评估。
链接到公开的 arXiv 和 GitHub 资源。

系统采用基于 VGGT 的编码器、Perceiver 风格压缩器来生成全局状态,并通过逐点流匹配 ODE 解码。它加入基于渲染的通信引导,使独立流动的点仍属于同一个连贯表面。


Surflo 适用于输入视角数量会变化且输出分辨率需要灵活调整的前馈式 3D 重建。页面链接了 arXiv 和代码,并描述了多个基准测试以及一个新的真实世界表面数据集上的评估。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!