关键功能

从一张窄视场图像构建可导航的视频世界。
第一阶段生成重力对齐的 360 度全景图。
将全景图提升为全景 3D 高斯骨架。
利用该骨架渲染用户可控的相机运动轨迹。
报告在单张 RTX 4090 上实现 8 FPS 的实时交互式视频渲染。
将可复用的世界构建与特定观察的视频渲染分离。
提供 arXiv 和公开代码链接。
项目页面包含主视觉和漫游示例的 `.mp4` 直链资源。

该流程先把输入图像扩展为重力对齐的 360 度全景图,再将其提升为 3D 高斯骨架,随后沿用户控制的相机轨迹渲染逼真的视频。项目页面报告在单张 RTX 4090 上可实现 8 FPS 的交互式渲染。


MoVerse 适用于世界建模、场景导航以及需要将单张照片变成可探索环境的图像到 3D 视频体验。页面链接了 arXiv 和代码,并包含主视觉和漫游示例的直链视频资源。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!