寻找最新最佳的3D 创建人工智能。浏览最全面的AI数据库,每日持续更新。
最新
CubePart 是一种开放词汇的零件可控 3D 生成器,设计用于根据文本提示和零件架构创建多零件 3D 网格对象。它的重点是通过将特定于任务的模型设计与研究人员、开发人员或生产团队可以使用的输出相结合,使该工作流程更加实用。 CubePart 不是提供通用演示,而是针对具体的能力差距,并为用户提供一种更可控的方式来处理复杂的 AI 生成或 AI 分析
Articraft 是一个代理系统,用于生成铰接式 3D 资产,这些资产是为模拟和交互而构建的。它针对具有移动部件的对象,例如烤箱、抽屉、自行车、椅子、灯具和机械组件,而静态网格体在这些情况下是不够的。该系统旨在生成包括功能关节的资产,以便可以在模拟或交互式环境中对其进行操作。
核心工作流程使用编码代理,根据 LLM 友好的 SD
Pixal3D 是一个图像到 3D 生成框架,旨在创建与输入图像保持像素对齐的高保真 3D 资源。它解决了图像条件 3D 生成中的常见故障:模型可能会创建合理的几何形状,但最终资产可能会在像素级别偏离参考视图。 Pixal3D 专注于忠实的重建式对应,同时仍然保留完整 3D 资产合成所需的生成灵活性。
该系统以与输入视图一致的方式
Map2World 是一个分段图条件文本到 3D 世界生成框架,用于从用户定义的顶视图布局创建可探索的 3D 环境。它解决了现有 3D 世界生成方法的局限性,这些方法依赖于刚性网格或在大型场景中产生不一致的对象比例。使用Map2World,用户可以指定任意片段图和文本条件来指导生成的世界的结构、规模和语义布局。
该框架以免训练的方
D-Rex 是一个扩散渲染框架,适用于逼真、可重新照明、富有表现力的全身人体化身。它专为远程呈现、游戏、虚拟制作和数字人类等应用而设计,在这些应用中,化身必须在视觉上逼真,并且在不断变化的灯光和表情下可控。该系统专注于特定人物的化身,支持自由视点渲染和富有表现力的动画,同时保留逼真的外观。
主要技术贡献是通过将重新照明视为具有扩散
UniMesh 是一种统一的 3D 网格理解和生成系统,它将语义推理、网格创建和网格编辑结合在一个框架中。它旨在帮助模型根据文本提示生成 3D 网格、编辑现有形状以及通过迭代反馈推理网格内容。这使得它对于 3D 资产创建、几何理解和 AI 辅助建模工作流程非常有用。
该系统使用连接图像潜在、网格调节和 3D 生成的管道,使其能够在
HY3 是腾讯混源 3D 预览版,专注于高级 3D 生成和资产创建。它专为需要 AI 辅助 3D 内容工作流程的用户而设计,包括从高级输入生成对象、预览或面向生产的 3D 资产。作为预览版,它为创作者和技术团队提供了一种评估腾讯3D生成堆栈方向的方法。
该产品适合更广泛的 AI 工具运动,可降低创建 3D 内容的成本和复杂性。像
AniGen 是一个统一的生成框架,可从单个图像创建动画就绪的 3D 资源。它专为静态概念或参考需要成为具有适合动画结构的可用 3D 资产的工作流程而设计。该产品涉及游戏、动画、虚拟制作、角色资产和3D内容创作。
AniGen 使用统一的 S3 字段来生成可动画的 3D 资产,这意味着该表示旨在捕获下游动画所需的形状、结构和语义。
Lyra 2 是一款用于探索生成 3D 世界的 NVIDIA 研究系统。它旨在创建摄像机控制的演练视频,并通过前馈重建将其提升为 3D。该产品的目标是长视野、3D 一致的世界生成,用户可以探索生成的环境,而不仅仅是观看固定的剪辑。
该系统解决了空间遗忘和时间漂移,这是长时间生成的演练中的两个常见问题。通过将生成与 3D 重建相结合
Kimodo 是 NVIDIA 研究的运动学运动扩散模型,用于生成高质量的 3D 人类和机器人运动。它接受大规模光学动作捕捉数据的训练,专注于可控动作生成而不是简单的动画播放。该模型与机器人、人形控制、角色动画、模拟和具体人工智能相关。
从技术上讲,Kimodo 使用基于运动学表示的基于扩散的生成运动模型。通过大规模光学动作捕捉训
LATENT 是一个围绕潜在空间建模构建的 3D 生成系统,用于几何感知合成。它旨在生成 3D 内容,重点关注如何从紧凑的潜在表示中出现结构,这对于从事生成形状建模和空间推理的研究人员很有用。该产品适合更广泛的可控 3D 创建系统系列。
其主要价值是将公众研究可见性与易于研究和比较的技术结合起来。潜在空间 3D 生成之所以有吸引力
WorldAgents 询问基础图像模型是否可以充当构建 3D 世界模型的代理。该项目使用多代理架构从 2D 基础模型合成 3D 一致的世界,将问题描述为协调的管道而不是单个整体生成器。这使其成为视觉模型和空间推理交叉研究的有用参考。
该系统围绕导向器、生成器和验证器进行组织,每个负责创建和过滤过程的不同部分。此设计有助于模型生成
SK-Adapter 是一种用于原生 3D 生成的骨架引导控制系统。它旨在让用户对结构、姿势和形状产生更直接的影响,同时仍然允许模型生成逼真的 3D 内容。这使其成为可控合成工作流程的宝贵工具。
该产品的理念是用结构支架来锚定生成,以便输出与预期的几何形状保持一致。这很有用,因为许多 3D 生成系统都在努力平衡自由度和一致性。基于
Hitem3d 是一款领先的平台,可直接从图像生成高保真三维模型。该服务利用专有技术,旨在将单个输入图像转换为细节丰富、精度极高的可投入生产的 3D 资产。它通过提供简化的流程来解决关键的行业挑战,该流程可以保持清晰的边缘并保留复杂的视觉数据,使得输出可以直接用于要求苛刻的应用,如 3D 打印和游戏开发。
该平台的一项重要能力是其
KLING 3.0 是一款下一代视频生成平台,旨在直接从文本或图像提示创建高度逼真、影院级的素材。它专注于长篇、时间连贯的视频,使用户能够生成具有一致角色、稳定镜头运动和丰富环境细节的复杂场景。凭借针对高分辨率输出和对运动及风格进行精细控制而优化的模型架构,KLING 3.0 旨在为那些需要在不牺牲视觉保真度的情况下快速迭代的专业创作者服务。
VIGA 是一个多模态代理,它将视觉视为逆向图形,通过 Blender 中的分析-合成循环,将图像重建为可编辑的 3D 场景程序。
通过将多模态推理与不断发展的上下文记忆交织在一起,VIGA 可以“感知编码”场景、它们的物理特性和交互,使用基本元素或高质量生成资产从头开始构建它们。
在新的 BlenderBenc
HY-Motion 1.0 是腾讯混元团队开发的开源文本到 3D 人体动作生成模型,旨在直接从自然语言描述中自动生成高质量的角色动画。它专注于生成可集成到标准内容创建流程中的 3D 骨架动作,使用户能够通过文字描述动作并获得物理上合理的运动序列,而无需手动设置关键帧。该项目专为面向生产的工作流程而设计,提供了代码和模型权重,可用于合成从日常行为到高动态
UGCraft AI 专为彻底改变 Roblox 用户生成内容 (UGC) 创作者的工作流程而设计,提供从抽象概念到经过抛光、可发布数字物品的无与伦比的途径。该平台通过允许用户通过简单的文本提示或图像参考生成详细的配饰和服装,消除了传统上与 3D 资产创建相关的较高门槛。无论创作者设想的是错综复杂的哥特式洛丽塔时装还是未来主义的赛博朋克头饰,该工具都能
Marble 是 World Labs 开发的首个商用生成式世界模型,该公司由人工智能先驱李飞飞领导。它专注于使用文本提示、图像、视频和 3D 布局图等各种输入方法生成可编辑且持久的 3D 环境。该产品提供高保真度的空间一致性,并支持对生成的世界进行无缝探索,使其适用于游戏开发、电影视觉效果、虚拟现实和机器人模拟等应用。Marble 的独特之处在于它允
SAM 3D 是一个强大的 3D 重建模型,能够从 2D 图像创建详细的 3D 场景。该模型是利用大规模真实世界数据来解决物理世界的复杂性和丰富性的一个重要进步。通过 SAM 3D,我们推出了两个新模型:SAM 3D Objects,它实现了物体和场景重建;SAM 3D Body,它专注于人体和形状估计。这两个模型都提供了强大、最先进的性能,将静态 2