用于训练 DAViD 的 SynthHuman 数据集包含 30 万张分辨率为 384×512 的图像,涵盖了人脸、上半身和全身场景的样本。该数据集在姿势、环境、光照和外观方面均具有多样性,并且不针对任何特定的评估集进行定制。这使得 DAViD 能够泛化到一系列基准数据集以及自然数据中。除了 RGB 渲染图像外,每个样本还包含用于训练模型的软前景蒙版、表面法线和深度地面实况注释。
DAViD 提供高质量、细致的结果,同时实现了卓越的效率,运行速度比竞争方法快几个数量级。该模型能够在各种光照条件下可靠地捕捉各种人体特征,并保留诸如发丝和细微面部特征等精细细节。这证明了该模型在复杂的现实场景中的稳健性和准确性。DAViD 使用单一模型架构来处理三个密集预测任务,使其成为适用于各种计算机视觉应用的多功能高效解决方案。