GeoVista模型在GeoBench基准测试上进行评估,该基准测试包含来自世界各地的照片和全景图以及不同城市的卫星图像。评估流程包括分层评估和细微评估,细微评估会提取预测的地址并计算到地面实况位置的半正矢距离。在地理定位任务上,GeoVista超越了其他开源的智能模型,并取得了与闭源模型相当的性能。
GeoVista拥有一个分层奖励系统,该系统利用多级地理信息来提高整体的地理定位性能。模型会迭代地生成思维和动作,解析并执行每个动作以产生新的观察结果。此过程会重复,直到输出最终的地理定位预测或达到最大交互轮次限制。GeoVista的性能通过一个演示视频得以展示,该视频展示了其在地理定位任务中的能力。

