GeoVista是一个用于地理定位的网络增强型智能视觉推理模型。它将工具调用无缝集成到推理循环中，包括一个图像放大工具和一个网络搜索工具。该模型旨在在推理过程中确认或完善假设，使其成为地理定位任务的强大工具。GeoVista拥有完整的训练流程，包括冷启动监督微调阶段和强化学习阶段。GeoVista模型在GeoBench基准测试上进行评估，该基准测试包含来自世

GeoVista | 寻找最新最热门的地理定位AI | 浏览最全面的AI数据库

GeoVista是一个用于地理定位的网络增强型智能视觉推理模型。它将工具调用无缝集成到推理循环中，包括一个图像放大工具和一个网络搜索工具。该模型旨在在推理过程中确认或完善假设，使其成为地理定位任务的强大工具。GeoVista拥有完整的训练流程，包括冷启动监督微调阶段和强化学习阶段。 GeoVista模型在GeoBench基准测试上进行评估，该基准测试包含来自世界各地的照片和全景图以及不同城市的卫星图像。评估流程包括分层评估和细微评估，细微评估会提取预测的地址并计算到地面实况位置的半正矢距离。在地理定位任务上，GeoVista超越了其他开源的智能模型，并取得了与闭源模型相当的性能。 GeoVista拥有一个分层奖励系统，该系统利用多级地理信息来提高整体的地理定位性能。模型会迭代地生成思维和动作，解析并执行每个动作以产生新的观察结果。此过程会重复，直到输出最终的地理定位预测或达到最大交互轮次限制。GeoVista的性能通过一个演示视频得以展示，该视频展示了其在地理定位任务中的能力。

GeoVista

关键功能

Subscribe to the AI Search Newsletter