寻找最新最佳的视觉推理人工智能。浏览最全面的AI数据库,每日持续更新。
最新
GeoVista是一个用于地理定位的网络增强型智能视觉推理模型。它将工具调用无缝集成到推理循环中,包括一个图像放大工具和一个网络搜索工具。该模型旨在在推理过程中确认或完善假设,使其成为地理定位任务的强大工具。GeoVista拥有完整的训练流程,包括冷启动监督微调阶段和强化学习阶段。
GeoVista模型在GeoBench基准测试上进