Meta Segment Anything Model 3

Free 视觉计算机视觉

网站推广

关键功能

统一的模型，用于对象检测、分割和跟踪

支持文本、示例和视觉提示

接受开放词汇的短名词短语和图像示例提示

擅长分割由短名词短语描述的对象

可用作多模态大型语言模型的感知工具

应用于各种用例，包括科学领域

集成到可穿戴设备中，实现第一人称视角

使用利用人工智能和人工标注者的新型数据引擎构建

SAM 3 支持各种提示模式，包括概念提示（如简单的名词短语和图像示例）以及视觉提示（如蒙版、框和点）。这提高了分割的灵活性和可用性，特别是对于难以仅用文本描述的稀有概念。SAM 3 在分割由短名词短语描述的对象方面表现出色，反映了交互式和自然场景中常见的用户意图。我们的模型还可以用作多模态大型语言模型的感知工具，用于分割由更复杂提示描述的对象。

SAM 3 已应用于各种用例，包括科学领域，如野生动物监测和海洋探索。该模型还已集成到可穿戴设备中，能够从第一人称视角对物体进行稳健的分割和跟踪。此外，SAM 3 已被用于构建一个利用人工智能和人工标注者的新型数据引擎，从而极大地加快了标注速度。这种混合的人工和人工智能系统使得创建包含超过 400 万个独特概念的大型多样化训练集成为可能。

在您的网站添加此徽章，以获得更多点赞并登上搜索结果顶部！

Meta Segment Anything Model 3

关键功能

Subscribe to the AI Search Newsletter