LightOnOCR-2-1B 是一款采用 RLVR 训练精炼的主力 OCR 模型，旨在实现最高的准确性，推荐用于大多数 OCR 任务。它是一个高效的端到端 1B 参数视觉-语言模型，用于将文档转换为干净、自然排序的文本。该模型在 OlmOCR-Bench 上实现了最先进的性能，同时比竞争方法更小、更快。该模型是完全可微的，允许进行微调，并支持各种任务，如领

LightOnOCR-2-1B | 寻找最新最热门的生产力AI | 浏览最全面的AI数据库

LightOnOCR-2-1B 是一款采用 RLVR 训练精炼的主力 OCR 模型，旨在实现最高的准确性，推荐用于大多数 OCR 任务。它是一个高效的端到端 1B 参数视觉-语言模型，用于将文档转换为干净、自然排序的文本。该模型在 OlmOCR-Bench 上实现了最先进的性能，同时比竞争方法更小、更快。 该模型是完全可微的，允许进行微调，并支持各种任务，如领域自适应和多语言微调。它可以处理表格、收据、表单、多栏布局和数学符号，使其成为文档理解的多功能工具。该模型还会预测嵌入图像的边界框，增强了其功能。 LightOnOCR-2-1B 是一个模型家族的一部分，该家族包括用于特定任务的变体，例如用于微调的基础模型和带有图像边界框的模型。该模型可用于 transformers，并可使用 vLLM 进行部署。它是在大型高质量语料库上训练的，从而提高了性能和效率。该模型的强大功能使其适用于广泛的应用场景。

LightOnOCR-2-1B

关键功能

Subscribe to the AI Search Newsletter