What is Logics-Parsing?
Logics-Parsing 是一个强大的端到端文档解析模型,它基于通用视觉-语言模型 (VLM),并通过监督微调 (SFT) 和强化学习 (RL) 进行构建。它擅长精确分析和构建高度复杂的文档。
核心特性
轻松实现端到端处理
我们采用单一模型架构,无需复杂的、多阶段的流水线。部署和推理过程简明直接,能够将文档图像直接转化为结构化输出。
它在处理布局复杂的文档时表现出色。
高级内容识别
它能精准识别并构建复杂内容,包括精密的科学公式。
化学结构能够被智能识别,并能以标准的 SMILES 格式表示。
丰富、结构化的 HTML 输出
该模型能够生成清晰的文档 HTML 表示,同时保留其逻辑结构。
每个内容块(例如段落、表格、图表、公式)都附带有其 类别、 边界框坐标 和 OCR 文本信息。
它能自动识别并过滤掉页眉和页脚等无关元素,从而专注于核心内容。
领先的性能表现
Logics-Parsing 在我们的内部基准测试中取得了最佳表现,该基准测试专为全面评估模型对复杂布局文档和 STEM 内容的解析能力而设计。
More information on Logics-Parsing
Launched
Pricing Model
Free
Starting Price
Global Rank
Follow
Month Visit
<5k
Tech used





