What is Logics-Parsing?
Logics-Parsing 是一個功能強大、端到端的文件解析模型,透過通用視覺語言模型 (VLM) 經由監督式微調 (SFT) 與強化學習 (RL) 所建構。它擅長精確地分析並組織高度複雜的文件內容。
主要特色
輕鬆實現端到端處理
我們的單一模型架構,省去了複雜多階段的處理流程。部署與推論皆簡單直觀,可直接從文件影像輸出結構化內容。
它在排版困難的文件上也能展現卓越效能。
進階內容識別
它能精確識別並結構化複雜內容,甚至是精密的科學公式也不例外。
化學結構能夠智慧地被辨識,並能以標準 SMILES 格式呈現。
豐富且具結構的 HTML 輸出
此模型能生成一份簡潔的 HTML 文件呈現,同時完整保留其邏輯結構。
每個內容區塊 (例如:段落、表格、圖形、公式) 都會標記其類別、邊界框座標以及 OCR 文字。
它會自動識別並過濾掉頁首與頁尾等不相關元素,僅專注於核心內容的處理。
頂尖效能
Logics-Parsing 在我們專為全面評估模型在複雜版面文件和 STEM 內容解析能力而設計的內部基準測試中,取得了最佳效能表現。
More information on Logics-Parsing
Launched
Pricing Model
Free
Starting Price
Global Rank
Follow
Month Visit
<5k
Tech used





