Document AI

3papers

7.3viability

Papers

1–3 of 3

Research Paper·Jan 8, 2026

VERSE: Visual Embedding Reduction and Space Exploration. Clustering-Guided Insights for Training Data Enhancement in Visually-Rich Document Understanding

This work introduces VERSE, a methodology for analyzing and improving Vision-Language Models applied to Visually-rich Document Understanding by exploring their visual embedding space. VERSE enables th...

8.0 viability

Research Paper·Mar 19, 2026

Benchmarking PDF Parsers on Table Extraction with LLM-based Semantic Evaluation

Reliably extracting tables from PDFs is essential for large-scale scientific data mining and knowledge base construction, yet existing evaluation approaches rely on rule-based metrics that fail to cap...

7.0 viabilityHas code

Research Paper·Jan 27, 2026

Up to 36x Speedup: Mask-based Parallel Inference Paradigm for Key Information Extraction in MLLMs

Key Information Extraction (KIE) from visually-rich documents (VrDs) is a critical task, for which recent Large Language Models (LLMs) and Multi-Modal Large Language Models (MLLMs) have demonstrated s...

7.0 viability

Document AI

Papers

VERSE: Visual Embedding Reduction and Space Exploration. Clustering-Guided Insights for Training Data Enhancement in Visually-Rich Document Understanding

Benchmarking PDF Parsers on Table Extraction with LLM-based Semantic Evaluation

Up to 36x Speedup: Mask-based Parallel Inference Paradigm for Key Information Extraction in MLLMs

Filters