Multimodal Reasoning

4papers

5.0viability

-100%30d

Papers

1–4 of 4

Research Paper·Feb 2, 2026

ClueTracer: Question-to-Vision Clue Tracing for Training-Free Hallucination Suppression in Multimodal Reasoning

Large multimodal reasoning models solve challenging visual problems via explicit long-chain inference: they gather visual clues from images and decode clues into textual tokens. Yet this capability al...

7.0 viability

Research Paper·Jan 29, 2026

Concise Geometric Description as a Bridge: Unleashing the Potential of LLM for Plane Geometry Problem Solving

Plane Geometry Problem Solving (PGPS) is a multimodal reasoning task that aims to solve a plane geometric problem based on a geometric diagram and problem textual descriptions. Although Large Language...

6.0 viability

Research Paper·Feb 2, 2026

Evolving from Tool User to Creator via Training-Free Experience Reuse in Multimodal Reasoning

Existing Tool-Integrated Reasoning (TIR) models have effectively extended the question-answering capabilities of LLMs by incorporating external tools. However, real-world scenarios present numerous op...

5.0 viability

Research Paper·Jan 14, 2026

Omni-R1: Towards the Unified Generative Paradigm for Multimodal Reasoning

Multimodal Large Language Models (MLLMs) are making significant progress in multimodal reasoning. Early approaches focus on pure text-based reasoning. More recent studies have incorporated multimodal ...

2.0 viability