Image Captioning

Trending

4papers

6.8viability

+100%30d

Papers

1–4 of 4

Research Paper·Feb 27, 2026

Hyperdimensional Cross-Modal Alignment of Frozen Language and Image Models for Efficient Image Captioning

Large unimodal foundation models for vision and language encode rich semantic structures, yet aligning them typically requires computationally intensive multimodal fine-tuning. Such approaches depend ...

7.0 viability

Research Paper·Mar 8, 2026

VIVECaption: A Split Approach to Caption Quality Improvement

Caption quality has emerged as a critical bottleneck in training high-quality text-to-image (T2I) and text-to-video (T2V) generative models. While visual language models (VLMs) are commonly deployed t...

7.0 viability

Research Paper·Mar 6, 2026

Imagine How To Change: Explicit Procedure Modeling for Change Captioning

Change captioning generates descriptions that explicitly describe the differences between two visually similar images. Existing methods operate on static image pairs, thus ignoring the rich temporal d...

7.0 viability

Research Paper·Feb 25, 2026

CCCaption: Dual-Reward Reinforcement Learning for Complete and Correct Image Captioning

Image captioning remains a fundamental task for vision language understanding, yet ground-truth supervision still relies predominantly on human-annotated references. Because human annotations reflect ...

6.0 viability

Image Captioning

Papers

Hyperdimensional Cross-Modal Alignment of Frozen Language and Image Models for Efficient Image Captioning

VIVECaption: A Split Approach to Caption Quality Improvement

Imagine How To Change: Explicit Procedure Modeling for Change Captioning

CCCaption: Dual-Reward Reinforcement Learning for Complete and Correct Image Captioning

Filters