Vision-Language Alignment Comparison Hub

3 papers - avg viability 7.0

Reference Surfaces

ACPO: Counteracting Likelihood Displacement in Vision-Language Alignment with Asymmetric Constraints(7.0)
ACPO is a novel alignment mechanism for vision-language models that prevents hallucinations by asymmetrically constraining preference optimization, leading to improved performance on benchmark tasks.
GeoAlignCLIP: Enhancing Fine-Grained Vision-Language Alignment in Remote Sensing via Multi-Granular Consistency Learning(7.0)
GeoAlignCLIP enhances fine-grained vision-language alignment in remote sensing through multi-granular consistency learning.