# CAST: Cross-Modal Retrieval and Visual Conditioning for image captioning

> Research article (Pattern Recognition, 2024) · cited 24× · AI/ML

**Wikidata**: [openalex:W4396609326](https://www.wikidata.org/wiki/openalex:W4396609326)  
**Source**: https://4ort.xyz/entity/cast-cross-modal-retrieval-and-visual-conditioning-for-image-captioning