# Multimedia analysis of robustly optimized multimodal transformer based on vision and language co-learning

> Research article (Information Fusion, 2023) · cited 17× · AI/ML

**Wikidata**: [openalex:W4384157303](https://www.wikidata.org/wiki/openalex:W4384157303)  
**Source**: https://4ort.xyz/entity/multimedia-analysis-of-robustly-optimized-multimodal-transformer-based-on-vision-and-language-co-learning