# Vid2Seq: Large-Scale Pretraining of a Visual Language Model for Dense Video Captioning

> Research article (2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2023) · cited 208× · AI/ML

**Wikidata**: [openalex:W4386066385](https://www.wikidata.org/wiki/openalex:W4386066385)  
**Source**: https://4ort.xyz/entity/vid2seq-large-scale-pretraining-of-a-visual-language-model-for-dense-video-captioning