所有版本 - 学术资源搜索

文章

学术资源搜索

获得 2 条结果（用时0.02秒）

Imagebert: Cross-modal pre-training with large-scale weak-supervised image-text data

D Qi, L Su, J Song, E Cui, T Bharti, A Sacheti - arXiv preprint arXiv …, 2020 - arxiv.org

In this paper, we introduce a new vision-language pre-trained model--ImageBERT--for
image-text joint embedding. Our model is a Transformer-based model, which takes different …

被引用次数：271 相关文章

ImageBERT: Cross-modal Pre-training with Large-scale Weak-supervised Image-Text Data

D Qi, L Su, J Song, E Cui, T Bharti, A Sacheti - arXiv e-prints, 2020 - ui.adsabs.harvard.edu

In this paper, we introduce a new vision-language pre-trained model--ImageBERT--for
image-text joint embedding. Our model is a Transformer-based model, which takes different …

高级搜索

QQ 群

Imagebert: Cross-modal pre-training with large-scale weak-supervised image-text data

ImageBERT: Cross-modal Pre-training with Large-scale Weak-supervised Image-Text Data

引用