所有版本 - 学术资源搜索

Uniter: Universal image-text representation learning

YC Chen, L Li, L Yu, A El Kholy, F Ahmed… - European conference on …, 2020 - Springer

Joint image-text embedding is the bedrock for most Vision-and-Language (V+ L) tasks,
where multimodality inputs are simultaneously processed for joint visual and textual …

被引用次数：1998 相关文章

[PDF] github.io

[PDF][PDF] UNITER: UNiversal Image-TExt Representation Learning

YC Chen, L Li, L Yu, A El Kholy, F Ahmed, Z Gan… - njuhugn.github.io

Joint image-text embedding is the bedrock for most Visionand-Language (V+ L) tasks,
where multimodality inputs are simultaneously processed for joint visual and textual …

[PDF] ecva.net

[PDF][PDF] UNITER: UNiversal Image-TExt Representation Learning

YC Chen, L Li, L Yu, A El Kholy, F Ahmed, Z Gan… - ecva.net

Joint image-text embedding is the bedrock for most Visionand-Language (V+ L) tasks,
where multimodality inputs are simultaneously processed for joint visual and textual …

[引用][C] UNITER: UNiversal Image-TExt Representation Learning

YC Chen, L Li, L Yu, A El Kholy, F Ahmed… - … Vision–ECCV 2020, 2020 - cir.nii.ac.jp

UNITER: UNiversal Image-TExt Representation Learning | CiNii Research CiNii 国立情報学
研究所学術情報ナビゲータ[サイニィ] 詳細へ移動検索フォームへ移動論文・データをさがす大学 …

高级搜索

QQ 群

Uniter: Universal image-text representation learning

[PDF][PDF] UNITER: UNiversal Image-TExt Representation Learning

[PDF][PDF] UNITER: UNiversal Image-TExt Representation Learning

[引用][C] UNITER: UNiversal Image-TExt Representation Learning

UNITER: UNiversal Image-TExt Representation Learning

UNITER: UNiversal Image-TExt Representation Learning

UNITER: UNiversal Image-TExt Representation Learning

引用