Dissecting Zero-Shot Visual Reasoning Capabilities in Vision and Language Models

文章

学术资源搜索

获得 1 条结果（用时0.01秒）

我的图书馆

Dissecting Zero-Shot Visual Reasoning Capabilities in Vision and Language Models

在引用文章中搜索

[PDF] arxiv.org

Zero-shot visual reasoning by vision-language models: Benchmarking and analysis

A Nagar, S Jaiswal, C Tan - 2024 International Joint …, 2024 - ieeexplore.ieee.org

Vision-language models (VLMs) have shown impressive zero-and few-shot performance on
real-world visual question answering (VQA) benchmarks, alluding to their capabilities as …

被引用次数：2 相关文章所有 2 个版本

高级搜索

QQ 群

Dissecting Zero-Shot Visual Reasoning Capabilities in Vision and Language Models

Zero-shot visual reasoning by vision-language models: Benchmarking and analysis

引用