[PDF][PDF] “三维视觉—语言” 推理技术的前沿研究与最新趋势

雷印杰, 徐凯, 郭裕兰, 杨鑫, 武玉伟, 胡玮, 杨佳琪… - 中国图象图形学报, 2024 - cjig.cn
3D dense captioning aims to identify all possible instances … 受到VoteNet的启发,Vote2Cap-DETR通过
偏移估计 对每个候选对象… EDA:explicit text-decoupling and dense alignment for 3D