The NPU-ASLP-LiAuto System Description for Visual Speech Recognition in CNVSRC 2023

文章

学术资源搜索

获得 2 条结果（用时0.02秒）

我的图书馆

The NPU-ASLP-LiAuto System Description for Visual Speech Recognition in CNVSRC 2023

在引用文章中搜索

[PDF] arxiv.org

Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder

H Wang, P Guo, X Wan, H Zhou, L Xie - arXiv preprint arXiv:2404.05466, 2024 - arxiv.org

Automatic lip-reading (ALR) aims to automatically transcribe spoken content from a
speaker's silent lip motion captured in video. Current mainstream lip-reading approaches …

被引用次数：1 相关文章所有 2 个版本

[PDF] arxiv.org

The NPU-ASLP System Description for Visual Speech Recognition in CNVSRC 2024

H Wang, L Xie - arXiv preprint arXiv:2408.02369, 2024 - arxiv.org

This paper delineates the visual speech recognition (VSR) system introduced by the NPU-
ASLP (Team 237) in the second Chinese Continuous Visual Speech Recognition Challenge …

高级搜索

QQ 群

The NPU-ASLP-LiAuto System Description for Visual Speech Recognition in CNVSRC 2023

Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder

The NPU-ASLP System Description for Visual Speech Recognition in CNVSRC 2024

引用