Multi-level knowledge distillation via knowledge alignment and correlation

文章

学术资源搜索

获得 3 条结果（用时0.02秒）

我的图书馆

Multi-level knowledge distillation via knowledge alignment and correlation

在引用文章中搜索

[PDF] arxiv.org

Multi-level distillation of semantic knowledge for pre-training multilingual language model

M Li, F Ding, D Zhang, L Cheng, H Hu, F Luo - arXiv preprint arXiv …, 2022 - arxiv.org

Pre-trained multilingual language models play an important role in cross-lingual natural
language understanding tasks. However, existing methods did not focus on learning the …

被引用次数：6 相关文章所有 4 个版本

[PDF] arxiv.org

Preview-based Category Contrastive Learning for Knowledge Distillation

M Ding, J Wu, X Dong, X Li, P Qin, T Gan… - arXiv preprint arXiv …, 2024 - arxiv.org

Knowledge distillation is a mainstream algorithm in model compression by transferring
knowledge from the larger model (teacher) to the smaller model (student) to improve the …

[PDF][PDF] Multi-level Distillation of Semantic Knowledge for Pre-training Multilingual Language Model

L Mingqi, F Ding, D Zhang, L Cheng, H Hu… - Emperical Methods in …, 2022 - par.nsf.gov

Pre-trained multilingual language models play an important role in cross-lingual natural
language understanding tasks. However, existing methods did not focus on learning the …

高级搜索

QQ 群

Multi-level knowledge distillation via knowledge alignment and correlation

Multi-level distillation of semantic knowledge for pre-training multilingual language model

Preview-based Category Contrastive Learning for Knowledge Distillation

[PDF][PDF] Multi-level Distillation of Semantic Knowledge for Pre-training Multilingual Language Model

引用