Accelerating transformer-based deep learning models on fpgas using column balanced block pruning

文章

学术资源搜索

获得 3 条结果（用时0.01秒）

我的图书馆

Accelerating transformer-based deep learning models on fpgas using column balanced block pruning

在引用文章中搜索

[PDF] arxiv.org

Sparse progressive distillation: Resolving overfitting under pretrain-and-finetune paradigm

S Huang, D Xu, IEH Yen, Y Wang, SE Chang… - arXiv preprint arXiv …, 2021 - arxiv.org

Conventional wisdom in pruning Transformer-based language models is that pruning
reduces the model expressiveness and thus is more likely to underfit rather than overfit …

被引用次数：28 相关文章所有 5 个版本

[PDF] arxiv.org

Binary complex neural network acceleration on fpga

H Peng, S Zhou, S Weitze, J Li, S Islam… - 2021 IEEE 32nd …, 2021 - ieeexplore.ieee.org

Being able to learn from complex data with phase information is imperative for many signal
processing applications. Today's real-valued deep neural networks (DNNs) have shown …

被引用次数：23 相关文章所有 8 个版本

[PDF] arxiv.org

Optimizing fpga-based accelerator design for large-scale molecular similarity search (special session paper)

H Peng, S Chen, Z Wang, J Yang… - 2021 IEEE/ACM …, 2021 - ieeexplore.ieee.org

Molecular similarity search has been widely used in drug discovery to identify structurally
similar compounds from large molecular databases rapidly. With the increasing size of …

被引用次数：13 相关文章所有 6 个版本

高级搜索

QQ 群

Accelerating transformer-based deep learning models on fpgas using column balanced block pruning

Sparse progressive distillation: Resolving overfitting under pretrain-and-finetune paradigm

Binary complex neural network acceleration on fpga

Optimizing fpga-based accelerator design for large-scale molecular similarity search (special session paper)

引用