Mined bitexts can contain imperfect translations that yield unreliable training signals for Neural Machine Translation (NMT). While filtering such pairs out is known to improve final …
Y Gao, B Liao, H Ney - … of the 28th International Conference on …, 2020 - aclanthology.org
Soft contextualized data augmentation is a recent method that replaces one-hot representation of words with soft posterior distributions of an external language model …
АН Рабчевский - … интеллект в решении актуальных социальных и …, 2022 - elibrary.ru
В статье представлено описание синтетических данных, области их применения, методов генерации, систем генерации синтетических данных, оценки их качества …