Preprocessing of Subword Encoding for NMT

K Semenov - 2024 - dspace.cuni.cz
MASTER THESIS Kirill Semenov Pre-processing of the Subword Encoding for the Neural
Machine Translation Institute of Formal and Applied Linguistics Supervisor of the master …

[引用][C] 토큰단위에따른한국어표준어-방언번역모델의성능변화연구

박준호, 홍충선, 박성배 - 한국정보과학회학술발표논문집, 2024 - dbpia.co.kr
요약문장을 어떻게 분절하는가는 곧 모델이 문장을 어떻게 이해하는가를 나타낸다. 최근에는
대부분 글자 단위의 통계적 부분 단어 기법을 사용하지만, 음소 단위 변화가 많은 한국어 방언 …