[PDF][PDF] Modelo hıbrido fonético-neural para corrección en sistemas de reconocimiento del habla

R Viana-Cámara, M Campos-Soberanis… - Res. Comput …, 2020 - rcs.cic.ipn.mx
Res. Comput. Sci., 2020rcs.cic.ipn.mx
El reconocimiento automático del habla (ASR) es un área relevante en diferentes ámbitos
debido a que brinda un mecanismo de comunicación natural entre aplicaciones y usuarios.
A menudo los ASR presentan errores en aplicaciones que usan un léxico propio de
dominios especıficos. Se han explorado diversas estrategias para reducir el error en ASR
cerrados mediante posprocesamiento, destacando enfoques de corrección ortográfica y
aprendizaje profundo. En el presente artıculo se explora el uso de una red neuronal …
Resumen
El reconocimiento automático del habla (ASR) es un área relevante en diferentes ámbitos debido a que brinda un mecanismo de comunicación natural entre aplicaciones y usuarios. A menudo los ASR presentan errores en aplicaciones que usan un léxico propio de dominios especıficos. Se han explorado diversas estrategias para reducir el error en ASR cerrados mediante posprocesamiento, destacando enfoques de corrección ortográfica y aprendizaje profundo. En el presente artıculo se explora el uso de una red neuronal profunda para rectificar los resultados de un algoritmo de corrección fonética, aplicado a una base de datos de audios de televenta. Los resultados obtenidos muestran una reducción de la tasa de error de palabras (WER), tanto en la transcripción original, como en la corrección fonética, mostrando la viabilidad de los modelos de aprendizaje profundo para trabajar en conjunto con estrategias de corrección posprocesamiento en la reducción de errores cometidos por ASR en dominios especıficos de lenguaje.
rcs.cic.ipn.mx
以上显示的是最相近的搜索结果。 查看全部搜索结果