Normalisation de textes par analogie: le cas des mots inconnus

M Baranes, B Sagot - TALN-Traitement Automatique du Langage …, 2014 - inria.hal.science
TALN-Traitement Automatique du Langage Naturel, 2014inria.hal.science
Dans cet article, nous proposons et évaluons un système permettant d'améliorer la qualité
d'un texte bruité notamment par des erreurs orthographiques. Ce système a vocation à être
intégré à une architecture complète d'extraction d'information, et a pour objectif d'améliorer
les résultats d'une telle tâche. Pour chaque mot qui est inconnu d'un lexique de référence et
qui n'est ni une entité nommée ni une création lexicale, notre système cherche à proposer
une ou plusieurs normalisations possibles (une normalisation valide étant un mot connu …
Dans cet article, nous proposons et évaluons un système permettant d'améliorer la qualité d'un texte bruité notamment par des erreurs orthographiques. Ce système a vocation à être intégré à une architecture complète d'extraction d'information, et a pour objectif d'améliorer les résultats d'une telle tâche. Pour chaque mot qui est inconnu d'un lexique de référence et qui n'est ni une entité nommée ni une création lexicale, notre système cherche à proposer une ou plusieurs normalisations possibles (une normalisation valide étant un mot connu dont le lemme est le même que celui de la forme orthographiquement correcte). Pour ce faire, ce système utilise des techniques de correction automatique lexicale par règle qui reposent sur un système d'induction de règles par analogie.
inria.hal.science
以上显示的是最相近的搜索结果。 查看全部搜索结果