Correcting OCR errors for German in Fraktur font

M Généreux, EW Stemle, V Lyding… - … CLiC-it 2014 & and of the …, 2014 - torrossa.com
M Généreux, EW Stemle, V Lyding, L Nicolas
Proceedings of the First Italian Conference on Computational Linguistics …, 2014torrossa.com
In this paper, we present ongoing experiments for correcting OCR errors on German
newspapers in Fraktur font. Our approach borrows from techniques for spelling correction in
context using a probabilistic edit-operation error model and lexical resources. We highlight
conditions in which high error reduction rates can be obtained and where the approach
currently stands with real data. Italiano. Il contributo presenta esperimenti attualmente in
corso che mirano a correggere gli errori di riconoscimento ottico dei caratteri (OCR) in …
Abstract
English. In this paper, we present ongoing experiments for correcting OCR errors on German newspapers in Fraktur font. Our approach borrows from techniques for spelling correction in context using a probabilistic edit-operation error model and lexical resources. We highlight conditions in which high error reduction rates can be obtained and where the approach currently stands with real data.
Italiano. Il contributo presenta esperimenti attualmente in corso che mirano a correggere gli errori di riconoscimento ottico dei caratteri (OCR) in articoli di giornale scritti in lingua tedesca e nel carattere gotico Fraktur. L’approccio è basato su tecniche di controllo ortografico contestuale e utilizza un modello probabilistico di correzione degli errori assieme a delle risorse lessicali. Si descrivono le condizioni in cui è possibile ottenere un alto tasso di riduzione degli errori e si illustra infine lo stato di avanzamento attuale mediante dati reali.
torrossa.com
以上显示的是最相近的搜索结果。 查看全部搜索结果