Spelling correction for search engine queries

B Martins, MJ Silva - Advances in Natural Language Processing: 4th …, 2004 - Springer
Search engines have become the primary means of accessing information on the Web.
However, recent studies show misspelled words are very common in queries to these …

The pluricentricity of Portuguese: A sociolectometrical approach to divergence between European and Brazilian Portuguese

AS Silva - … variation and sociocognitive dimensions. Berlin/Boston …, 2014 - degruyter.com
This paper investigates the divergence between European and Brazilian Portuguese in the
last 60 years on three levels, namely lexical variation, constructional variation, and language …

Extracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL ea sua avaliação

HG Oliveira, D Santos, P Gomes - Linguamática, 2010 - linguamatica.com
Neste artigo apresentamos o PAPEL, um recurso lexical para o português, constituído por
relações entre palavras, extraídas de forma automática de um dicionário da língua geral …

Caminhos percorridos no mapa da portuguesificação: A Linguateca em perspectiva

D Santos - Linguamática, 2009 - linguamatica.com
Caminhos percorridos no mapa da portuguesificaçao: A Linguateca em perspectiva Page 1
Caminhos percorridos no mapa da portuguesificaçao: A Linguateca em perspectiva Diana …

Measuring and comparing the use and success of loanwords in Portugal and Brazil: A corpus-based and concept-based sociolectometrical approach

AS Silva - … and phraseological innovations. Berlin/Boston: Mouton …, 2014 - degruyter.com
This paper presents a quantitative study on differences in the use of loanwords in European
Portuguese and Brazilian Portuguese, with specific attention to their impact on the general …

The corpus, its users and their needs: a user-oriented evaluation of COMPARA

D Santos, A Frankenberg-Garcia - International Journal of Corpus …, 2007 - jbe-platform.com
COMPARA is a bidirectional parallel corpus of English and Portuguese, currently with 3
million words. The corpus was launched in 2000 and at present it is possibly the largest …

Linguateca: um centro de recursos distribuído para o processamento computacional da língua portuguesa

D Santos, A Simoes, A Frankenberg-Garcia, A Pinto… - 2004 - repositorium.sdum.uminho.pt
Neste artigo apresentamos uma panorâmica da actividade da Linguateca na criação e
disponibilização de recursos e ferramentas para a língua portuguesa. Começamos por uma …

[PDF][PDF] Perspectivas sobre a Linguateca/Actas do encontro Linguateca: 10 anos

L Costa, D Santos, N Cardoso - 2008 - comum.rcaap.pt
Este volume resultou da iniciativa da Linguateca de chamar a comunidade da área a quem
servimos, ou seja, as pessoas envolvidas no processamento computacional da nossa …

Geographically aware web text mining

B Martins - 2009 - repositorio.ul.pt
Text mining and search have become important research areas over the past few years,
mostly due to the large popularity of the Web. A natural extension for these technologies is …

The WebCAT framework automatic generation of meta-data for Web resources

B Martins, MJ Silva - The 2005 IEEE/WIC/ACM International …, 2005 - ieeexplore.ieee.org
Automated methods for resource annotation are a clear necessity, as the success of the
semantic Web depends on the availability of Web resources with meta data conforming to …