Automatic language identification in texts: A survey

T Jauhiainen, M Lui, M Zampieri, T Baldwin… - Journal of Artificial …, 2019 - jair.org
Language identification (" LI") is the problem of determining the natural language that a
document or part thereof is written in. Automatic LI has been extensively researched for over …

Building a treebank for French

A Abeillé, L Clément, F Toussenel - Treebanks: Building and using parsed …, 2003 - Springer
We present a treebank project for French. We have annotated a newspaper corpus of 1
Million words with part of speech, inflection, compounds, lemmas and constituency. We …

Apprentissage automatique et catégorisation de textes multilingues

R Jalam - 2003 - theses.fr
Résumé Notre travail s' intéresse à l'application de méthodes issues de l'apprentissage
automatique à la catégorisation de textes multilingues. Il comporte deux parties. Une …

[PDF][PDF] Hypertags

A Kinyon - COLING 2000 Volume 1: The 18th International …, 2000 - aclanthology.org
Abstract Srinivas (97) enriches traditional morpho-syntactic POS tagging with syntactic
information by introducing Supertags. Unfortunately, words are assigned on average a much …

Vers une analyse syntaxique à granularité variable

T VanRullen - 2005 - theses.hal.science
Résumé It is gainful for a syntactic analysis in Natural Language Processing to be carried
out with more or less precision according to the context, ie that its granularity can be …

[PDF][PDF] La détection automatique des citations et des locuteurs dans les textes informatifs

E Giguet, N Lucas - Le discours rapporté dans tous ses états …, 2004 - giguete.users.greyc.fr
La détection automatique des citations et des locuteurs est une problématique qui suscite
un intérêt tout particulier chez les industriels et institutionnels soucieux des divers courants …

Intertwining deep syntactic processing and named entity detection

C Brun, C Hagege - Advances in Natural Language Processing: 4th …, 2004 - Springer
In this paper, we present a robust incremental architecture for natural language processing
centered around syntactic analysis but allowing at the same time the description of …

[PDF][PDF] Un outil de coloriage de corpus pour la représentation de thèmes

P Beust - Actes des 6èmes Journées internationales de l' …, 2002 - beust.users.greyc.fr
Résumé Cet article présente une application appelée ThemeEditor dont le but est de
permettre une acquisition supervisée de classes sémantiques. Cette acquisition est réalisée …

Word-level identification of romanized tunisian dialect

C Aridhi, H Achour, E Souissi, J Younes - Natural Language Processing …, 2017 - Springer
In the Arabic-speaking world, textual productions on social networks are often informal and
generally characterized by the use of various dialects, which can be transcribed in Latin or …

Which granularity to bootstrap a multilingual method of document alignment: character N-grams or word N-grams?

C Lecluze, L Rigouste, E Giguet, N Lucas - Procedia-Social and Behavioral …, 2013 - Elsevier
This article tackle multilingual automatic alignment. Alignment refers to the process by which
segments that are translation of one another are automatically matched. Instead of …