作者
Mike Donald Tapi Nzali, Amine Abdaoui, Jérôme Azé1 Sandra Bringay, Christian Lavergne, Caroline Mollevi, Pascal Poncelet
发表日期
2017
期刊
24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN)
页码范围
32
简介
Ce papier décrit le système FrenchSentiClass que nous avons utilisé pour les tâches du défi de fouilles de texte (DEFT 2017). Cette treizième édition du défi a porté sur l’analyse de l’opinion et du langage figuratif dans des tweets rédigés en Français. Le défi propose trois tâches:(i) la première concerne la classification des tweets non figuratifs selon leur polarité;(ii) la deuxième concerne l’identification du langage figuratif et (iii) la troisième concerne la classification des tweets figuratifs et non figuratifs selon leur polarité. Nous avons proposé un système automatisé basé sur les Machines à Vecteurs de Support (SVM). Le système choisit automatiquement à chaque niveau les meilleurs prétraitements, descripteurs syntaxiques et lexiques de sentiments en validation croisée sur l’ensemble d’apprentissage. Il effectue aussi une évaluation de l’apport de la sélection d’attributs et un tuning du paramètre de complexité du modèle SVM. Par conséquent, ce système permet de réduire considérablement le temps d’exploration des données et du choix de la meilleur représentation de descripteurs.
引用总数
20192020202120221111
学术搜索中的文章
MDT Nzali, A Abdaoui, JAS Bringay, C Lavergne… - 24e Conférence sur le Traitement Automatique des …, 2017