Traitement du langage naturel français
Publications

Les travaux entrepris en anlayse de textes sont basés sur LIMA, l'analyseur multilingue du CEA LIST, un outil puissant et modulaire capable de réaliser des analyses syntaxiques et d'extraire des entités nommées en 9 langues (anglais, français, allemand, espagnol, italien, russe, arabe, chinois et hongrois).

nlp

Cet analyseur regroupe des travaux sur plusieurs thématiques en lien avec le Traitement Automatique du Langage Naturel (TALN).

Par exemple, LIMA est utilisé dans notre plateforme de recherche de documents multimédia et multilingues et demeure aussi le coeur des activités de recherche sur la classification supervisée et non-supervisée. Il comprend des développements en analyse linguistique, incluant la construction semi-automatique d'ontologies, l'acquisition de ressources sémantiques (terminologies, carte sémantique, ressources de type FrameNet ou Wordnet) et le développement d'annotateurs sémantiques pour de la désambiguïsation ou l'étiquetage de rôle sémantique (Semantic Role Labeling). Enfin, LIMA est utilisé dans des applications comme le Résumé Automatique ou les systèmes Question / Réponse.