Accueil du site > Equipes > TALN

TALN

Traitement Automatique du Langage Naturel

Responsable

Béatrice DAILLE
Téléphone +33(0)2 51 12 58 54

Responsable Adjoint

Denis BECHET
Téléphone +33(0)2 51 12 57 74

Assistante

Annie LARDENOIS
Téléphone +33(0)2 51 12 58 70

L’équipe TALN

(en mai 2011 de gauche à droite : Annie TARTIER, Yukie NAKAO, Christine JACQUIN, Denis BECHET, Chantal ENGUEHARD, Alexandre DIKOVSKY, Sebastian PENA SALDARRIAGA, Annie LARDENOIS, Laura MONCEAUX-CACHARD, Emmanuel MORIN, Béatrice DAILLE, Jungyeul PARK, Amir HAZEM, Fabien POULARD, Jérôme ROCHETEAU, Prajol SHRESTHA, Matthieu VERNIER, Ramadan ALFARED et Nicolas HERNANDEZ - Absents Emmanuel DESMONTILS et Colin DE LA HIGUERA)

Présentation

Les travaux de l’équipe TALN s’inscrivent dans la thématique du traitement automatique des langues. Ils intègrent des recherches à caractère fondamental et des recherches appliquées aux langues naturelles dans leur spécificité et leur complexité. Les données langagières traités sont des données réelles : l’unité minimale est le texte pouvant être collecté à partir du web et regroupé en collection raisonnée : les corpus.

Les spécificités de l’équipe relèvent de la variété des données langagières traitées : productions langagières des domaines de spécialités, nouvelles formes de communications écrites (SMS), variété des supports communicationnels (Bloigs, réseaux sociaux), variété des langues (langues européennes, africaines, russe, japonaise), couplage avec d’autres médias.

Les thèmes de recherches de l’équipe sont :

  • Analyse et découverte
    • modèles formels de syntaxe et de la sémantique des langues
    • analyse syntaxique
    • analyse conjointe
    • analyse sémantique
    • production de ressources linguistiques : corpus, lexiques, grammaires
  • Alignement et comparaison
    • alignement multilingue
    • alignement monolingue
    • mesures de comparabilité des textes et des corpus

Ces thèmes coopèrent au sein de trois grands domaines applicatifs que sont le traitement du multilinguisme, de la multimodalité et la recherche d’informations.

Les réalisations logicielles de l’équipe s’effectuent au sein de la plate-forme logiciel UIMA. Les ressources linguistiques sont mises sous licence LGPLLR.

Dernière modification : lundi 27 février 2012