Accueil > Equipes > TALN > Projets

Projets

Cette rubrique présente les différents projets technologiques et de recherche auxquels participent l’équipe TALN. Il s’agit de projets régionaux, nationaux et européens. Le LINA est le coordinateur de plusieurs de ces projets.

Projets en cours

CRISTAL (Contextes RIches en connaissanceS pour la TrAduction terminoLogique)

  • Période : 2012 - 2015
  • Type : ANR Contenus et Interactions 2011
  • Partenaires : CLLE-ERSS, FTI, LINA et Lingua & Machina
  • Objectifs : L’objectif du projet CRISTAL est de développer une technologie d’extraction de contextes riches en connaissances (CRC) permettant de produire un véritable dictionnaire d’entreprise, qui documente, traduit et facilite l’accès à toutes les expressions propres à cette entreprise et aux termes techniques liés à son domaine d’activité.
  • Pour en savoir plus : Page d’informations

GOLEM (Approche par Optimisation pour l’Extraction de Mots-clés)

  • Période : 2015
  • Type : CNRS PEPS INS2I/INSMI
  • Partenaires : LINA (Coordinateur), IRCCyN
  • Objectifs : Les mots-clés sont utilisés pour indexer et catégoriser les documents. Ils permettent, entre autres, de naviguer efficacement dans de grandes collections de documents. Malheureusement, très peu de documents en sont pourvus. Face à un volume des données numériques disponibles en perpétuelle augmentation, le besoin de méthodes performantes pour l’extraction automatique de mots-clés se fait de plus en plus ressentir. Une des faiblesses des méthodes existantes est l’absence de cohérence de l’ensemble de mots-clés extraits. L’ambition du projet GOLEM est de résoudre ce problème en proposant une approche originale empruntant des techniques issues du domaine de l’optimisation. Plus précisément, GOLEM vise le développement de méthodes capables de maximiser à la fois la pertinence des mot-clés extraits et les relations sémantiques qui les relie.
  • Pour en savoir plus : Page d’informations

LIMAH (Linking Media in Acceptable Hypergraphs)

  • Période : 2014 - 2017
  • Type : CominLabs
  • Partenaires : INRIA Rennes (Coordinateur), LINA, IODE, CRPCC, PREFics
  • Objectifs : Le projet LIMAH a pour but
    d’explorer les structures d’hypergraphes pour représenter des
    collections multimédias hétérogènes en instanciant des liens entre
    fragments de documents. Les liens visés reflètent des proximités de
    contenu entre la source et la cible : contenu similaire, proximité
    thématique, expression d’une opinion, réponse à une question, etc.
    LIMAH se penche sur deux aspects de la structuration par hypergraphes
    de collections multimédias à partir du contenu : Comment construire
    automatiquement, par analyse du contenu, une structure d’hypergraphe
    fournissant des liens exploitables dans différents cas d’usage ?
    Comment l’existence de liens explicites dans les collections
    multimédias modifie les usages, que ce soit du point de vue des
    technologies ou du point de vue des utilisateurs. LIMAH s’appuie sur un
    consortium pluridisciplinaire, mélant technologie (CNRS/IRISA, Univ.
    Nantes/LINA), droit (Télécom Bretagne/IODE), sociologie (Univ. Rennes
    2/PREFics) et psychologie expérimentale (Univ. Rennes 2/CRPCC), pour
    appréhender la question des médias liés et de leurs usages dans une
    vision globalisée.
  • Pour en savoir plus : Page d’informations

ODISAE (Optimizing Digital Interaction with a Social and Automated Environment)

  • Période : 2014 - 2016
  • Type : FUI 17
  • Partenaires : EPTICA, Jamespot, Cantoche, Kwaga, APROGED, LINA
  • Objectifs : Le projet ODISAE a pour objectif de réaliser un analyseur sémantique de conversations en ligne entre agents et clients (par chat, email ou sur un forum) et de l’utiliser pour enrichir un système de gestion de la relation client de fonctionnalités sémantiques visant à qualifier les conversations avec plusieurs propriétés : statut (cet échange est-il un succès ou un échec ?), tonalité ((in)satisfaction, agressivité, plaisir, …), thèmes (thématiques abordées dans cet échange) structure (évolution de la conversation au fil du temps).
  • Pour en savoir plus : Page d’informations Ressources locales

TERMITH (Terminologie et indexation de textes en sciences humaines)

  • Période : 2012 - 2016
  • Type : ANR Contenus et Interactions 2011
  • Partenaires : ATILF (Coordinateur), LINA, INRIA Nancy et Saclay, LILIDEM, INIST
  • Objectifs : TermITH s’intéresse à l’accès à l’information des documents numériques par le biais d’une indexation fondée sur les termes qu’ils contiennent, ce qui suppose reconnaissance, désambiguïsation et analyse des termes.
    La démarche développée par TermITH suppose de croiser des occurrences désambiguïsées de termes candidats avec des lexiques transdisciplinaires et les ressources terminologiques disponibles pour isoler les termes propres au domaine étudié.
  • Pour en savoir plus : Page d’informations

Projets achevés

DiLAF (Dictionnaires Langue Africaine - Français)

  • Période : 2011 - 2014
  • Type : Organisation Internationale de la Francophonie
  • Partenaires : * CNR-ENF : Centre National de Ressources de l’Éducation Non Formelle * CNRST : Centre National de la Recherche Scientifique et Technique * INDRAP : Institut National de Documentation de Recherche et d’Animation Pédagogiques * LIG : Laboratoire d’Informatique de Grenoble * MEN : Ministère Éducation Nationale du Niger * Université de Nantes * Université Abdou Moumouni de Niamey
  • Objectifs : * Elaboration d’une méthodologie de conversion de dictionnaires éditoriaux vers des dictionnaires électroniques LMF * mise en ligne de cinq dictionnaires : bambara, haoussa, kanouri, tamajaq, zarma.
  • Pour en savoir plus : Page d’informations
  • Ressources

TTC (Terminology Extraction, Translation Tools and Comparable Corpora)

  • Période : 2010 - 2012
  • Type : FP7 STREP
  • Partenaires : Le Laboratoire Informatique de Nantes-Atlantique (Coordinateur), Universität Stuttgart, University of Leeds, Sogitec Industries, Syllabs, Tilde et Eurinnov.
  • Objectifs : Vers l’automatisation de la production de terminologie multilingue à partir de corpus comparable pour la traduction automatique et les outils d’aide à la traduction
  • Pour en savoir plus : www.ttc-project.eu
  • Ressources développées au LINA

DEPART (Documents Ecrits et Paroles – Reconnaissance et Traduction)

  • Période : 2009 - 2012
  • Type : projet régional des Pays de la Loire relevant du volet « développement des thématiques structurées et des spécialités scientifiques »
  • Partenaires : Le Laboratoire Informatique de Nantes-Atlantique (Coordinateur), le Laboratoire Informatique de l’Université du Maine (LIUM) et l’Institut de Recherche en Communications et Cybernétique de Nantes (IRCCyN).
  • Objectifs : Ce projet vise la constitution au niveau de la région des Pays de la Loire d’un pôle de compétences unique en France associant analyse du signal audio et manuscrit au traitement automatique des langues. Il s’intéresse plus particulièrement à la résolution de problèmes scientifiques et technologiques difficiles mettant en jeu des données multimodales et multilingues.
  • Pour en savoir plus : www.projet-depart.org

MeTRICC (MEmoire de Traduction, Recherche d’Information et Corpus Comparables)

  • Période : 2009 - 2011
  • Type : ANR, CONTINT’2008
  • Partenaires : Le Laboratoire Informatique de Nantes-Atlantique (Coordinateur), le Laboratoire d’Informatique de Grenoble (LIG), les entreprises Lingua et Machina, Sinequa et Syllabs ainsi que le Laboratoire de Recherche en Informatique de l’Université de Bretagne Sud (VALORIA).
  • Objectifs : Le projet MeTRICC vise à utiliser des corpus comparables en vue de l’extraction de lexiques multilingues dans le cadre des mémoires de traduction et de la recherche d’informations interlingue.
  • Pour en savoir plus : www.metricc.com

C-Mantic (Méthodologie et Outils pour l’Application de la Sémantique de Corpus au Filtrage de Masses Documentaires)

  • Période : 2008-2010
  • Type : ANR “Masse de données et Connaissances”
  • Partenaires : ERTIM, LIMSI, LINA, INSERM
  • Objectifs : Le projet C-Mantic vise à élaborer une méthodologie inédite de détection de l’information et d’organisation des masses de données documentaires dans une perspective multilingue. La méthode proposée est fondée sur une analyse sémiotique et linguistique approfondie prenant en considération l’ensemble des critères textuels et non pas seulement les mots-clés.

Blogoscopie Analyse d’image et de tendance sur les blogs

  • Période : 2006 - 2008
  • Type : ANR, Technologies logicielles, exploratoire
  • Partenaires : LINA, Over-Blog, Synequa, Sylabs
  • Objectifs : Les blogs sont aujourd’hui au coeur de l’actualité : ils prennent une importance de plus en plus grande. Lus par une population de blogers qui représente assez bien la population globale, ils couvrent toute l’étendue de la production de l’information. Il s’agit d’un nouveau pouvoir informationnel qui est capable d’influencer les opinions des gens. Le but de ce projet est de développer des outils de surveillance des blogs qui permettent d’effectuer, automatiquement, deux tâches. La première est l’étude d’image. Elle veut créer une photographie de ce que pense le public d’une certaine personne, d’un organisme, etc. à un moment donné. La deuxième tâche est l’étude de tendance qui veut déterminer, par exemple, les sujets émergents, l’état d’humeur d’une certaine population, l’évolution des sentiments vis à vis d’une certaine personne, organisme, etc.
  • Pour en savoir plus : Réalisations du LINA

CIEL (Conversion Indexation de l’Ecriture en Ligne)

  • Période : 2007 - 2009
  • Type : ANR Technologies Logicielles
  • Partenaires : Le Laboratoire Informatique de Nantes-Atlantique, l’Institut de Recherche en Communications et Cybernétique de Nantes (IRCCyN - Coordinateur) et la société Vision Objects.
  • Objectifs : Le projet CIEL est ouvert sur les nouvelles formes de communication écrite manuscrite qui sont rendues possibles grâce à l’émergence de nouveaux dispositifs de saisie ultra-légers (stylo digitaux avec processeurs embarqués, stylos digitaux + téléphone, Smartphones etc.). Il propose le développement de modèles, méthodes et systèmes de traitement pour appréhender un nouveau média : les documents manuscrits en-ligne. Il ouvre au monde du document papier la puissance de traitement du document électronique.
  • Pour en savoir plus : ciel.irccyn.ec-nantes.fr

MILES

  • Période : 2007 - 2009
  • Type : projet régional "Pays de Loire"
  • Partenaires : entre autres le LINA et le LIUM
  • Objectifs : Le projet MILES participe à la création d’un pôle européen de recherche en STIC dans l’Ouest de la France. Interdisciplinaire, MILES est porté par la fédération de recherche AtlanSTIC. L’équipe TALN du LINA intervient dans l’axe gestion de données multimédia du projet et en particulier sur la problématique de l’analyse conjointe de données multimédia telle que la reconnaissance des locuteurs dans des documents audio (langage naturel et traitement de la parole).
  • Pour en savoir plus : Réalisations du LINA

PIITHIE (Plagiat et Impact de l’Information Textuelle recHerchée dans un contexte InterlinguE)

  • Période : 2006 - 2008
  • Type : ANR Technologies Logicielles
  • Partenaires : Advestigo, LIA, LINA, Synequa, Sylabs
  • Objectifs : Le projet Piithie s’inscrit dans un mouvement de plus en plus important de maîtrise de l’information diffusée. Il vise premièrement la détection de plagiats de textes. Les techniques de traitement automatique des langues (TAL), devraient permettrent d’améliorer les performances et d’accroître le potentiel de recherche des outils d’Advestigo et de Sinequa. Le deuxième objectif concerne le suivi d’impact : les diffuseurs d’information sont très intéressés par la possibilité d’évaluer l’mpact de leur production. Aujourd’hui cette évaluation est faite par une étude manuelle alors que des méthodes automatiques sont possibles.