Langues : English français
Accueil > Equipes > DUKe > Equipe COD

Equipe COD

Présentation de l’équipe

Avec comme objectif opérationnel in fine la diffusion de connaissances utiles et intelligibles pour l’utilisateur -ou les classes d’utilisateurs-, les travaux de l’équipe s’inscrivent dans un continuum "modélisation-extraction" des connaissances. Ils se structurent autour de deux axes fortement corrélés l’Ingénierie des ontologies et la Fouille de données complexes, et un axe transversal portant sur l’Intégration des préférences des utilisateurs.

Les ambitions affichées conjointement par l’Ingénierie des Connaissances et la Fouille de Données sont en partie empiriques : elles visent l’efficience dans un environnement régulé par des usages et des pratiques. Par conséquent, une part des travaux est intimement liée aux applications. Nous développons depuis plusieurs années des relations interdisciplinaires étroites dans deux champs disciplinaires : en Sciences Economiques et Management et en Sciences de la Vie.

Axes de recherche

Ingénierie des ontologies

Nos travaux portent sur la représentation conceptuelle des connaissances par des ontologies, et sur leur opérationnalisation dans des Systèmes à Base de Connaissances. Trois problématiques principales sont ainsi abordées :

  • la construction au sens de leur représentation formelle : nous étudions en particulier l’apport des modèles de graphes conceptuels et l’expressivité des langages du Web sémantique (e.g. RDF/s, OWL) ;
  • l’alignement au sens de l’interopérabilité sémantique : nos travaux portent sur les ontologies lourdes qui intègrent la sémantique du domaine sous forme d’axiomes, et sur les taxonomies associées ou non à des corpus textuels ;
  • l’intégration des ontologies au sein de Systèmes à Base de Connaissances : nous nous intéressons en particulier à l’acquisition des connaissances et à leur modélisation via des modèles graphiques interactifs adaptés. Les ontologies considérées sont des ontologies de domaine, des ontologies de représentation et des ontologies de PSM (Problem-Solving Method).

Fouille de données complexes

Tout en incorporant l’intégration des connaissances externes et la dimensionnalité des données, la terminologie "données complexes" recouvre dans son usage le plus courant des données de nature différente (texte, image, vidéo, ...). Nous l’utilisons dans une acceptation plus spécifique ; nous nous intéressons dans le cadre du "post-mining" aux données qui sont des résultats volumineux d’algorithmes automatiques, et aux données intégrant des structures relationnelles modélisables par des graphes.

  • le post-mining de règles d’association.
    Les règles d’association ont été un des concepts les plus utilisés de la dernière décennie pour exprimer simplement des tendances implicatives de type A --> B entre des sous-ensembles d’attributs. Il est maintenant bien connu que les algorithmes d’extraction engendrent des ensembles de règles trop volumineux pour une analyse in extenso de l’utilisateur. Nous abordons ce problème par deux approches complémentaires : le filtrage des règles pour restreindre les résultats aux règles les plus pertinentes ; la structuration des ensembles de règles pour une représentation synthétique mettant en évidence les principales relations.
  • la classification de structures relationnelles.
    Trouvant principalement leur motivation applicative dans des travaux sur la Toile, la majorité des travaux actuels en "Link Analysis" considèrent comme données un très grand réseau de relations et cherchent à en extraire les caractéristiques. Nous nous intéressons à un problème connexe : l’analyse, non plus d’un grand graphe unique, mais d’un corpus de graphes. Il s’agit alors de construire, dans un cadre non supervisé, des classifications qui intègrent à la fois des propriétés combinatoires, des propriétés sémantiques -ou fonctionnelles- et parfois aussi des propriétés topologiques lorsque les graphes sont plongés dans des espaces géométriques.

L’intégration des préférences

L’objectif général est d’intégrer l’utilisateur dans la ’’boucle de découverte’’ afin de combiner les potentialités humaines de jugement avec les capacités de calcul des machines. Nous abordons cette vaste problématique selon deux optiques : la mise au point de modèles développés dans le cadre de l’Aide Multicritère à la Décision qui représentent numériquement des préférences à un utilisateur ; le pilotage des algorithmes par l’utilisateur -qui joue alors le rôle d’une heuristique- via des interfaces visuelles interactives adaptées.

  • Aide Multicritère à la Décision.
    Cette approche vise à prendre en compte simultanément différents points de vue. Notre démarche se place dans le cadre des méthodes d’utilité multiattribut : chaque alternative est synthétisée en un score global par agrégation des différents points de vue, et le choix d’une alternative se déduit d’une comparaison des scores. Un des intérêts majeurs de cette approche est de pouvoir représenter une grande variété de stratégies grâce à l’étendue des fonctions d’aggrégation. Nos travaux portent en particulier sur l’analyse de ces fonctions.
  • Visualisation interactive.
    Cette approche vise à intégrer la part subjective de l’utilisateur difficile à verbaliser préalablement. Lorsqu’il dispose d’un système interactif, la démarche de l’utilisateur peut être associée à une stratégie de navigation dans un environnement complexe, qui se situe dans un continuum entre la requête (but précis et bien défini) et le butinage (besoin mal exprimé initialement qui le conduit à poursuivre sa recherche jusqu’à une certaine satisfaction). Dans le cadre de la fouille de règles d’association, nous nous intéressons aux représentations formelles permettant de définir l’espace de navigation ; aux représentations visuelles associées (graphes, métaphores graphiques) ; et à l’implémentation interactive d’un processus de fouille.

Dernière modification : mardi 28 janvier 2014