Accueil > Manifestations > Thèses et HDR > Thèses > Anthony Coutant

Anthony Coutant

Directeur de thèse

Philippe Leray
Hoël Le Capitaine

Résumé

Nous sommes entourés de données hétérogènes et interdépendantes. L’hypothèse i.i.d. a montré ses limites dans les algorithmes considérant des jeux de données tabulaires, constitués d’individus dotés du même domaine de définition et sans influence mutuelle. L’apprentissage relationnel statistique a pour objectif la représentation de connaissances, le raisonnement et l’apprentissage dans des contextes de jeux de données multi relationnels avec incertitude et les modèles graphiques probabilistes de second ordre sont une solution pour l’apprentissage génératif dans ce contexte. Nous étudions dans cette thèse un type de modèles graphiques probabilistes de second ordre dirigés, appelés modèles relationnels probabilistes, dans un contexte d’incertitude de références, c-a-d. où les individus d’un jeu de données peuvent présenter à la fois une incertitude sur la valeurs de leurs attributs descriptifs, et sur leurs implications dans des associations avec d’autres individus, et ayant la particularité de s’appuyer sur des fonctions de partitionnement des individus pour découvrir des connaissances générales. Nous présentons les limites des modèles existant pour l’apprentissage dans ce contexte et proposons des extensions présentant l’intérêt de pouvoir utiliser des méthodes de partitionnement relationnel, plus adaptées au problème, et proposant un biais de représentation simplifié autorisant la découverte de connaissances supplémentaires, notamment entre les différents types d’association du domaine de définition relationnel.

Mots-clés :

Apprentissage, Modèles Relationnels Probabilistes, Partitionnement, Incertitude de Références, Paradigme Multi-Relationnel

Composition du jury :

  • Christophe Gonzales, Professeur, Université Pierre & Marie Curie, Rapporteur
  • Julien Velcin, Maître de Conférences HDR, Université Lyon 2, Rapporteur
  • Rushed Kanawati, Maître de Conférences, Université Paris 13, Examinateur
  • Eric Gaussier, Professeur des Universités, Université Joseph Fourier, Examinateur
  • Philippe Leray, Professeur, Université de Nantes, Directeur de thèse
  • Hoël Le Capitaine, Maître de Conférences, Université de Nantes, Co-encadrant
  • Kamel Mekhanacha, Docteur Ingénieur, Proba Yes - Montbonnot Saint-Martin, Membre invité

Abstract :

We are surrounded by heterogeneous and interdependent data. The i.i.d. assumption has shown its limits in the algorithms considering tabular datasets, containing individualswith same data domain and without mutual influence on each other. Statistical relational learning aims at representing knowledge, reasoning, and learning in multi-relationaldatasets with uncertainty and lifted probabilistic graphical models offer a solution for generative leaming in this context. We study in this thesis a type of directed lifted graphical model, called probabilistic relational models, in the context of reference uncertainty, i.e. where datasefs individuals can have uncertainty over both their internal attributes description and their extemal mernberships in associations with others, having the particularity of relying on individuals partitioning functions in order to find out general knowledge.We show existing models’ limits for learning in this context and propose extensions allowing to use relational clustering methods, more adequate for the problem, and offering a less constrained representation bias permitting extra knowledge discovery, especially between associations types in the relational data domain.

Key words :

Apprentissage, Probabilistic Relational Models, Clustering, Reference Uncertainty, Multi-Relational Paradigm

Dernière modification : jeudi 29 octobre 2015