Langues : English français
Accueil > Manifestations > Thèses et HDR > Thèses > Thomas Cerqueus

Thomas Cerqueus

Directeur de thèse

Philippe Lamarre
Sylvie Cazalens

Résumé

Nous considérons des systèmes pair-à-pair (P2P) pour le partage de données dans lesquels chaque pair est libre de choisir l’ontologie qui correspond le mieux à ses besoins pour représenter ses données. Nous parlons alors d’hétérogénéité sémantique. Cette situation est un frein important à l’interopérabilité car les requêtes émises par les pairs peuvent être incomprises par d’autres.
Dans un premier temps nous nous focalisons sur la notion d’hétérogénéité sémantique. Nous définissons un ensemble de mesures permettant de caractériser finement l’hétérogénéité d’un système suivant différentes facettes.
Dans un deuxième temps nous définissons deux protocoles. Le premier, appelé CorDis, permet de réduire l’hétérogénéité sémantique liée aux disparités entre pairs. Il dissémine des correspondances dans le système afin que les pairs apprennent de nouvelles correspondances. Le second protocole, appelé GoOD-TA, permet de réduire l’hétérogénéité sémantique d’un système liée à son organisation. L’objectif est d’organiser le système de sorte que les pairs proches sémantiquement soient proches dans le système. Ainsi deux pairs deviennent voisins s’ils utilisent la même ontologie ou s’il existe de nombreuses correspondances entre leurs ontologies respectives.
Enfin, dans un trois temps, nous proposons l’algorithme DiQuESH pour le routage et le traitement de requêtes top-k dans les systèmes P2P sémantiquement hétérogènes. Cet algorithme permet à un pair d’obtenir les k documents les plus pertinents de son voisinage. Nous montrons expérimentalement que les protocoles CorDis et GoOD-TA améliorent les résultats obtenus par DiQuESH.

Mots clés : Système P2P, hétérogénéité, sémantique, ontologie, interopérabilité, recherche d’information.

Abstract

We consider peer-to-peer (P2P) data sharing systems in which each peer is free to choose the ontology that best fit its needs to represent its data. This is what we call semantic heterogeneity. This situation prevents from perfect interoperability because queries issued by peers may be misunderstood by other peers.
First we focus on the notion of semantic heterogeneity because it seems to us that it is a complex notion. We define several measures allowing to precisely characterize semantic heterogeneity of a P2P system according to different facets.
Second we define two protocols. The first one, called CorDis, allows to reduce semantic heterogeneity related to the disparities between peers. It disseminates correspondences in the system so that peers learn new correspondences. The second protocol, called GoOD-TA, allows to reduce semantic heterogeneity related to the topology of a system. The goal is to organize it in way that semantically close peers are close in the system. Thus two peers are neighbours if they use the same ontology, or if numerous correspondences exist between their respective ontologies.
Third we propose an algorithm called DiQuESH for the routing and the treatment of top-k queries in semantically heterogeneous P2P systems. This algorithm allows a peer to retrieve the k most relevant documents from its neighbourhood. We experimentally show that CorDis and GoOD-TA improve results obtained by DiQuESH.

Keywords : P2P system, heterogeneity, semantics, ontology, interoperability, information retrieval.

Composition du jury

  • Gabriel Antoniu, Directeur de recherche INRIA Rennes (examinateur)
  • Sylvie Calabretto, Professeur, Université de Lyon (rapporteur)
  • Marc Gelgon, Professeur, Université de Nantes (examinateur)
  • Abdelkader Hameurlain, Professeur, Université de Toulouse (rapporteur)
  • Sylvie Cazalens, Maître de conférence - Université de Nantes (co-encadrante)
  • Philippe Lamarre, Professeur, Université de Lyon (directeur)

Dernière modification : lundi 19 novembre 2012