Accueil > Manifestations > Thèses et HDR > Thèses > Luis Daniel Ibanez Gonzalez

Luis Daniel Ibanez Gonzalez

Directeur de thèse

Pascal Molli
Hala Skaf

Résumé

L’initiative « Web des données » a mis en disponibilité des millions des données pour leur interrogation par une fédération de participants autonomes. Néanmoins, le Web des Données a des problèmes de hétérogénéité et qualité. Nous considérons le
problème d’hétérogèneité comme une médiation « Local-as-View » (LAV). Malheureusement, LAV peut avoir besoin d’exécuter un certain nombre de « reformulations » exponentiel dans le nombre de sous-objectifs d’une requête. Nous proposons l’algorithme « Graph-Union » (GUN) pour maximiser les résultats obtenus á partir d’un sous-ensemble de reformulations. GUN réduit le temps d’exécution et maximise les résultats en échange d’une utilisation de la mémoire plus élevée. Pour permettre aux participants d’améliorer la qualité des données, il est nécessaire de faire évoluer le Web des Données vers Lecture-Écriture, par contre, l’écriture mutuelle des données entre participants autonomes pose des problèmes de cohérence. Nous modélisons le Web des Données en Lecture -Écriture comme un réseau social où les acteurs copient les données que leur intéressent, les corrigent et publient les mises à
jour pour les échanger. Nous proposons deux algorithmes pour supporter cet échange : SU-Set, qui garantit la Cohérence Inéluctable Forte (CIF), et Col-Graph, qui garantit la Cohérence des Fragments, plus forte que CIF. Nous étudions les complexités des
deux algorithmes et nous estimons expérimentalement le cas moyen de Col-Graph, les résultats suggèrant qu’il est faisable pour des topologies sociales.

Composition du jury :

  • Johan MONTAGNAT, Directeur de Recherche, CNRS, Rapporteur
  • Esther PACITTI, Professeur, Université Montpellier 2, Rapporteuse
  • Marc GELGON, Professeur, Polytech Nantes, Examinateur
  • Philippe LAMARRE, Professeur, INSA Lyon, Examinateur
  • Pascal MOLLI, Professeur, Université de Nantes, Directeur de thèse
  • Hala Skaf-Molli, Maître de Conferences Université de Nantes, Co-encadrante
  • Olivier Corby, Chargé de Recherche, INRIA Sophia-Antipolis Méditerranée, Co-encadrant
  • Maria-Esther VIDAL, Professeur, Universidad Simón Bolívar - Venezuela, Invitée

Abstract :

The Linked Data initiative has made available millions of pieces of data for querying through a federation of autonomous participants. However, the Web of Linked data suffers of problems of data heterogeneity and quality. We cast the problem of integrating heterogeneous data sources as a Local-as-View mediation (LAV) problem, unfortunately, LAV may require the execution of a number of “rewritings” exponential on the number of query subgoals. We propose the Graph-Union (GUN) strategy to maximise the results obtained from a subset of rewritings. Compared to traditional
rewriting execution strategies, GUN improves execution time and number of results obtained in exchange of higher memory consumption. Once data can be queried data consumers can detect quality issues, but to resolve them they need to write on the data of the sources, i.e., to evolve Linked Data from Read/Only to Read-Write. However, writing among autonomous participants raises consistency issues. We model the Read-Write Linked Data as a social network where actors copy the data they are interested into, update it and publish updates to exchange with others. We
propose two algorithms for update exchange : SU-Set, that achieves Strong Eventual Consistency (SEC) and Col-Graph, that achieves Fragment Consistency, stronger than SEC. We analyze the worst and best case complexities of both algorithms and estimate experimentally the average complexity of Col-Graph, results suggest that is feasible for social network topologies.

Dernière modification : lundi 16 février 2015