Accueil > Manifestations > Thèses et HDR > HDR > Christine Sinoquet

Christine Sinoquet

Résumé

Ce mémoire présente les activités de recherche que j’ai menées depuis 2002. Toujours centrées sur la bioinformatique, mes activités se sont déplacées de la seule algorithmique à l’intelligence artificielle, à partir de 2008. Sont particulièrement mis en lumière deux types d’activités, relevant respectivement de l’optimisation combinatoire et de l’apprentissage automatique. D’une part, dans le domaine de la recherche de motif commun à des séquences biologiques, je me suis notamment intéressée à la conception de méthodes heuristiques dédiées. Ces travaux se sont concrétisés par la mise au point d’une méthode hybride, intégrant un processus constructif et un processus évolutif. D’autre part, introduisant une rupture totale dans la complexité des problèmes abordés jusqu’alors dans mes activités, mes travaux se sont ensuite focalisés sur les études d’association pangénomiques. Ces études visent à identifier les facteurs génétiques responsables de maladies génétiques, à l’échelle du génome, à partir de cohortes malades / non malades. Dans ce cadre, au carrefour entre théorie des graphes et théorie des probabilités, une nouvelle classe spécifique de modèles graphiques probabilistes a été proposée. Ce type de modèle, ou forêt de modèles hiérarchiques à variables latentes, est dédié à la modélisation de données complexes, de grande dimension, et fortement corrélées. Cette modélisation a facilité la conception d’un algorithme d’apprentissage qui passe à l’échelle. Cette avancée a alors rendu possible la modélisation des données génétiques décrivant une population à l’échelle du génome. Enfin, la pertinence de l’utilisation de ce modèle pour réaliser des études d’association génotype-phénotype a été démontrée sur des données simulées et réelles.

Un fil conducteur relie les deux activités particulièrement mises en exergue dans le mémoire : traitant des problèmes de fouilles de données complexes, elles recourent à diverses stratégies pour parcourir efficacement l’espace de recherche. Le troisième volet du mémoire présente plus rapidement une sélection de mes autres activités de recherche. Ce spectre englobe la correction de données de phylogénie, la génomique comparative centrée sur les promoteurs forts potentiels des procaryotes, la modélisation de réseaux de régulation de gènes, l’imputation de données génétiques et la simulation réaliste de données génétiques. Trois de ces contributions sont étroitement liées aux deux thématiques développées ci-dessus. La plupart des contributions évoquées dans ce mémoire a abouti à la mise au point d’algorithmes validés sur données réelles ou simulées. La grande majorité de ces contributions a donné lieu à d’étroites collaborations interdisciplinaires avec des biologistes, des statisticiens épidémiologistes et des mathématiciens appliqués.

Composition du jury :

  • Jean-Daniel Zucker, Rapporteur
  • Christel Vrain, Rapporteur
  • Alain Viari, Rapporteur
  • Thomas Schiex, Examinateur
  • Christine Froidevaux, Examinateur
  • Marc Gelgon, Examinateur
  • Jin-Kao Hao, Examinateur
  • Bernard Offmann, Examinateur
  • Louis Wehenkel, Examinateur
  • Philippe Leray, Membre invité
  • Philippe Besnard, Membre invité



Dernière modification : vendredi 5 septembre 2014