Accueil du site > Equipes > COMBI

COMBI

COMbinatoire et Bio-Informatique

Responsable

Irena RUSU-ROBINI
Téléphone +33(0)2 51 12 58 16

Responsable Adjoint

Guillaume FERTIN
Téléphone +33(0)2 51 12 58 14

Assistante

Annie LARDENOIS
Téléphone +33(0)2 51 12 58 70

Thématique Biologie des systèmes et réseaux biologiques

Les connaissances biologiques augmentent à une vitesse sans précédent, et font souvent référence à un aspect particulier du mécanisme de la vie. La biologie des systèmes (ou biologie systémique) vise à intégrer les connaissances biologiques provenant de sources hétérogènes, dans le but de comprendre le réseau d’interactions très complexe entre les molécules. L’outil indispensable pour atteindre ce but est la construction de modèles capables de capter les caractéristiques et de simuler le fonctionnement simultané de plusieurs systèmes identifiés (mais non-indépendants) d’un organisme vivant.

Notre travail porte actuellement sur deux types de modèles :

Les systèmes dynamiques

Un système biologique est souvent décrit par un réseau d’interactions. On parle ainsi de réseau de régulation de gènes, de réseau d’interaction protéines-protéines, de réseau métabolique etc. Vu comme un graphe, chacun de ces réseaux représente une vue statique d’un aspect de la vie cellulaire, indiquant quels sont les acteurs et comment ils interagissent deux à deux. Pour que le mécanisme des interactions puisse être compris, ces réseaux doivent être vus dans un contexte dynamique, où des informations qualitatives, quantitatives et temporelles sont représentées simultanément et participent simultanément à la dynamique du système. Nous sommes à l’étude d’une approche originale des systèmes dynamiques (et plus particulièrement du réseau de régulation de gènes) à l’aide d’un modèle combinant une approche probabiliste et une approche par contraintes mixtes.

Les graphes d’interactions pondérés

Les expériences biologiques permettent d’appréhender deux caractéristiques particulières des systèmes vivants : (i) le génotype ou la distribution des gènes dans un génome et (ii) le phénotype ou les caractéristiques fonctionnelles du vivant. Il existe différents travaux qui permettent de calculer la distance entre 2 gènes en se basant sur l’ordre dans lequel sont disposés les gènes dans un génome. Cette distance représente une abstraction de la caractéristique (i). Par ailleurs, il existe diverses descriptions des chemins que parcourt un signal biologique dans un graphe orienté qu’est le réseau d’interactions macromoléculaires. La distance parcourue par le signal pour aller d’un gène vers un autre est alors une abstraction de la caractéristique (ii). Bien qu’issues d’expériences de nature différentes, les deux abstractions concernent le même système vivant que l’on veut mieux comprendre. Comparer les deux distances, à savoir génotype et phénotype, est l’un de nos défis.

Collaborations : R. Houlgatte (Institut du Thorax du CHU de Nantes), O. Roux (IRCCYN).

Thématique Génomique Comparative

Les génomes d’un grand nombre d’espèces sont désormais entièrement séquencés, et, la technologie aidant, le phénomène s’accélère de façon soutenue. Etre capable de comparer efficacement deux ou plusieurs génomes est donc la clé (entre autres) de la compréhension de la proximité entre les espèces (en définissant des distances inter-espèces), de l’identification de fonctionnalités ou de pathologies par similarité locale ou globale, de l’interprétation des réarrangements génomiques etc.

Mesures de (dis)similarité entre Génomes

On cherche ici à comparer des génomes entre eux, et notamment à les comparer deux à deux. Dans ce cas, il faut déterminer une mesure (i.e., un nombre) qui permet d’évaluer, à travers leurs génomes, la proximité (ou non) des deux espèces étudiées. Ces mesures doivent pouvoir capturer le fait qu’au cours de l’évolution biologique, des échanges, des inversions, des apparitions ou des disparitions de fragments existent le long du génome ; autant de phénomènes qui entraînent donc une modification du nombre et de l’ordre des gènes dans un génome.
Deux grandes problématiques émergent à l’heure actuelle :

  • Proposer des modèles de mesure, qui soient les plus pertinents et représentatifs possibles (notamment, des modèles autorisant insertions et suppressions, qui prennent en compte les duplications de gènes dans les génomes, ou encore qui permettent de comparer des génomes multichromosomiques)
  • Proposer des méthodes de calcul de ces mesures, puisque, pour toutes les mesures ’’classiques’’ existantes (breakpoints, inversions, etc.), le calcul de la mesure devient algorithmiquement difficile, en particulier dès que des duplications de gènes apparaissent.

Linéarisation de cartes génomiques

L’annotation des chromosomes d’un génome comme un ensemble ordonné de gènes peut fournir des ordres différents en fonction de la technique utilisée pour cette annotation. La déduction d’un ordre unique, qui représente le génome lors de comparaisons avec d’autres génomes, s’appelle linéarisation. La linéarisation engendre des problèmes (comme l’élimination d’imprécision et la résolution des contradictions dans les divers ordres de gènes fournis) dont la difficulté dépend fortement du critère retenu pour identifier le "bon" ordre.

Collaborations : R. Long (Texas A&M), S. Vialette (IGM).

Thématique Identification de protéines par MS/MS

La spectrométrie de masse en tandem est une technique qui permet l’identification d’une protéine par découpage successif de la protéine en peptides et puis des peptides en fragments, dont les masses sont représentées graphiquement forme de spectres. En interprétant le spectre de chaque peptide on déduit la suite d’acides aminés formant le peptide, et en recherchant les peptides identifiés dans une banque de protéines on identifie la protéine recherchée.

Cette démarche se heurte à beaucoup de difficultés qui sont à la fois d’ordre biologique et informatique, même pour une protéine connue (présente dans les banques). D’autant plus, lorsque la protéine n’est pas connue et, de surcroît, lorsqu’on ne cherche pas à identifier une protéine mais toutes les protéines d’un complexe, la démarche n’est plus valable et a besoin d’une alternative. C’est à cette alternative que nous nous intéressons.

Collaborations : D. Tessier (INRA Nantes)

Les logiciels de ComBi

Dernière modification : lundi 27 février 2012