COMBI COMbinatoire et Bio-Informatique
ResponsableIrena RUSU-ROBINI | Responsable AdjointGuillaume FERTIN |
AssistanteAnnie LARDENOIS | |
Notre travail porte actuellement sur deux types de modèles :
Un système biologique est souvent décrit par un réseau d’interactions. On parle ainsi de réseau de régulation de gènes, de réseau d’interaction protéines-protéines, de réseau métabolique etc. Vu comme un graphe, chacun de ces réseaux représente une vue statique d’un aspect de la vie cellulaire, indiquant quels sont les acteurs et comment ils interagissent deux à deux. Pour que le mécanisme des interactions puisse être compris, ces réseaux doivent être vus dans un contexte dynamique, où des informations qualitatives, quantitatives et temporelles sont représentées simultanément et participent simultanément à la dynamique du système. Nous sommes à l’étude d’une approche originale des systèmes dynamiques (et plus particulièrement du réseau de régulation de gènes) à l’aide d’un modèle combinant une approche probabiliste et une approche par contraintes mixtes.
Les expériences biologiques permettent d’appréhender deux caractéristiques particulières des systèmes vivants : (i) le génotype ou la distribution des gènes dans un génome et (ii) le phénotype ou les caractéristiques fonctionnelles du vivant. Il existe différents travaux qui permettent de calculer la distance entre 2 gènes en se basant sur l’ordre dans lequel sont disposés les gènes dans un génome. Cette distance représente une abstraction de la caractéristique (i). Par ailleurs, il existe diverses descriptions des chemins que parcourt un signal biologique dans un graphe orienté qu’est le réseau d’interactions macromoléculaires. La distance parcourue par le signal pour aller d’un gène vers un autre est alors une abstraction de la caractéristique (ii). Bien qu’issues d’expériences de nature différentes, les deux abstractions concernent le même système vivant que l’on veut mieux comprendre. Comparer les deux distances, à savoir génotype et phénotype, est l’un de nos défis.
Collaborations : R. Houlgatte (Institut du Thorax du CHU de Nantes), O. Roux (IRCCYN).
On cherche ici à comparer des génomes entre eux, et notamment à les comparer deux à deux. Dans ce cas, il faut déterminer une mesure (i.e., un nombre) qui permet d’évaluer, à travers leurs génomes, la proximité (ou non) des deux espèces étudiées. Ces mesures doivent pouvoir capturer le fait qu’au cours de l’évolution biologique, des échanges, des inversions, des apparitions ou des disparitions de fragments existent le long du génome ; autant de phénomènes qui entraînent donc une modification du nombre et de l’ordre des gènes dans un génome.
Deux grandes problématiques émergent à l’heure actuelle :
L’annotation des chromosomes d’un génome comme un ensemble ordonné de gènes peut fournir des ordres différents en fonction de la technique utilisée pour cette annotation. La déduction d’un ordre unique, qui représente le génome lors de comparaisons avec d’autres génomes, s’appelle linéarisation. La linéarisation engendre des problèmes (comme l’élimination d’imprécision et la résolution des contradictions dans les divers ordres de gènes fournis) dont la difficulté dépend fortement du critère retenu pour identifier le "bon" ordre.
Collaborations : R. Long (Texas A&M), S. Vialette (IGM).
Cette démarche se heurte à beaucoup de difficultés qui sont à la fois d’ordre biologique et informatique, même pour une protéine connue (présente dans les banques). D’autant plus, lorsque la protéine n’est pas connue et, de surcroît, lorsqu’on ne cherche pas à identifier une protéine mais toutes les protéines d’un complexe, la démarche n’est plus valable et a besoin d’une alternative. C’est à cette alternative que nous nous intéressons.
Collaborations : D. Tessier (INRA Nantes)