Aller au contenu

Un des textes gagnants du Concours de vulgarisation scientifique 2021

Le nombre de copies : sur les traces du tueur silencieux

Alitzel López Sánchez est étudiante à la maîtrise en informatique
Alitzel López Sánchez est étudiante à la maîtrise en informatique
Photo : Fournie

Le cancer, ce tueur silencieux, est une maladie qui commence par le développement chaotique de certaines cellules. En temps normal, le corps décide quand les cellules sont produites et en quelle quantité. Les cellules cancéreuses veulent quant à elles se reproduire indéfiniment, mais le corps est incapable de les arrêter. À cause de cette production acharnée, les cellules s’agglomèrent pour former une masse appelée tumeur. Pour comprendre comment une unique cellule maligne peut évoluer en tumeur, on fait appel à la phylogénie, branche de la biologie de l’évolution qui consiste à étudier les liens entre des individus au fil du temps.

Trouver ces liens, c’est comme élucider un crime mystérieux; on prend des photos de la scène du crime (l’ADN des cellules tumorales) et on les examine ensuite pour déduire le fil des événements qui se sont produits. Pour mener à bien cette enquête, le professeur Manuel  Lafond et son équipe ont proposé, dans BMC Genomics, un nouveau modèle qui reconstitue le fil des événements à l’aide de l’empreinte numérique laissée par les gènes des cellules concernées. En faisant appel à la phylogénie pour étudier les mécanismes du cancer, on peut non seulement comprendre, mais aussi prédire, voire de contrôler la progression de la maladie et l’empêcher de s’étendre à d’autres parties du corps.

Le nombre de copies : un indice parlant

Commençons par examiner les pièces à conviction. Chaque cellule de notre corps comporte un certain nombre de copies de chaque gène. Le nombre de copies par gène dans une cellule s’appelle le profil du nombre de copies (ou CNP pour Copy Number Profile). Comme les cellules cancéreuses se reproduisent indéfiniment, elles engendrent de nombreuses cellules qui ont chacune des traits de personnalité particuliers. Le CNP est l’un de ces traits : les enfants d’une cellule peuvent avoir plus (amplification) ou moins (suppression) de copies d’un gène. Pour mesurer la similarité entre deux cellules, on peut compter le nombre de mutations nécessaire pour expliquer les différences dans leur CNP respectif. En comparant les CNP, on obtient la distance d’évolution entre les cellules, laquelle peut ensuite servir à déduire tous les liens d’évolution à l’intérieur de la tumeur.

Le détective : l’algorithme cnp2cnp

Les modèles traditionnels de comparaison des cellules reposent sur l’hypothèse selon laquelle chaque gène subit des mutations indépendamment des autres. Or, des données scientifiques récentes montrent que les amplifications et suppressions peuvent avoir une incidence sur d’importants blocs de gènes. Les travaux en question proposent un nouveau modèle (une représentation mathématique du problème biologique), lequel prend en compte ces nouvelles données. L’enquête criminelle repose sur une question fondamentale : étant donné deux CNP, nommément une source et une cible, quel fil d’événements aurait pu permettre à la source de se transformer en la cible? De même, considérant que certains événements d’amplification ou de suppression sont plus probables que d’autres, est-il possible de dégager le fil d’événements qui représente le scénario le plus probable? Dans cet article, il a été démontré que pour résoudre ce problème, il faudrait faire des calculs qui sont trop difficiles, même pour les ordinateurs les plus sophistiqués. C’est ce que les informaticiens appellent un problème NP-difficile. Toutefois, les auteurs ont mis au point l’algorithme cnp2cnp. Il s’est avéré que ce nouvel algorithme permet d’obtenir des scénarios d’évolution très proches des valeurs optimales. Ce modèle a été comparé aux applications utilisées auparavant, notamment le MEDICC, qui prend en compte une forme restreinte d’amplification génique, et la distance euclidienne, qui prend seulement en compte les différences absolues entre les nombres de copies des gènes. Le modèle cnp2cnp se rapprochant davantage de la réalité biologique, il peut reconstituer les phylogénies d’une tumeur avec une exactitude égale ou supérieure.

Et la fin?

À mesure qu’il se développe, le tueur silencieux laisse derrière lui de précieuses pièces à conviction qui permettent de reconstituer et de comprendre son comportement. Par exemple, le CNP est un élément de preuve révélateur qui peut aider à déduire l’historique d’évolution d’une tumeur. Plus particulièrement, grâce à l’algorithme cnp2cnp, il est possible d’incorporer de nouvelles données biologiques utiles pour reconstituer les événements d’une manière qui colle davantage à la réalité. Grâce à l’adaptation des modèles actuels à des phénomènes plus complexes, on peut avoir un coup d’avance sur ce tueur silencieux et espérer un jour pouvoir enfin l’arrêter.

À propos de Alitzel López Sánchez
Alitzel López Sánchez est étudiante à la maîtrise en informatique avec un cheminement de recherche en bio-informatique au Département d'informatique de l'Université de Sherbrooke, sous la supervision du professeur Manuel Lafond. Ses intérêts de recherche consistent à comprendre les défis théoriques et algorithmiques des relations évolutives et leur impact sur la fonctionnalité des gènes. Elle est également membre fondatrice du Réseau mexicain de bio-informatique, une organisation à but non lucratif dont l'objectif est de rendre la bio-informatique accessible aux pays latino-américains.

À propos du concours
L’Université de Sherbrooke tient annuellement un concours de vulgarisation scientifique dont les objectifs sont de stimuler des vocations en vulgarisation scientifique et d’augmenter le rayonnement des travaux de recherche qui s’effectuent à l’Université, qu’ils soient de nature fondamentale ou appliquée.


Informations complémentaires