Aller au contenu

Chaire de recherche du Canada en complexité biologique et informatique

Voir l’histoire de nos gènes

L'informaticienne Aïda Ouangraoua.
L'informaticienne Aïda Ouangraoua.
Photo : Michel Caron

Malgré des décennies de recherche, la majeure partie de l’information génétique qui nous constitue reste mal comprise.  Loin des laboratoires de biologie, l’informaticienne Aïda Ouangraoua arrive pourtant à voir des secrets complexes, bien gardés dans le creux de notre ADN.

Elle a fait toutes ses études en informatique, elle n’est pas biologiste. Pourtant, Aïda Ouangraoua peut vous expliquer les processus biologiques impliqués dans l’expression des gènes avec une aisance confondante. «Chaque humain a environ 25 000 gènes codant pour des protéines; ils contiennent le matériel pour la production des protéines, qui elles jouent un rôle indispensable dans le fonctionnement de nos cellules. Mais ces 25 000 gènes représentent  à peine 2% du génome. Par quels mécanismes arrivent-ils à diversifier leur production de protéines ? Et à quoi servent donc toutes les autres séquences d’ADN dites non-codantes ? Nous en avons identifiées quelques-unes et nous savons désormais qu’elles ont des fonctions  de régulation et de contrôle, mais on ignore pour la plupart lesquelles.»

Identifier les séquences fonctionnelles et mettre en évidence leurs structures et leurs rôles possibles est une entreprise titanesque à laquelle s’attèlent des milliers de laboratoires de par le monde. Ce chantier, qui plus est, requiert la collaboration de plusieurs disciplines. Aïda Ouangraoua, titulaire de la Chaire de recherche du Canada en complexité biologique et informatique, invente des méthodes algorithmiques et mathématiques qui permettent de comparer et déchiffrer les architectures de millions de séquences génomiques. La biologie computationnelle – sa discipline- se situe au croisement de l’informatique, des mathématiques et de la biologie.

Les travaux de son équipe visent à mieux comprendre les mécanismes qui orientent l’évolution et la variabilité des espèces et des individus, d’un point de vue génétique. En faisant la lumière sur les mécanismes biologiques impliqués dans l’évolution et le contrôle de l’expression des gènes, ils pourraient même contribuer à identifier de nouvelles cibles thérapeutiques pour traiter certaines maladies génétiques.

Points de vue différents sur le génome

En 2013, l’équipe du biochimiste Xavier Roucou, de l’UdeS, faisait une découverte qui  a eu l’effet d’une bombe. Après avoir scruté tout le génome humain, le groupe a fait tomber le dogme selon lequel chaque gène correspond à une protéine. Selon les données qu’ils ont récoltées, chaque ARN messager code 3,8 protéines, en moyenne, plutôt qu’une seule, comme cela était admis jusqu’ici. La percée, qui oblige à revoir des notions fondamentales de biologie, a causé de grands remous dans la communauté scientifique. Depuis, les travaux du Roucoulab se consacrent entièrement à l’identification des fonctions de ces protéines alternatives. Et pour l’aider à y voir plus clair, Xavier Roucou s’est adressé à Aïda et son équipe.

«Nos projets de recherche, effectivement, débutent toujours par une question, un problème biologique. Dans le cas de Xavier, nous voulons savoir quel est le modèle d’évolution qui a conduit au protéome alternatif observé dans les espèces actuelles. Diffère-t-il du modèle d’évolution des gènes qui contiennent ces protéines alternatives ? Pour répondre à ce type de question, nous procédons par comparaison du matériel qui nous est fourni, en cherchant d’abord ce qui est commun et ce qui est spécifique.»

Alors que les techniques d’analyse traditionnelles se concentrent essentiellement sur les séquences elles-mêmes, l’approche adoptée par Aïda Ouangraoua s’intéresse plutôt à leur look, à la manière dont elles sont structurées. Le problème soumis est d’abord traduit dans un modèle qui sera enrichi au fur et à mesure de l’avancement des recherches. Une fois perfectionné, le modèle sera transposé en algorithme qui pourra être traité par ordinateurs, et appliqué à de grandes quantités de données biologiques.

Les algorithmes conçus ainsi permettent de voir, de comparer puis de classifier des séquences biologiques en tenant compte de la complexité de leurs architectures. Ces outils informatiques considèrent également les processus biologiques sous-jacents qui influencent ces architectures. «Ces processus biologiques qui modifient les séquences, les structures et l’organisation des composantes du génome forment une machinerie extrêmement complexe et diversifiée, ce qui pose un défi considérable et stimulant pour des informaticiens, souligne Aïda Ouangraoua. Et le défi va en augmentant puisque la masse de données à investiguer et à interpréter est en perpétuelle croissance.» La puissance calculatoire, ici, est un élément critique, c’est pourquoi l’équipe de la chaire opère à l’aide de Mammouth, le superordinateur de l’UdeS parmi les plus puissants au Canada.

Les outils développés par la Chaire de recherche du Canada en complexité biologique et informatique permettent de visualiser, littéralement, l’évolution de l’architecture des séquences biologiques et le rôle des facteurs impliqués dans la modification de l’architecture et des dysfonctionnements dans nos gènes. Plus encore, l’approche développée par Aïda Ouangraoua fournit un éclairage complémentaire aux méthodes conventionnelles privilégiées jusqu’ici au cours des 50 dernières années de recherche en génomique. Aux yeux de l’informaticienne fascinée par les questions de phylogénie, les modèles et algorithmes basés sur l’architecture contribueront certainement à atteindre l’un des plus grands objectifs de la génomique comparative, qui est de mieux comprendre le rôle de la structure dans le fonctionnement et l’évolution des gènes et des génomes qui peuplent la planète.


Informations complémentaires