Aller au contenu

L'UdeS contribue aux succès d'un regroupement international sur l'épigénomique

Matrice de corrélation de plus de 2 500 ensembles de données épigénétiques du IHEC alignées sur le génome de référence humain hg38.
Matrice de corrélation de plus de 2 500 ensembles de données épigénétiques du IHEC alignées sur le génome de référence humain hg38.
Photo : Fournie par Pr Jacques

Un des grands mystères de la biologie est de comprendre comment les différents types cellulaires qui composent notre corps proviennent d’une seule cellule et d’une seule séquence d’ADN, notre génome. Nous avons appris beaucoup de l’étude du génome humain, mais n’avons que partiellement dévoilé les processus sous-jacents à la détermination cellulaire.

L’identité de chaque type cellulaire est largement définie par une couche instructive d’annotations moléculaires sur le génome – l’épigénome – qui agit en tant que plan unique à chaque type cellulaire et à chaque étape de développement. Contrairement au génome, l’épigénome se modifie pendant que les cellules se développent ainsi que lorsqu’elles subissent des changements environnementaux. Des anomalies dans les facteurs qui lisent, écrivent et suppriment les plans épigénétiques sont impliquées dans plusieurs maladies. L’analyse exhaustive de l’épigénome de cellules saines et de cellules anormales facilitera de nouvelles façons de diagnostiquer et de traiter plusieurs maladies et, ultimement, d’améliorer la santé globale des individus.

Une collection de 41 articles coordonnés a été publiée la semaine dernière par des chercheurs de l’International Human Epigenome Consortium (IHEC), permettant de faire avancer la recherche en épigénomique d’un grand pas. De ce lot, 24 manuscrits ont été publiés dans le journal Cell et autres journaux associés de la maison d’édition Cell-Press, les 17 autres l’ayant été dans d’autres journaux scientifiques à facteur d’impact élevé.

Ces publications représentent les plus récents travaux de membres de l’IHEC provenant du Canada, de l’Union européenne, de l’Allemagne, de Singapour et des États-Unis. Cette collection de publications met en valeur les réalisations et les avancées scientifiques effectuées par l’IHEC dans des secteurs d’importance de la recherche en épigénétique.

Pour réussir à percer les mystères de l’épigénome, les chercheurs de l’IHEC ont généré plus de 10 000 ensembles de données permettant de caractériser différents aspects épigénétiques dans plus de 600 tissus humains. Le portail colligeant toutes ces données et utilisé par les scientifiques est hébergé ici même au Campus principal de l’Université de Sherbrooke. Il a été, principalement développé par les groupes des professeurs Guillaume Bourque de l’Université McGill et Pierre-Étienne Jacques du Département de biologie, directeur scientifique du Centre de calcul scientifique (CCS) de l’Université de Sherbrooke et chercheur au Centre de recherche du CHUS (CRCHUS).

« Héberger cette très importante quantité de données est, pour nous qui développons des outils d'analyses bio-informatiques, une chance inouïe, commente le professeur Pierre-Étienne Jacques. Non seulement nous utilisons les données du portail pour nos recherches, mais il s’agit en plus d’une vitrine incroyable pour les outils développés par mon groupe. » Un des outils du groupe, nommé GeEC (Genomic Efficient Correlator) encore en développement, a d’ailleurs été utilisé lors d’une collaboration avec un groupe du Royaume-Uni.

L'infrastructure informatique hébergeant les données et permettant de desservir la communauté scientifique internationale est intégrée au superordinateur Mammouth de l'UdeS, le plus puissant de la flotte actuelle des superordinateurs de Calcul Canada avec ses près de 40 000 cœurs de calculs et 14 Peta octets d’espace disque (donc approximativement 14 millions de giga-octets). Il est à noter que plusieurs employés du CCS, qui gère Mammouth, ont eu une participation très importante dans le projet du portail de données du IHEC.

« Que les grands consortia comme le IHEC respectent les traités internationaux spécifiant que les données générées par des fonds publics doivent être rapidement rendues accessibles à la communauté scientifique est d’une grande importance en recherche », conclut le professeur Jacques.


Informations complémentaires