Aller au contenu

Prédiction des gènes eucaryotes : des modèles de Markov cachés à l’apprentissage automatique.Présenté par Abigail Djossou

Date :
Mercredi 22 avril 2026
Heure :
À 9 h 
Type :
Soutenance de thèse
Public :
Bienvenue à toutes et à tous
Lieu :
À distance

Description :

La prédiction des gènes dans les génomes eucaryotes demeure une tâche complexe. Malgré les progrès considérables du séquençage à haut débit et le développement d’outils bioinformatiques de plus en plus sophistiqués, l’organisation intrinsèquement fragmentée des gènes eucaryotes et en particulier, l’épissage alternatif constituent des obstacles majeurs à une annotation fiable. En permettant à un même gène de produire plusieurs transcrits distincts, l’épissage alternatif remet en cause une vision simple et linéaire du gène et complique fortement l’identification précise des régions codantes et non codantes. Cette thèse vise à évaluer et à comparer différentes approches pour la prédiction des gènes eucaryotes, en accordant une attention particulière à la distinction entre exons constitutifs, exons alternatifs et introns.

Deux axes méthodologiques complémentaires sont explorés : les modèles probabilistes explicites, fondés sur les modèles de Markov cachés, et les méthodes d’apprentissage automatique supervisé. Les résultats obtenus montrent que les modèles de Markov cachés, même adaptés pour intégrer des états correspondant aux exons alternatifs, peinent à distinguer correctement les différents types d’exons. Ces limitations réduisent leur capacité à reconstruire fidèlement la structure complète des gènes, en particulier lorsque l’épissage est fortement variable. En revanche, les méthodes d’apprentissage automatique, notamment le perceptron multicouches utilisant des représentations en k-mères, offrent de meilleures performances pour cette tâche de classification, y compris sur des jeux de données complexes. Ce travail souligne l’importance de combiner une compréhension fine de la biologie des gènes avec des méthodes d’analyse modernes afin d’améliorer la fiabilité des annotations génomiques et d’ouvrir de nouvelles perspectives pour la recherche en génomique.

Membres du jury :
Directrice : Aïda Ouangraoua, professeure au Département informatique
Président-rapporteur : Manuel Lafond, professeur au Département informatique
Évaluateur interne : Michelle Scott professeure au Département de biochimie et de génomique fonctionnelle
Évaluateur externe : Abdoulaye Baniré Diallo au Département informatique (UQAM)