Prix de la meilleure thèse de doctorat
Un diplômé d'informatique de la Faculté des sciences honoré
Le Prix de la meilleure thèse de doctorat dans le secteur Sciences naturelles et génie a été décerné le 14 février dernier à M. Nizar Bouguila. Cette thèse a été réalisée dans le cadre du doctorat en informatique sous la direction du professeur Djemel Ziou.
Ce prix est un des trois prix qui soulignent le caractère exceptionnel d’une thèse de doctorat dans chacun des trois grands secteurs de la recherche et de la création, Sciences naturelles et Génie, Lettres et Sciences humaines et sociales, et Sciences de la santé. Il est offert conjointement par le vice-rectorat aux études supérieures et à la formation continue et le vice-rectorat à la recherche.
Intitulé de la thèse : Estimation et sélection non supervisées des mélanges basés sur la distribution de Dirichlet et applications.
Résumé vulgarisé de la thèse :
Notre société d’information et l’ensemble des activités scientifiques génèrent un flot de données composées de textes, d’images et de vidéos sans cesse plus nombreuses. Quelle méthode utiliser pour analyser cette masse d’informations? Comment retrouver parmi des millions d’images celles qui ont les mêmes couleurs, formes ou textures? Comment recouper les caractéristiques de chaque lieu, objet ou personne?
Les recherches de M. Bouguila se sont concentrées sur l’analyse des données visuelles qui composent en majorité cette masse d’informations.
Étonnamment, même si le traitement de ces données visuelles est un enjeu économique et technologique stratégique, les méthodes actuelles sont encore très limitées. D’une part, elles ne peuvent manipuler un grand nombre de dimensions. D’autre part, elles nécessitent l’application d’hypothèses simplificatrices, appelées lois normales, qui restreignent le type d’information traitée.
La thèse de M. Bouguila dresse un panorama critique des différents problèmes d’analyse et de modélisation des données numériques et apporte plusieurs solutions qui dépassent les limites des modèles existants.
Les solutions proposées par M. Bouguila sont basées sur le modèle Dirichlet Liouville. En raison de ses caractéristiques mathématiques et géométriques, ce modèle a permis de résoudre un problème bien connu sous le nom de « malédiction de la dimensionnalité », et de remédier aux inconvénients de la loi normale utilisée jusqu’à maintenant. Ainsi, l’approche retenue rend possible le traitement de banques de données de très grandes dimensions en intégrant les propriétés statistiques des données, l’utilisation des mélanges finis du modèle Dirichlet Liouville généralisé et la théorie de l’information. Enfin, les algorithmes de calcul développés permettent une mise à jour automatique de collections de données, ce qui confère une forme d’apprentissage au modèle.
Les retombées des travaux de M. Bouguila dépassent largement l’imagerie numérique. Les méthodes et les algorithmes développés pourront être intégrés à des moteurs de recherche textuelle (Google, Yahoo, etc.), et être utilisés en bioinformatique, en télécommunication, en sciences sociales et en économie.
M. Bouguila est maintenant professeur à l’Université Concordia.