Liaison, le journal de l'Université de Sherbrooke, 10 avril 2003

 

Recherche d’images sur Internet
Des logiciels développés à l’UdeS

CATHERINE LABRECQUE

La recherche d’images sur Internet connaît un avancement technologique important grâce à des logiciels de recherche d’images basée sur le contenu, développés à l’Université par le Consortium de recherche en image et multimédia (CoRIMedia). L’utilisation de ces logiciels peut notamment faciliter la détection d’images de pornographie juvénile.

Les recherches des professeurs Djemel Ziou et François Deschênes, du Département de mathématiques et informatique, dans le domaine de pointe de l’image et du multimédia, sont largement en avance sur les autres recherches menées dans le monde. De nombreux secteurs d’activités pourront bénéficier des logiciels développés, ouvrant la voie à une révolution dans la recherche d’images.

Une image vaut mille mots

Les logiciels de recherche d’information non textuelle donnent accès à de nouvelles possibilités de recherche d’images. La technologie actuelle ne rend possible que la recherche d’images à partir de mots, tandis que celle du Consortium permet de trouver des images à l’aide, non pas de mots, mais d’une autre image.

Les applications sont nombreuses. "Par exemple, afin de se documenter, les scientifiques pourront chercher des images de pathologies similaires à une pathologie qu’ils auront photographiée. Cela facilitera grandement leur travail puisque trouver ces mêmes images à partir de mots représenterait une tâche longue et ardue", souligne le fondateur de CoRIMedia, Djemel Ziou.

La technologie actuelle ne permet que d’effectuer des recherches textuelles d’images, c’est-à-dire que les moteurs de recherche se basent sur un terme identifié par l’usager pour trouver des images correspondantes. Toutes les images répertoriées dans les bases de données et dont le nom s’apparente au terme de la requête figurent dans le résultat de la recherche. Ainsi, un usager qui effectue une requête pour trouver des images de pingouins obtiendra en guise de résultat toutes les images nommées pingouins, même si elles ne représentent pas l’animal en question. La raison est simple : si quelqu’un a créé un site Internet et a donné le nom pingouin à une image, même si cela ne représente pas le contenu, cette image se retrouvera sur la liste des résultats.

Les logiciels de CoRIMedia pourraient être très utiles pour aider les autorités à détecter des sites Internet qui contreviennent aux lois en identifiant des images et, par le fait même, des sites qui contiennent une image semblable à celles recherchées. D’une façon générale, la technologie développée permet de mettre la main sur des images identifiées par un terme non significatif ou ne correspondant pas à celui de la requête. D’autres applications sont possibles dans des domaines variés comme la géomatique, la médecine et les médias.

Depuis sa création en 2001, CoRIMedia a développé plusieurs logiciels basés sur la technologie de recherche d’information non textuelle qui sont maintenant prêts à être commercialisés. L’entreprise se compose de 13 professeurs d’universités canadiennes, dont deux dirigent leurs recherches à l’Université de Sherbrooke.

Financées entre autres par le CRSNG, CANARIE, Valorisation-Québec et Patrimoine Canada, les recherches de CoRIMedia revêtent une importance stratégique dans un domaine de pointe. CoRIMedia est un consortium pour la recherche sur les bases de données d’images, de vidéos et de multimédia. Sa mission est d’accélérer l’émergence des technologies de la gestion du contenu non numérique et non textuel.

Djemel Ziou et François Deschênes, professeurs au Département de mathématiques et informatique.

Photo SSE : Jacques Beauchesne