Baccalauréat en sciences du multimédia et du jeu vidéo

Extraction de caractéristiques

Objectifs : extraire par des algorithmes appropriés, des caractéristiques plus simples et signifiantes comme les lignes, les contours, les régions, le mouvement, les routes, la peau, etc.

Une image vaut mille mots, mais ils ne sont pas tous pertinents. Pour une application se basant sur le contenu de l’image, il faut n’utiliser que des informations représentatives, résumant le contenu de l’image et pertinentes pour l’application. Le calcul de ces caractéristiques se fait sur une, ou plusieurs images, en se basant sur l’information contenue dans les pixels (intensité, couleur, fréquence, …).

Ces caractéristiques sont, par la suite, utilisées dans des applications :

  • reconstruction 3D;
  • reconnaissance d’objets :
  • suivi des objets dans une séquence vidéo;
  • recherche d’images basée sur les régions.

Vision par ordinateur

Objectifs : reconstituer une scène en trois dimensions à partir d'une ou de plusieurs images de cette scène.

Une image représente une projection, sur une surface, du monde 3D. Comme cette surface ne possède que deux dimensions, des renseignements essentiels sur la structure de la scène sont perdus.

Par exemple :

Deux objets paraissant côte à côte sur une image peuvent en fait être à des distances très différentes de la caméra au moment de la capture de l'image.

Certains indices visuels dans une image peuvent aider à reconstituer la scène originale :

  • nos connaissances sur la taille des objets;
  • l'éclairage;
  • les textures sur les objets;
  • le flou (mise au point ou mouvement);
  • les points de fuite (la perspective);
  • la variation de points de vue (même principe que la vision humaine binoculaire);
  • etc.

De plus, lorsque plusieurs images de la même scène sont captées en variant le point de vue de la caméra entre les clichés (par exemple la vision binoculaire), de l'information sur la structure de la scène est obtenue. La vision par ordinateur regroupe des techniques se servant, entre autres, de tous ces indices pour retrouver la scène 3D.

Rehaussement de la qualité

Objectifs : améliorer l'image, la séquence vidéo ou sonore esthétiquement, et rendre les méthodes d'extraction de caractéristiques ou de reconnaissance d'objets plus performantes.

Tout le monde a déjà expérimenté une mauvaise réception de la télévision, et ses images brouillées, noyées dans un signal parasite que l'on appelle "bruit". Tout le monde a eu l'expérience d'une photographie ratée, floue, surexposée ou sous-exposée, avec un cheveu, un doigt, etc.

L'amélioration de la qualité des images est basée sur la modélisation des dégradations. Si l'on peut caractériser celle-ci, on peut la repérer et essayer de la compenser.

Exemples d’applications :

  • réduire le bruit d'une image tout en gardant l'information utile;
  • améliorer le contraste de certaines zones de l'image pour la rendre plus lisible ou moins floue;
  • corriger l'illumination d'une photographie;
  • supprimer les ombrages;
  • réduire les artéfacts de compression;

Reconnaissance de formes

Objectif : faire le pont entre les caractéristiques extraites des images et la connaissance du monde que nous avons.

Un système est composé de plusieurs modules :

  • extraire des caractéristiques pertinentes à l’application;
  • trouver une représentation appropriée;
  • analyser et caractériser la forme par :
  • le périmètre;
  • l'élongation;
  • la courbure;
  • les points critiques d'une fonction;
  • etc.;
  • classifier ou rechercher des formes à l’aide des caractéristiques.
  • Exemples de domaines d’applications :
  • analyse de documents;
  • arts visuels;
  • internet;
  • médecine;
  • biologie;
  • physique;
  • industrie;
  • sécurité.