Définitions des microdonnées et des données agrégées*

Nature des données numériques

Les données numériques se situent au coeur du processus d'information. Elles représentent des mesures (observations) d'attributs ou de variables de nature sociale ou économique. Peu importe le sujet, les données numériques jouent un rôle important dans la compréhension de ce qui nous entoure. L'emploi, la santé, l'administration et l'économique sont des exemples de domaines qui se servent de données numériques.

La recherche et l'enseignement universitaire sont aussi des secteurs d'activités qui nécessitent l'utilisation de ce type de données. Par le passé, il était souvent difficile d'accéder aux données de Statistique Canada, ce qui n'est plus le cas pour une partie de leurs données. En effet, le programme de l'IDD facilite aujourd'hui le partage de ce type de données pour la communauté universitaire canadienne.

Il existe deux types de données numériques que Statistique Canada offre aux universités : les microdonnées et les données agrégées. Voir ce qui suit pour une brève définition de ces deux types.


Microdonnées

Les microdonnées ou données brutes sont des résultats immédiats d'observations de variables statistiques qui n'ont pas été traités au niveau statistique.  À titre d'exemple, on peut dire que les réponses à l'Enquête nationale sur la santé de la population sont des microdonnées. Le traitement de ce type de données nécessite une bonne connaissance de la statistique et des outils correspondants (logiciel SPSS, logiciel SAS, etc.). Les enquêtes offertes par Statistique Canada sont accompagnées de documents descriptifs qu'il faut absolument consulter avant de se lancer dans le traitement comme tel.

N.B. Le Service des bibliothèques et archives a pour mandat de favoriser l'accès aux microdonnées pour la communauté universitaires, mais n'aide pas au traitement de ces données.


Données agrégées

Contrairement aux microdonnées, les données agrégées sont mises à la disponibilité des usagers après qu'elles aient été traitées au niveau statistique. En effet, les données agrégées sont constituées à partir d'un fichier de microdonnées et sont le résultat d'une combinaison de différentes mesures. On les obtient en faisant une addition ou une moyenne des valeurs individuelles obtenues. Elles permettent d'obtenir de l'information sur des groupes qui ont des caractéristiques communes. On peut agréger par lieux géographiques, par caractéristiques ou par temps. À titre d'exemple, mentionnons que la banque CANSIM est une source de données agrégées.

Pour accéder à ce type de données, il faut consulter la page Statistiques par thèmes.


*Source d'une partie des informations données sur cette page :

Documentation de l'atelier « Les données numériques : atelier d'information (et de démystification) » donné par le Groupe de travail sur les fichiers de données numériques du Sous-comité des bibliothèques de la Conférence des recteurs et des principaux des universités du Québec (CREPUQ) le 6 février 1998.