Critères et licences
Lors de la sélection d'un dépôt de données, il est utile de se poser trois ensembles de questions clés.
Ces questions permettront de s'assurer que le dépôt choisi répond aux exigences spécifiques de la recherche, tout en facilitant l'accessibilité, la préservation et la réutilisation des données dans le respect des bonnes pratiques.
Critères à prendre en compte pour le choix d'un dépôt
- Recommandation ou obligation d'un dépôt spécifique (par l'éditeur, par exemple)?
- Dépôts disciplinaires incontournables?
- Lieu de dépôt? (Canada, idéalement)
- Propriété des données, sécurité, accès, lois qui s'appliquent?
- Restrictions sur la provenance des données?
- Coûts pour déposer?
- Langues de description permise?
- Statistiques de consultation et téléchargement?
- Gestion des rôles = autorisations de l'équipe de recherche pour l'administration des données?
- Éditer, publier?
- Consulter?
- Degré de concordance aux principes FAIR?
- Type / format données?
- CSV, TXT, GPS, PNG
- Dépôts généralistes = plus ouverts
- Dépôts disciplinaires = plus restrictifs
- Taille des fichiers de données, limites pour un ensemble de données?
- Besoin de fonctionnalités de versionnage?
- Quelle licence veut-on utiliser? Est-elle imposée? (Souvent Creative Commons)
- Le dépôt permet-il un embargo?
- Peut-il restreindre l'accès aux données? (Notamment pour raisons éthiques)
- La personne chercheuse veut-elle que le dépôt offre un identifiant pérenne? Pour publication des données (DOI sur la page Web de l'article)
- Métadonnées : schémas de métadonnées très spécifiques permettant partage et réutilisation?
Principes FAIR
Le choix d'un dépôt peut aussi être guidé par les principes FAIR (Findability, Accessibility, Interoperability, and Reuse of digital assets). Ces principes ont pour objectif d'améliorer la capacité des machines (ordinateurs) à trouver et à accéder aux données afin qu'elles puissent être réutilisées par la communauté scientifique. Voici une brève description des quatre principes :
- Faciles à trouver (être découvrables) : les données sont assorties d’un identifiant persistent et unique, elles sont décrites au moyen de métadonnées riches et elles sont enregistrées et indexées dans une ressource recherchable.
- Accessibles : les données sont repérables par leur identifiant au moyen d’un protocole de communication normalisé, ouvert, gratuit et universel. Les métadonnées sont accessibles, même quand les données ne le sont plus.
- Interopérables : les métadonnées utilisent un langage formel, accessible, partagé et utilisent des vocabulaires qui adhèrent aux principes FAIR.
- Réutilisables : les données sont diffusées selon une licence d’utilisation claire et accessible. Les données sont associées à leur provenance.
Licences
Les licences définissent les conditions d'utilisation des données par des tiers, permettant ainsi de clarifier ce qui est permis ou non. En choisissant celle qui correspond le mieux à vos objectifs, vous pourrez exprimer clairement vos intentions tout en respectant les exigences des organismes subventionnaires, des revues et des dépôts de données avec lesquels vous collaborez. Opter pour une licence qui favorise une réutilisation large de vos données augmentera leur utilisation par d'autres équipes et, par conséquent, leur visibilité.
Il est à noter que seulement les titulaires des droits de propriété intellectuelle peuvent émettre une licence, il est donc essentiel de préciser à qui appartiennent ces droits.
Il existe plusieurs types de licences standards mises à la disposition des personnes chercheuses. Pour la plupart des ensembles de données, il est plus facile d'utiliser une licence standard plutôt que de concevoir une licence personnalisée. Veuillez noter que même si vous choisissez de rendre vos données publiques, il est préférable de l'indiquer de manière explicite en utilisant une licence telle que CC0 de Creative Commons.
Certains dépôts exigent que les données et/ou métadonnées soient rendues publiques sous une licence Creative Commons permettant la réutilisation. Si c'est le cas, assurez-vous que la publication des données n'enfreint aucune loi ou condition contractuelle.
Informations complémentaires
- Exigences de la certification CoreTrustSeal en matière de dépôts de données fiables (CoreTrustSeal Standards and Certification Board; traduction par le Réseau Portage, avec le soutien de l'Association des bibliothèques de recherche du Canada et de la Nouvelle organisation de l'infrastructure de recherche numérique (NOIRN) du Canada)
- Where to keep research data : Version 1.1 of the DCC checklist for evaluating data repositories
- Webinaire GT-GDR BCI : Introduction au choix d'un dépôt de données de recherche (Université Concordia)
- Licences Creative Commons
- Licences Open Data Commons
- Licence ouverte / open licence d'Etalab
- Licences pour des logiciels : GNU
- Pour en savoir plus sur les licences d'exploitation des données, veuillez consulter le UK Digital Curation Centre.