L’intelligence artificielle au service de l’histoire. La transcription de manuscrits assistée par ordinateur
- Date :
- Jeudi 26 mars 2026
- Heure :
- De 12 h à 14 h
- Type :
- Conférences et séminaires
- Lieu :
- Salle K1- 4060, École de gestion, Campus principal
- Coût :
- Activité gratuite
Description :
Les professeurs Léon Robichaud et Maxime Gohier donneront une conférence suivie d’un atelier pratique sur la transcription des manuscrits à l’Université de Sherbrooke le 26 mars prochain. Le dîner sera fourni à toutes les personnes participantes inscrites avant le 24 mars 2026 (formulaire en ligne).
« L’intelligence artificielle au service de l’histoire. La transcription de manuscrits assistée par ordinateur »
La reconnaissance optique de caractères a permis d’offrir des millions d’ouvrages imprimés à la recherche et à l’analyse. Les millions de pages de manuscrits conservés dans les archives résistaient toutefois à cette technologie. La transcription des manuscrits reposait donc sur les efforts de gens travaillant seuls ou en équipe. À ce rythme, seuls les écrits de personnages majeurs de l’histoire (Voltaire, Jefferson, et autres), les collections d’intérêt pour les généalogistes (état civil) et celles pouvant susciter un certain engouement (tribunal Old Bailey) pouvaient être transcrits et offerts plus largement. La reconnaissance des écritures manuscrites (handwritten text recognition) est venue changer la donne. À partir d’un échantillon de 50 à 200 pages, il est maintenant possible d’entraîner des modèles performants pouvant atteindre des taux d’erreur de 2 à 7 %. Dans le cadre de cette conférence, nous présentons les principes de base et la chaîne de traitement d’un projet HTR. Bien que centrée sur la plateforme Transkribus (utilisée dans le cadre du projet Nouvelle-France numérique), la conférence traitera aussi d’autres outils permettant de transcrire les manuscrits, tels que eScriptorium, Loghi, et des applications d’IA commerciales. Nous explorerons aussi le potentiel des jeux de données qui en découlent pour la recherche : histoire politique, sociale, économique et culturelle ; histoire de la langue française ; traitement du langage, etc. Nous verrons enfin comment de telles transcriptions aideront à élargir la recherche en désinvisibilisant des groupes marginalisés par l’indexation traditionnelle des archives ou en facilitant la recherche d’éléments mentionnés brièvement dans des milliers de documents répartis dans des collections diverses et ainsi contribuer à renouveler les interprétations de l’histoire.
Titre de l’atelier : « Transcrire les manuscrits »
La première partie de l’atelier permettra aux participantes et aux participants de s’initier à l’utilisation de Transkribus : analyse des images des manuscrits numérisés, présentation de l’interface de l’application, téléversement des documents, choix d’un modèle de transcription, segmentation et transcription, correction. Pendant la seconde partie, nous pourrons traiter des documents numérisés apportés par les participants et par les participantes (ou de nouveaux documents que prévoit traiter l’équipe de Nouvelle-France numérique) afin de voir comment gérer les imprévus qui se produisent lorsqu’on se lance dans une nouvelle collection. Apportez vos ordinateurs portables et vos images de documents manuscrits.
« L’intelligence artificielle au service de l’histoire. La transcription de manuscrits assistée par ordinateur »
La reconnaissance optique de caractères a permis d’offrir des millions d’ouvrages imprimés à la recherche et à l’analyse. Les millions de pages de manuscrits conservés dans les archives résistaient toutefois à cette technologie. La transcription des manuscrits reposait donc sur les efforts de gens travaillant seuls ou en équipe. À ce rythme, seuls les écrits de personnages majeurs de l’histoire (Voltaire, Jefferson, et autres), les collections d’intérêt pour les généalogistes (état civil) et celles pouvant susciter un certain engouement (tribunal Old Bailey) pouvaient être transcrits et offerts plus largement. La reconnaissance des écritures manuscrites (handwritten text recognition) est venue changer la donne. À partir d’un échantillon de 50 à 200 pages, il est maintenant possible d’entraîner des modèles performants pouvant atteindre des taux d’erreur de 2 à 7 %. Dans le cadre de cette conférence, nous présentons les principes de base et la chaîne de traitement d’un projet HTR. Bien que centrée sur la plateforme Transkribus (utilisée dans le cadre du projet Nouvelle-France numérique), la conférence traitera aussi d’autres outils permettant de transcrire les manuscrits, tels que eScriptorium, Loghi, et des applications d’IA commerciales. Nous explorerons aussi le potentiel des jeux de données qui en découlent pour la recherche : histoire politique, sociale, économique et culturelle ; histoire de la langue française ; traitement du langage, etc. Nous verrons enfin comment de telles transcriptions aideront à élargir la recherche en désinvisibilisant des groupes marginalisés par l’indexation traditionnelle des archives ou en facilitant la recherche d’éléments mentionnés brièvement dans des milliers de documents répartis dans des collections diverses et ainsi contribuer à renouveler les interprétations de l’histoire.
Titre de l’atelier : « Transcrire les manuscrits »
La première partie de l’atelier permettra aux participantes et aux participants de s’initier à l’utilisation de Transkribus : analyse des images des manuscrits numérisés, présentation de l’interface de l’application, téléversement des documents, choix d’un modèle de transcription, segmentation et transcription, correction. Pendant la seconde partie, nous pourrons traiter des documents numérisés apportés par les participants et par les participantes (ou de nouveaux documents que prévoit traiter l’équipe de Nouvelle-France numérique) afin de voir comment gérer les imprévus qui se produisent lorsqu’on se lance dans une nouvelle collection. Apportez vos ordinateurs portables et vos images de documents manuscrits.