Aller au contenu

Transcrire des corpus linguistiques en temps réel comme à la télévision

Date :
Cet événement est passé.
Type :
Conférences et séminaires
Lieu :
A4-372, Faculté des lettres et sciences humaines, Campus principal + en ligne (sur Teams)

Description : Une conférence de Marimar Rufino Morales (Université de Montréal), organisée par le Centre de recherche interuniversitaire sur le français en usage au Québec (CRIFUQ).

Les progrès technologiques ont propulsé, au fil des dernières décennies, la méthodologie de préparation des corpus linguistiques et ont allégé les étapes de collecte et de stockage de matériel, d'alignement et d'annotation. En revanche, la transcription des entretiens qui font partie des corpus se produit toujours de façon manuelle, soit à l'aide d'un lecteur des enregistrements et d'un clavier. Et pourtant, dans plusieurs autres environnements, l’utilisation de logiciels de dictée automatique et de stratégies basées sur une collaboration humain-ordinateur aident à transcrire efficacement la langue parlée en temps réel. Dans le cadre de cette conférence, nous réfléchirons à la possibilité de recourir aux techniques de transcription vocale et de mise en exergue du sous-titrage en direct à la télévision pour optimiser la transcription d’entrevues. Cette réflexion se fait dans le cadre de la constitution d’un corpus destiné à l’étude de l’espagnol parlé dans la Région Métropolitaine de Montréal (COLEM).