Historique

Comme centre de recherche, le CRIFUQ poursuit les études linguistiques sur le français québécois qui ont été entreprises à l'Université de Sherbrooke dès le début des années 1970. Si ses activités actuelles sont principalement axées sur la description de cette variété de français, son histoire est profondément marquée par le développement de la Banque de données textuelles de Sherbrooke (BDTS).

Du corpus de l'Estrie à la Banque de données textuelles de Sherbrooke

En 1971, Normand Beauchemin et Pierre Martel entreprennent des recherches sur le français parlé dans la région de Sherbrooke. Au départ, les chercheurs visent principalement l'analyse lexicale du français en usage au Québec d'un point de vue sociolinguistique. Aussi un échantillon représentatif du français parlé en Estrie est constitué selon des principes statistiques fiables. Leur projet de recherche est subventionné par le Conseil des arts du Canada, l'actuel Conseil de recherches en sciences humaines (CRSH).

Six ans plus tard, soit en 1977, Normand Beauchemin commence la saisie en ASCII de 100 échantillons de textes libres, fruit de ces enquêtes sur le terrain estrien, créant ainsi le premier corpus de textes informatisés. Les travaux de l'équipe de recherche, à laquelle s'est ajouté Michel Théoret, s'orientent alors vers la publication du « Corpus de l'Estrie », premier corpus québécois constitué de transcriptions de langue orale, qui contient déjà plus de 360 000 occurrences. En 1979, l'équipe fait paraître le Vocabulaire fondamental du québécois parlé : index de fréquence.

À partir de ce moment, l'équipe de Sherbrooke travaille à développer sa « Banque de données textuelles » de façon à en accroître la représentativité par rapport à l'ensemble du français québécois parlé. Le corpus initial, duquel ont été prélevées deux tranches de 100 000 mots, s'enrichit ainsi d'échantillons recueillis dans les villes de Montréal et de Québec, de même que dans la région du Saguenay-Lac-Saint-Jean. Tous ces textes de langue orale spontanée sont alors regroupés pour constituer un sous-ensemble totalisant 500 000 mots, découpés selon cinq tranches égales.

À ce premier bloc se joint une deuxième partie d'un demi-million d'occurrences relevant cette fois de la langue parlée telle qu'elle est représentée dans divers types de textes publiés : monologues, pièces de théâtre, contes folkloriques, récits radiophoniques et téléromans. Ainsi, la Banque enregistre son premier million de mots... ce qui représente le corpus francophone le plus imposant de l'époque. Les travaux de statistique lexicale portant sur le contenu de ce corpus enrichi aboutissent à la publication en 1992 du Dictionnaire de fréquence des mots du français parlé au Québec.

Depuis, un souci constant de représenter le plus fidèlement possible la variété de français en usage au Québec a motivé un nouvel enrichissement de la BDTS. Grâce à des subventions ad hoc, elle s'est donc développée jusqu'à atteindre, en 2001, quelque 30 millions de mots. Par ailleurs, des besoins nouveaux ont commandé des corpus différents, ce qui a contribué à l'élargissement des informations stockées.

Regroupement autour de la description du français québécois

Au fil des ans, les objectifs initiaux se sont élargis, ce qui a favorisé le regroupement de tous les linguistes de Sherbrooke intéressés par la description du français québécois, tant dans sa dimension lexicale que grammaticale.

Dès 1988, un groupe de recherche est formé, qui obtient de l'Université de Sherbrooke la reconnaissance officielle comme « groupe d'excellence ». En plus des chercheurs de la première vague, cette équipe compte alors dans ses rangs Louis Painchaud et Jean-Marcel Léard, lequel s'intéresse principalement à la grammaire du français en usage au Québec. En 1989 est formé le Centre d’analyse et de traitement informatique du français québécois (CATIFQ). Les travaux de description du CATIFQ sont rapidement subventionnés par le Fonds pour la formation de chercheurs et l'aide à la recherche (FCAR).

La qualité des travaux poursuivis au CATIFQ sous la thématique commune de la description du français en usage au Québec (études d'éléments grammaticaux de l'oral québécois, recherches sociolinguistiques en Estrie, études de fréquence du vocabulaire québécois, constitution de la Banque de données textuelles de Sherbrooke, etc.) a rapidement été reconnue à l'échelle nationale et internationale. Elle a également contribué à attirer d'autres chercheures et chercheurs intéressés par la même thématique.

Au cours des vingt-cinq dernières années, le CATIFQ a accueilli plusieurs nouveaux membres : Hélène Cajolet-Laganière (1991), Louis Mercier (1994), Gaétane Dostie (1995), Marie-Thérèse Vinet (2000-2010), Céline Beaudet (2001-2009), Chantal-Édith Masson (2001-2015), Karine Collette (2005), Sophie Piron (2009) et Wim Remysen (2009). À cette équipe se sont joints, en 2015, six nouveaux chercheures et chercheurs : Geneviève Bernard Barbeau, Bruno Courbon, Marie-Hélène Côté, Marty Laforest, Kristin Reinke et Nadine Vincent.

L’arrivée de ces membres permet d’approfondir les thèmes de recherche privilégiés par le centre et ouvre en même temps de nouvelles perspectives dans la recherche sur le français québécois. Ainsi l’équipe peut compter sur une expertise solide dans des domaines variés des sciences du langage : compétences en aménagement linguistique (problématique de la norme), lexicologie et terminologie (vocabulaires spécialisés), lexicographie (théorie et pratique), sémantique et pragmatique, sociolinguistique et analyse de discours, linguistique interactionnelle, phonétique et phonologie, ou encore variation syntaxique. Pour mieux refléter la composition actuelle de l’équipe, et notamment son caractère interuniversitaire, le centre s’est récemment doté d’un nouveau nom, Centre de recherche interuniversitaire sur le français québécois (CRIFUQ).