Aller au contenu

Originalité et intérêt de la BDTS

Sa structure

La BDTS est constituée d'une série de sous-ensembles qui donnent accès aux différents registres de la langue, notamment au registre standard, actuellement en usage au Québec, et ce, tant en langue générale qu'en langue plus spécialisée. Elle permet en outre des études selon les situations de communication, les domaines d'activités, etc. Par sa taille relativement modeste, la BDTS permet une exploitation plus efficace des données lexicales du français en usage au Québec.

Son contenu et la représentativité de ses textes

La BDTS est un corpus informatisé et indexé de quelque trente millions de mots; elle est constituée de textes représentatifs des différents usages du français québécois. Il ne s'agit pas d'une représentativité au sens statistique du terme : la notion de représentativité de la BDTS doit plutôt être associée à la variété des textes qui la composent et qui reflètent la langue générale (orale et écrite) de même que la langue littéraire, journalistique et relativement plus spécialisée utilisée au Québec dans différentes situations de communication. La ventilation des pourcentages associés aux diverses catégories de textes correspond à l'objectif visé : avoir accès aux différents registres de langue, notamment le niveau standard, actuellement en usage au Québec.