Les départements de français et de linguistique sont ravis d'annoncer un nouveau cours qui sera offert à partir de l'année universitaire 2025-2026 :
JFL484H1, Outils informatiques pour les corpus linguistiques.
Ce cours offrira aux étudiants et étudiantes une introduction pratique à la construction de corpus numériques ainsi qu'aux outils de la linguistique computationnelle. À l'issue du cours, les étudiants auront une meilleure compréhension des fondamentaux de l'intelligence artificielle et de l'apprentissage automatique appliqués aux textes, ainsi que des compétences pratiques pour travailler avec des données issues de corpus linguistiques. Les étudiants doivent avoir des bases en programmation. Pour l'année universitaire 2025-2026, le cours sera offert durant le semestre d'hiver afin de permettre aux étudiants intéressés de s'assurer qu'ils remplissent les prérequis.
JFL484H1 est un cours pratique portant sur les collections numériques de langue écrite ou de langue orale transcrite (corpus). Il abordera à la fois les étapes pratiques de la construction de corpus textuels numériques (normalisation des textes, numérisation, élaboration de jeux d’étiquettes, etc.) et offrira une compréhension et une expérience pratique des techniques fondamentales de la linguistique computationnelle et du traitement automatique des langues, y compris les méthodes utilisant l’apprentissage automatique, telles que l’étiquetage morphosyntaxique, les modèles de langue et la sémantique vectorielle. En travaillant sur des corpus réels, les étudiants utiliseront ces techniques pour formuler et défendre des hypothèses sur les textes, les langues et le langage humain en général. Une attention particulière sera accordée aux corpus en français issus de différentes périodes (y compris le français médiéval et moderne) afin d’inscrire le français dans une perspective historique et dans le contexte canadien. Les étudiants auront également l’occasion de travailler avec d’autres langues. Les LEC seront dispensés en anglais, et les étudiants suivront des TUT en anglais ou en français.
Les prérequis sont une introduction à la linguistique (FRE272H1/ SPA322H1/ (LIN101H1, LIN102H1)/ LIN200H1) et une introduction à la programmation informatique (ENG286H1/ CSC108H1/ LIN240H5/ LINB19H3).
---
Ewan Dunbar
Department of French (Computational Linguistics, French Linguistics)
Office: Carr Hall 321