Note: La description ci-dessus ne tient pas compte des modifications apportées récemment au cours. À partir de maintenant, le cours est divisé en deux parties: les systèmes de communications écrites et les systèmes de communications vocales.
Partie I - Communications écrites
À partir des modules linguistique d’analyse du langage chez les humains, toutes les phases de conception d'un système de traitement automatique de textes écrits en langue naturelle (TALN) seront explorées : de l’extraction de caractéristiques de complexité variée en passant par l’analyse de textes de styles et de qualité variés (tweet, textes cliniques, documentations officielles), jusqu’à l’utilisation d’algorithme d’apprentissage machine pour la réalisation de tâches. À la fin de cette partie, l'étudiant.e pourra :
1- expliquer les différences entre une traitement fondée sur nos connaissances des langues naturelles (modèle linguistique) et l'utilisation de modèles statistiques ou probabilistes;
2- déterminer les outils et les traitements nécessaires pour résoudre un problème d’analyse automatique de textes;
3- construire un schéma d’annotations et un protocole approprié et évaluer le temps requis pour construire le système;
4- comparer des modèles puis évaluer et interpréter la qualité des résultats.
Partie II- Communications vocales
À partir de la théorie de perception et de production de la parole chez les humains, toutes les phases de conception d'un système de communication vocale seront explorées, du traitement du signal jusqu'à l'utilisation d'algorithmes d'apprentissage. À la fin de ce cours, l'étudiant.e pourra :
1- expliquer le fonctionnement des systèmes de reconnaissance automatique de la parole; filtrer le signal et extraire des caractéristiques du signal audio;
2- utiliser des techniques d'apprentissage probabiliste (modèle bayésien, modèle de Markov caché, mixture de gaussiennes, réseau de neurones) et les aura approfondies;
3- évaluer la performance des systèmes de reconnaissance de la parole.