Logo ÉTS
Session
Cours
Responsable(s) Patrick Cardinal

Se connecter
 

Sauvegarde réussie
Echec de sauvegarde
Avertissement


Préalables

Aucun préalable requis
 


Descriptif du cours

À la suite de ce cours, l’étudiant sera en mesure :

  • d’expliquer le fonctionnement des systèmes de communication vocale;
  • de choisir un système de communication vocale en fonction des besoins;
  • d’évaluer les systèmes de communication vocale.

Communication vocale par ordinateur. Modes de production et de perception de la parole. Fonctionnement des ordinateurs afin de compresser, encoder, synthétiser et reconnaître le signal de la parole. Techniques d’encodage (PCM, ADPCM, LPC, ACELP), de synthèse de la voix (Klatt, LPC, PSOLA) et de reconnaissance de la voix (HMM). Locuteur (GMM).






Objectifs du cours

Note: La description ci-dessus ne tient pas compte des modifications apportées récemment au cours. À partir de maintenant, le cours est divisé en deux parties: les systèmes de communications écrites et les systèmes de communications vocales.

Partie I - Communications écrites

  À partir des modules linguistique d’analyse du langage chez les humains, toutes les phases de conception d'un système de traitement automatique de textes écrits en langue naturelle  (TALN) seront explorées : de l’extraction de caractéristiques de complexité variée en passant par l’analyse de textes de styles et de qualité variés (tweet, textes cliniques, documentations officielles), jusqu’à l’utilisation d’algorithme d’apprentissage machine pour la réalisation de tâches. À la fin de cette partie, l'étudiant.e pourra :
  1- expliquer les différences entre une traitement fondée sur nos connaissances des langues naturelles (modèle linguistique) et l'utilisation de modèles statistiques ou probabilistes;
  2- déterminer les outils et les traitements nécessaires pour résoudre un problème d’analyse automatique de textes; 
  3- construire un schéma d’annotations et un protocole approprié et évaluer le temps requis pour construire le système;
  4- comparer des modèles puis évaluer et interpréter la qualité des résultats. 

Partie II- Communications vocales

À partir de la théorie de perception et de production de la parole chez les humains, toutes les phases de conception d'un système de communication vocale seront explorées, du traitement du signal jusqu'à l'utilisation d'algorithmes d'apprentissage. À la fin de ce cours, l'étudiant.e pourra :
1- expliquer le fonctionnement des systèmes de reconnaissance automatique de la parole;  filtrer le signal et extraire des caractéristiques du signal audio;
2- utiliser des techniques d'apprentissage probabiliste (modèle bayésien, modèle de Markov caché, mixture de gaussiennes, réseau de neurones) et les aura approfondies;
3- évaluer la performance des systèmes de reconnaissance de la parole.


Stratégies pédagogiques

Partie I (cours 1 à 6):
Les documents pertinents (articles, vidéocasts) doivent être consultés avant la séance de cours. Les vidéocasts de chaque cours sont divisés en petits modules de moins de 10 minutes, ce qui permet de facilement focaliser vos efforts. Des exercices hebdomadaires permettent aux étudiants.es de vérifier leur connaissances acquises.
Les 3,5 heures de cours se déroule en mode laboratoire interactif. Durant ces séances,  une brève revue du contenu est présenté et le laboratoire interactif permet de réaliser les exercices de la semaine. Un mini-projet termine cette partie.
Le cours 7 est dédié à la réalisation de l'examen intra.

Partie II (cours 8 à 13):
Les documents pertinents doivent être consultés avant la séance de cours. Le cours se déroule en mode standard. Des exercices permettent aux étudiants.es de vérifier leur connaissances acquises.





Coordonnées du personnel enseignant le cours

* Double-cliquez sur le champ pour modifier le contenu